嗅谱网

网络信息

  • 数学应用-谈谈中文分词

    数学应用-谈谈中文分词

    发表者: 吴军, Google 研究员 谈谈中文分词 —– 统计语言模型在中文处理中的一个应用 上回我们谈到 利用统计语言模型进行语言处理 ,由于模型是建立在词的基础上 的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀 到美国与太空总署官员开会。” 分成一串词: 中国 / 航天 / 官员 / 应邀 / 到 / 美国 / 与 / 太空 / 总署 / 官员 / 开 会。 最容易想到的,也是最简单的分词办法就是查字典。这种方法最早是由北京航天 航空大学的梁南元教授提出的。 用 “查字典” 法,其实就是我们把一个句子从左向右扫描一遍,遇到字典里有 的词就 ...

    查看全文

  • 数学应用-统计语言模型

    数学应用-统计语言模型

    发表者: 吴军, Google 研究员 前言 也 许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常 清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工 具解决一 个语言问题时,总会感叹数学之美。我们希望利用 Google 中文黑板 报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google 产品的。 系列一: 统计语言模型 (Statistical Language Models) Google 的使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、 语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语 言、 ...

    查看全文

  • 中日韩民众态度:中日彼此最不待见,中韩稍好

    中日韩民众态度:中日彼此最不待见,中韩稍好

    近日,有日本和韩国媒体发布联合调查,结果显示日韩两国民众相互不信任的情况再次加深。事实上,中日韩东亚三国民众各自对另外两个国家的态度一直错综复杂。2005年起,英国广播公司BBC联合舆论调查机构GlobeScan和PIPA每年都会发布《国家评分民调》,调查各国民众如何看待各国在世界的影响。2010年开始,中日韩三国全部囊括在内(此前没有单独调查韩国)。 根据2010年至2014年这五年的数据,总体上看,三国民众看待对方国家的态度主要以负面为主,且这一趋势不断扩大,其中,中日两国相互态度负面程度最深,日韩次之,中韩稍好,中国民众对韩国的态度甚至偏正面。 根据该调查,中国民众对日本的态度一直 ...

    查看全文

  • 目睹妻子被强暴“无限防卫权”很无奈

    目睹妻子被强暴“无限防卫权”很无奈

    目睹妻子被强暴,“无限防卫权”很无奈 60秒读懂专题:虽然中国刑法第20条第3款有“无限防卫权”条款的称谓,其实这种权利在实践中限制多多:办案人员除非防卫人自遭重伤、重残否则基本不认;歹徒侵入私宅不算特定暴力犯罪开始,暴行一中断就算“犯罪行为终止”,在此期间杀伤歹徒不能算是“无过当防卫”;撞破暴力械劫、强奸或可实施“无过当防卫”,撞破迷奸、麻醉抢劫就不行。 导语:近日“温州男子目睹妻子遭强暴,砍死施暴者被判无期”的消息引起公众哗然。但这种判决在中国司法实践中并不少见,而且是有法条支撑的。 按学者记录和新闻报道,中国司法机关从1999年至今,在办案时极少认可“无限防卫权”,除非防卫人自遭重伤 ...

    查看全文

  • 美式竞选:父子齐上阵,全家总动员

    美式竞选:父子齐上阵,全家总动员

    人才济济的布什一家:从政、经商、做慈善,一个不落 美国时间6月15日,前福罗里达州州长杰布·布什正式宣布参加2016年美国总统选举。杰布·布什现年62岁,是美国第41任总统乔治·布什(老布什)的儿子、第43任总统乔治·W·布什(小布什)的弟弟。如果竞选成功,他将成为布什家族走出的第三位总统,也会令布什家族成为美国历史上诞生总统最多的家族。 与一般的政治世家类似,布什家族也是先经商后从政,从杰布·布什的祖父普雷斯科特·布什开始,正式书写发迹史。普雷斯科特与金融巨鳄沃克家族联姻,二战时迅速积累财富,后成为参议员。其儿子老布什先是开公司成为了石油大亨,后“贾而优则仕”,进军政坛。老布什的两 ...

    查看全文

  • 美国打击ISIS:一年花27亿,破坏目标超6000

    美国打击ISIS:一年花27亿,破坏目标超6000

    极端组织伊拉克和黎凡特伊斯兰国(ISIS)(以下简称:伊斯兰国)持续肆虐中东地区,美国联手同盟国家一直致力于军事打击伊斯兰国。美国将这场军事干预称之为“坚决行动”,并为此耗资不菲。 今年6月,美国国防部公布了美国过去一年在打击伊斯兰国方面花费的资金。从2014年8月8日到2015年5月21日,美国在打击伊斯兰国上花费了27.44亿美元,平均每天花费910万美元。 根据数据,美国打击伊斯兰国的主要手段是空袭。几大军种中,主要依靠空军作战,空军的花费达到18.28亿美元,占总花费的67%;其次是海军,花费4.38亿,占16%;再次是陆军和特种作战司令部,分别占10%和7%。若以日常花费来算, ...

    查看全文

  • 一周数读:全球民调显示美国形象依然好过中国

    一周数读:全球民调显示美国形象依然好过中国

    2014年全球难民人数创新高,近6000万人被迫流离失所 6月20日是“世界难民日”,联合国最新发布的报告显示,2014年全球难民人数再创历史记录,近6000万人被迫流离失所,该数字是10年前的2倍,事实上仅去年一年就增加了1390多万新难民,其中超过一半的难民年龄在18周岁以下。 全球输出难民人数最多的国家是叙利亚、阿富汗和索马里,来自这三个国家的难民数量占到全球总难民数的一半以上,同时亚洲的难民和境内流离失所者总人数也增长了31%,达到了近900万人。 全球民调显示美国形象依然比中国更正面 从2005年起,皮尤研究中心每年都会在全球针对中美两国国家形象进行调查,尽管每年情 ...

    查看全文

  • 日本国民体质完胜中国人

    日本国民体质完胜中国人

    近日,国家卫计委发布报告称中国成年男性和女性的平均身高分别为167.1cm和155.8cm,该组数字似低于网友心理预期而引发质疑。不少人拿东亚邻国人的身高作对比,实际上被中国人一贯蔑称为“小日本”的日本国民不仅平均身高不比中国差,体能素质上更完胜中国人。 自1979年中国开始有全国性国民身体素质统计以来,中国城市、农村各年龄组的青少年身高就均低于日本。随着营养条件的改善,中日两国青少年的身高差距逐渐缩小,1985年平均低4.6cm,2000年平均低1.73cm,到2010年中国青少年的平均身高终于追上了日本同龄人,然而在体能素质上却依然远远落后于日本学生。 因两国体能测试项目不同,在此仅 ...

    查看全文

  • 美国总统候选人的纳税pk

    美国总统候选人的纳税pk

    美国总统竞选从拼纳税单开始,收入高纳税低的没戏 近日,美国共和党籍总统选举参选人杰布•布什一次性对外公布了他过去33年的纳税情况,称其平均有效纳税率为36%,2013年的实际纳税率更高达40%,高于民主党参选人希拉里•克林顿此前透露的30%纳税率。 纳税问题历来是选民关注的热点之一,公开总统本人的纳税情况并非法律所强制,而是一项默认的传统,候选人既能博取一个透明、有公信力的形象,还能借比拼纳税率嘲讽对手,2012年共和党总统候选人米特·罗姆尼就因此栽了跟头。彼时身为千万富豪的罗姆尼在奥巴马阵营的不断施压之下,无奈公布出的纳税单显示其2011年纳税率居然只有14.1%,比美国一般中产家庭的纳税率 ...

    查看全文

  • 矛盾的希腊:高额欠债、高福利与高逃税率

    矛盾的希腊:高额欠债、高福利与高逃税率

    欠债累累的希腊 近日,希腊因未能按时偿还国际货币基金组织IMF的15亿欧元贷款,成为历史上第一个债务违约的发达经济体。而在接下来的全民公投中,希腊人以集体的名义地拒绝了国际债权人提出的救助条件,以民意作为“赖账”的筹码。截至目前,希腊的债务总额已经高达3230亿欧元,相当于其GDP总值的172%,针对这一根本不可能还清的数额,IMF只得公开呼吁各大债权方继续减免债务,并延长还款期限至40年。 高居不下的失业率和福利负担 陷入债务危机以来,希腊国内长期靠借债维持的高福利制度就不断被外界诟病。根据欧盟的数据显示,2012年欧洲各国在养老、失业等各项福利开支上,经济长期陷入困境的希 ...

    查看全文

  • 中国著作权法:学国外皮毛留国产漏洞

    中国著作权法:学国外皮毛留国产漏洞

    中国著作权保护:学国外皮毛,留国产漏洞 60秒读懂专题:虽然中国的著作权保护法律体系是沿袭国际主流,“独创性标准”、“实质性相似”、“思想与表达二分法”等等与全球通行标准一样。但用起来就完全不是那么回事:书要大段地逐字逐句地抄才算剽窃,剽窃原创学术观点不算剽窃,影剧要整成“大段台词一样”才算剽窃,剽窃者在原作基础上加点创作性内容就很可能通过中国法院的“独创性标准”审查。 导语:近日国产动画电影《汽车人总动员》是否剽窃的争议响彻各社交媒体,不少人借此机会表达了对近年各种涉及抄袭剽窃丑闻的文艺名人的不满。这种状况的缘由,是因为虽然中国关于保护著作权的法律规定与诠释与国际主流一致,但司法实践中却有 ...

    查看全文

  • 一周数读:全球男女差异指数,中国第87

    一周数读:全球男女差异指数,中国第87

    全球男女差异指数,中国排名第87 尽管男女平等的观念已经深入人心,但根据世界经济论坛发布的《2014年全球男女差异报告》显示,男女有别现象依然严重。中国排名第87,情况不容乐观。 此次调查主要从经济机会及参与、教育程度、健康与生存、政治赋权等四个方面衡量女性和男性之间的差异,得分越接近1越平等,超过1,说明女性处于优势地位,小于1则说明女性处于弱势地位。即使是排名最高的冰岛(得分0.8594),也没有实现真正的男女平等。 在教育程度和健康方面,中国的得分均在9分以上,男女接近平等,但排名却不高,一个89,一个140,这说明全世界女性在这两项上的得分都偏高。不过男女平等与国家和地区的发达 ...

    查看全文