嗅谱网

技术文库

  • 数学应用-怎样用数学度量信息

    数学应用-怎样用数学度量信息

    发表者:吴军,Google 研究员 前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使 命。那么究竟每一条信息应该怎样度量呢? 信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚 信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年, 香农 提出了“ 信息熵 ”(shāng) 的概念,才解决了对信息的量化度量问题。 一 条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚 一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。 相反,如 果我们对某件事已经有了较多的了解,我们不需要太多的信 ...

    查看全文

  • 数学应用-隐含马尔可夫模型在语言处理中的应用

    数学应用-隐含马尔可夫模型在语言处理中的应用

    发表者:吴军,Google 研究员 前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快 速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫 模型能非常简单地被表述、解决,让我不由由衷地感叹数学模型之妙。 自 然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系 统中的解码问题 — 一个人根据接收到的信息,去猜测发话人要表达的意思。这 其实就象通信中,我们根据接收端收到的信号去分析、理解、还原发送端传送过 来的信息。以下该图就表 示了一个典型的通信系统: 其中 s1,s2,s3…表示信息源发出的信号。o1, o2, ...

    查看全文

  • 数学应用-谈谈中文分词

    数学应用-谈谈中文分词

    发表者: 吴军, Google 研究员 谈谈中文分词 —– 统计语言模型在中文处理中的一个应用 上回我们谈到 利用统计语言模型进行语言处理 ,由于模型是建立在词的基础上 的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀 到美国与太空总署官员开会。” 分成一串词: 中国 / 航天 / 官员 / 应邀 / 到 / 美国 / 与 / 太空 / 总署 / 官员 / 开 会。 最容易想到的,也是最简单的分词办法就是查字典。这种方法最早是由北京航天 航空大学的梁南元教授提出的。 用 “查字典” 法,其实就是我们把一个句子从左向右扫描一遍,遇到字典里有 的词就 ...

    查看全文

  • 数学应用-统计语言模型

    数学应用-统计语言模型

    发表者: 吴军, Google 研究员 前言 也 许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常 清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工 具解决一 个语言问题时,总会感叹数学之美。我们希望利用 Google 中文黑板 报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google 产品的。 系列一: 统计语言模型 (Statistical Language Models) Google 的使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、 语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语 言、 ...

    查看全文

  • 第一个html5程序

    第一个html5程序

    HTML 5实战HTML 5中不仅增加了很多新的页面标记,而且与HTML 4相比,整体页面的结构也发生了根本的变化。下面使用HTML 5新结构来编写一个简单的页面。 实例1-2 Hello, World页面的实现 1. 功能说明 使用HTML 5结构编写一个HTML页面,在页面中输出“Hello, World”的字样。 2. 实现代码 在Dreamweaver CS5中新建一个HTML页面1-2.html,加入代码如代码清单1-2所示。代码清单1-2 我的第一个HTML 5页面 我的第一个HTML 5 页面 Hello,World 3. 页面效果 该页面在Chrome浏览器下执行后的页面 ...

    查看全文

  • 检测你的浏览器是否支持html5

    检测你的浏览器是否支持html5

    HTML 5 1. 功能说明 在HTML页面中插入一段HTML 5画布标记,当浏览器支持该标记时,将出现一个矩形;反之,则在页面中显示“该浏览器不支持HTML 5的画布标记!”的提示。 2. 实现代码 在Dreamweaver CS5中新建一个HTML页面1-1.html,加入代码如代码清单1-1所示。 代码清单1-1 检测浏览器是否支持HTML 5 检测浏览器是否支持HTML 5     该浏览器不支持HTML 5 的画布标记!     3. 页面效果 将页面文件1-1.html在IE 8浏览器中执行。由于IE ...

    查看全文

  • 中日韩民众态度:中日彼此最不待见,中韩稍好

    中日韩民众态度:中日彼此最不待见,中韩稍好

    近日,有日本和韩国媒体发布联合调查,结果显示日韩两国民众相互不信任的情况再次加深。事实上,中日韩东亚三国民众各自对另外两个国家的态度一直错综复杂。2005年起,英国广播公司BBC联合舆论调查机构GlobeScan和PIPA每年都会发布《国家评分民调》,调查各国民众如何看待各国在世界的影响。2010年开始,中日韩三国全部囊括在内(此前没有单独调查韩国)。 根据2010年至2014年这五年的数据,总体上看,三国民众看待对方国家的态度主要以负面为主,且这一趋势不断扩大,其中,中日两国相互态度负面程度最深,日韩次之,中韩稍好,中国民众对韩国的态度甚至偏正面。 根据该调查,中国民众对日本的态度一直 ...

    查看全文

  • 目睹妻子被强暴“无限防卫权”很无奈

    目睹妻子被强暴“无限防卫权”很无奈

    目睹妻子被强暴,“无限防卫权”很无奈 60秒读懂专题:虽然中国刑法第20条第3款有“无限防卫权”条款的称谓,其实这种权利在实践中限制多多:办案人员除非防卫人自遭重伤、重残否则基本不认;歹徒侵入私宅不算特定暴力犯罪开始,暴行一中断就算“犯罪行为终止”,在此期间杀伤歹徒不能算是“无过当防卫”;撞破暴力械劫、强奸或可实施“无过当防卫”,撞破迷奸、麻醉抢劫就不行。 导语:近日“温州男子目睹妻子遭强暴,砍死施暴者被判无期”的消息引起公众哗然。但这种判决在中国司法实践中并不少见,而且是有法条支撑的。 按学者记录和新闻报道,中国司法机关从1999年至今,在办案时极少认可“无限防卫权”,除非防卫人自遭重伤 ...

    查看全文

  • 美式竞选:父子齐上阵,全家总动员

    美式竞选:父子齐上阵,全家总动员

    人才济济的布什一家:从政、经商、做慈善,一个不落 美国时间6月15日,前福罗里达州州长杰布·布什正式宣布参加2016年美国总统选举。杰布·布什现年62岁,是美国第41任总统乔治·布什(老布什)的儿子、第43任总统乔治·W·布什(小布什)的弟弟。如果竞选成功,他将成为布什家族走出的第三位总统,也会令布什家族成为美国历史上诞生总统最多的家族。 与一般的政治世家类似,布什家族也是先经商后从政,从杰布·布什的祖父普雷斯科特·布什开始,正式书写发迹史。普雷斯科特与金融巨鳄沃克家族联姻,二战时迅速积累财富,后成为参议员。其儿子老布什先是开公司成为了石油大亨,后“贾而优则仕”,进军政坛。老布什的两 ...

    查看全文

  • 美国打击ISIS:一年花27亿,破坏目标超6000

    美国打击ISIS:一年花27亿,破坏目标超6000

    极端组织伊拉克和黎凡特伊斯兰国(ISIS)(以下简称:伊斯兰国)持续肆虐中东地区,美国联手同盟国家一直致力于军事打击伊斯兰国。美国将这场军事干预称之为“坚决行动”,并为此耗资不菲。 今年6月,美国国防部公布了美国过去一年在打击伊斯兰国方面花费的资金。从2014年8月8日到2015年5月21日,美国在打击伊斯兰国上花费了27.44亿美元,平均每天花费910万美元。 根据数据,美国打击伊斯兰国的主要手段是空袭。几大军种中,主要依靠空军作战,空军的花费达到18.28亿美元,占总花费的67%;其次是海军,花费4.38亿,占16%;再次是陆军和特种作战司令部,分别占10%和7%。若以日常花费来算, ...

    查看全文

  • 一周数读:全球民调显示美国形象依然好过中国

    一周数读:全球民调显示美国形象依然好过中国

    2014年全球难民人数创新高,近6000万人被迫流离失所 6月20日是“世界难民日”,联合国最新发布的报告显示,2014年全球难民人数再创历史记录,近6000万人被迫流离失所,该数字是10年前的2倍,事实上仅去年一年就增加了1390多万新难民,其中超过一半的难民年龄在18周岁以下。 全球输出难民人数最多的国家是叙利亚、阿富汗和索马里,来自这三个国家的难民数量占到全球总难民数的一半以上,同时亚洲的难民和境内流离失所者总人数也增长了31%,达到了近900万人。 全球民调显示美国形象依然比中国更正面 从2005年起,皮尤研究中心每年都会在全球针对中美两国国家形象进行调查,尽管每年情 ...

    查看全文

  • 日本国民体质完胜中国人

    日本国民体质完胜中国人

    近日,国家卫计委发布报告称中国成年男性和女性的平均身高分别为167.1cm和155.8cm,该组数字似低于网友心理预期而引发质疑。不少人拿东亚邻国人的身高作对比,实际上被中国人一贯蔑称为“小日本”的日本国民不仅平均身高不比中国差,体能素质上更完胜中国人。 自1979年中国开始有全国性国民身体素质统计以来,中国城市、农村各年龄组的青少年身高就均低于日本。随着营养条件的改善,中日两国青少年的身高差距逐渐缩小,1985年平均低4.6cm,2000年平均低1.73cm,到2010年中国青少年的平均身高终于追上了日本同龄人,然而在体能素质上却依然远远落后于日本学生。 因两国体能测试项目不同,在此仅 ...

    查看全文