数学应用-不要把所有的鸡蛋放在一个篮子里–谈谈最大熵模型(上)
发表者:Google 研究员,吴军
[我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。 在信息处理中,这个原理同样适用。在数学上,这个原理称为 最大熵原理 (the maximum entropy principle)。这是一个非常有意思的题目,但是把它讲清楚要 用两个系列的篇幅。]
前段时间,Google 中国研究院的刘骏总监谈到在网络搜索排名中,用到的信息 有上百种。更普遍地讲,在自然语言处理中,我们常常知道各种各样的但是又不 完全确定的信息,我们需要用一个统一的模型将这些信息综合起来。如何综合得 好,是一门很大的学问。
让 我们看一个拼音转汉字的简单的例子。假如输入 ...












