为训练神经网络 谷歌召集百名语言学博士

时间:2020-11-23 | 标签: | 作者: | 来源:-小 +大

小提示:如果您对本页介绍的内容感兴趣,有需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您!

728


  近期谷歌在手机端谷歌搜索中增加了神经网络算法,为了训练神经网络让谷歌搜索变得更加智能,谷歌在全球聘用了百名语言学博士,不分昼夜地对文本数据进行标注。下面小编带大家具体了解一下。

谷歌推广

  当用户在谷歌搜索中输入“世界上最快的鸟是什么”,谷歌会回答,“游隼。根据 Youtube,游隼被记录下较高 389 km/h 的时速。”这样的正确答案并不是来自于谷歌的数据库。当用户输入问题时,谷歌搜索引擎找到了一个描述世界上五种最快的鸟的Youtube视频,然后系统会将最快的鸟儿的信息提取出来。

  为了回答用户的搜索提问,谷歌搜索需要借助深度神经网络。神经网络是人工智能的一项重要技术,它不仅正在重塑谷歌搜索引擎,还在不断影响着谷歌整体的人工智能服务。深度神经网络是一种模式识别系统,主要通过对海量数据的分析,找到处理特定任务的方法。前面的例子中,系统学会了如何在网络的长篇文字中找到相关内容,再从中提取要点呈现给用户。

  移动端谷歌搜索刚上线这种“句子压缩算法”,尽管对人类来说这个任务十分简单,但是对机器来说相当困难,而现在人工智能终于能完成这样的任务。这也意味着深度学习正在促进自然语言理解这门艺术的发展。谷歌研发产品经理David Orr 说:“对于“句子压缩”,你不得不使用神经网络算法,因为这是目前我们发现的唯一方法。”

  为了训练神经网络算法,谷歌邀请了全球数百位语言学博士处理数据并进行人工筛选。谷歌的神经网络系统从人类学习如何在大段文字中提取有用信息,这个过程需要不断地重复,这是深度学习的一个很大的限制。雇佣大批语言学家不停地筛选数据既麻烦又极其昂贵,但短期内谷歌没有别的办法。

  谷歌也会用过期的新闻训练 AI问答系统,通过这些新闻让AI了解如何对文章进行归纳。不过谷歌仍然需要语言学者的帮助,示范句子的压缩,对语句的不同部分进行标记,帮助神经网络理解人类语言是如何工作的。David Orr将语言学家团队处理的数据称为“黄金数据”,而过期新闻则是“白银数据”。“黄金数据”有很重大的价值,是对人工智能进行训练的核心,而“白银数据”尽管作用不大,但是体量却不小。

  值得注意的是,除非谷歌聘请所有语言的语言学家,否则这个系统依然无法在其他语言中运转。现在语言学家团队的工作横跨了 20 至 30 种语言。谷歌必须在将来的某一天,采取更自动化的 AI 训练方式,即“无监督学习”。

  到了那时,机器将能够从未经人工标注的数据中学习。互联网上海量的数字信息可以被直接用于神经网络学习。 Google、Facebook 和 OpenAI这样的巨头们已经开始这个领域的研究,但它的实际应用仍然非常遥远。现在,AI 学习仍然需要幕后的大批语言学家队伍。

上一篇:使用7×7量子位阵列 谷歌将证实“量子霸权”
下一篇:Alphabet设立风投公司 用于投资人工智能公司


版权声明:以上主题为“为训练神经网络 谷歌召集百名语言学博士"的内容可能来至网络,如有侵权欢迎联系我们客服QQ处理,谢谢。
留言咨询
相关内容
扫码咨询
    微信客服
    打开微信扫码或长按识别二维码

小提示:如果您对本页介绍的“为训练神经网络 谷歌召集百名语言学博士”相关内容感兴趣,有需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您!

关键词:无锡谷歌推广,无锡Google代

经典案例 | 服务范围 | 关于我们
客服邮箱:sales@1330.com.cn
电话:400-021-1330 | 客服QQ:865612759
沪ICP备12034177号 | 沪公网安备31010702002418号