谷歌承认神经机器翻译可以欺骗其搜索算法


发布者:上海翻译公司 发布时间:2018-9-29


  谷歌通常讨厌自动生成的内容,除非它无法区分。谷歌高级网站管理员趋势分析师约翰·穆勒表示,谷歌在搜索结果排名方面可能会受到机器翻译内容的欺骗。根据SERoundtable,Mueller在其常规谷歌网站管理员环聊会议中被问及谷歌现在是否会自动对翻译内容进行排名,因为神经机器翻译(NMT)的最新发展使得机器翻译内容更加流畅。

  环聊会议的参与者问:“我看到很多网站都有自动生成的内容......域名扩展排名非常奇怪而且很新。并且所有内容基本上都是自动生成的[d]。这是一个棘手的问题,因为最近,黑帽子正在滥用谷歌翻译API:Googlebot是否有可能被自己的服务所欺骗,因为它使用人工智能翻译内容,翻译越来越好。因此,当有人创建数百页自动翻译内容时,Googlebot会被这些内容所欺骗,并认为它是人类可读的,[那么]这是正常的内容?““情况总是如此。我们不能完全排除这种可能性,“穆勒承认。随着人工智能从自动翻译角度的提升以及网站内容的不断增加,Googlebot会被愚弄吗?Via @johnmu:是的,可能就是这种情况。谷歌不能排除这种可能性。

翻译公司

  谈到搜索引擎优化(SEO),自动生成的内容是禁忌。这包括内容草率通过一个免费的翻译服务来运行,如谷歌翻译,如谷歌本身在澄清2015年。谷歌的排名算法多年来一直在不断变化,它也适应了SEO行业一直在使用的同样不断发展的优化措施。结果:有机链接,深度吸引人的内容和适当优化的网页等最佳实践得到了回报,而关键字垃圾邮件,链接耕作和自动生成的垃圾邮件等阴暗的“黑帽”策略受到了惩罚。

  今天,影响谷歌搜索结果排名的前两个因素仍然是反向链接和内容。在2015年至2016年,谷歌推出了一个名为RankBrain的排名算法AI ,它主动学习搜索上下文,据推测它在影响搜索引擎结果页面(SERP)的因素中排名第三。然而,优化人工智能网站是一个相当模糊的概念,因此搜索引擎优化行业专家关注具体的排名因素,例如适合移动设备,确保有效的页面加载速度,使用SCHEMA代码等。因此,借助Google的基于人工智能的SERP排名算法,搜索巨头可以清除构造不良,自动生成的内容。黑客SEO使用的一种方法是用另一种语言翻译大量内容。那么当机器翻译的内容变得足够流畅以至于愚弄谷歌自己的排名算法时会发生什么呢?

  这一切都归结为内容:“我认为这有利有弊,”穆勒在环聊会议上表示,“因为它可能被基本上垃圾内容的网站使用。”另一方面,穆勒说“它也可以使用通过在网站上合法提供翻译的网站,他们只是从自动翻译版本开始,然后他们会随着时间的推移改进这些翻译。“最终,Mueller总结说“这更多是意图的问题。”如果机器翻译的内容被用于自动生成的垃圾邮件,那么谷歌仍然会对违规网站进行处罚。当然,这就引出了Google的排名算法是否仍能检测到经历过NMT的内容的问题。“[神经机器翻译]也可以被合法提供网站翻译的网站使用,他们只是从自动翻译版本开始,然后随着时间推移改进这些翻译” - Google高级网站管理员趋势分析师John Mueller

  简而言之,谷歌翻译已经不利于谷歌的排名算法。虽然这可能看起来像是一种衡量搜索引擎优化的NMT质量的新方法 - 测试谷歌是否认为它是自动翻译的 - 但是值得重申搜索引擎优化的基本原则:优化人,而不是搜索引擎。即使自动翻译的内容可以欺骗谷歌,它仍然可能会偏向于目标用户。至于NMT如何流畅,它已经超越了目前的质量评估措施。与此同时,MT肯定在电子商务和营销方面占有一席之地,正如最近的一份经济研究报告所指出的那样:“机器翻译系统的引入大大增加了[在eBay上]的国际贸易,使出口增加了17.5%。”

上一篇:翻译文学的挑战

下一篇:机器翻译的历史