语言数据是大生意这个涉及语言技术培训语料库的子行业,从自然语言处理到机器翻译,正因人工智能而重新焕发活力。基本上每种语言相关的人工智能技术都在推动需求包括语音识别、情感分析、问答和总结当然还有神经机器翻译(NMT)。语言数据一直是统计MT等技术所必需的但NMT和任何基于神经网络的解决方案都需要更多的数据,更重要的是这些技术需要高质量特定领域的语言数据以提供同样高质量的输出。

语言数据的蓬勃发展已经变得非常明显像Appen这样的公司在2017年实现了“真正优秀”突破了数十亿美元的估值。这家总部位于澳大利亚的悉尼证券交易所上市公司有两个业务部门:语言资源部门,提供培训AI引擎的数据集(音频、文本图像和视频),以及帮助客户培训AI驱动产品的内容相关部门(主要是搜索引擎)通过人工评估和反馈。Appen的增长也没有停止,2018年上半年的业绩已经达到历史最高水平。
然而正如韩国最大的电信公司KT Corp所发现的那样语言数据的增长也意味着到目前为止的需求超过供应,2017年1月KT推出了AI-powered语音助手GiGA Genie根据KT公司的经理Kang Da-Som的说法,该服务在2018年7月之前拥有100万用户他们打算在年底前将用户数增加到150万。GiGA Genie的重点不是搜索或电子商务不过像谷歌助手或亚马逊Alexa而是媒体服务,事实上GiGA Genie首先通过安装在酒店中来制作新闻,该服务以英语和韩语响应命令并为韩国合作的五星级酒店提供智能礼宾服务,计划推出更多语言。
上一篇:机器翻译中比较的是文件而不是单纯的句子 下一篇:制作平面设计翻译证明