同传动态

机器翻译依然无法商用

作者:同传网    浏览次数:16    发布时间:2020-2-14 11:07:50
同声传译历来是自然语言处理领域的经典课题。同声传译是指在不打断演讲者的条件下,将讲话内容不间断地、实时地翻译给听众的一种翻译方式,广泛应用于国际会议、外交谈判、商务会谈等重要场合。 近年来,随着人工智能相关技术的进步,结合了机器翻译(MT)、语音识别(ASR)和语音合成(TTS)等技术的机器同传(Simultaneous Translation,ST)成为领域前沿。 其中,既有技术突破如集成预测和可控时延的同传模型、语义信息单元驱动的上下文同传模型等,也有广泛的产品应用,如字幕投屏、语音到语音的同传小程序等。然而,作为一个融合多种技术的前沿课题,机器同传仍然面临国际公认的诸多挑战,如语音识别错误传播、翻译模型鲁棒性差、数据稀缺、评价体系不健全等。 为了推动同传技术的发展,百度联合国内外顶尖企业和高校共同举办国际首届同声传译研讨会,汇集包括机器翻译、语音处理和人类口译领域的研究人员和从业人员,共同讨论同声传译的最新进展、面临的挑战以及未来发展。 同声传译行业协会网(www.transcc.com)认为本次盛会是对同声传译机器辅助的困境现状的客观分析,在本次研讨会中,国际首届同传评测比赛也将同期举办。赛事的含金量非常高,包含中英、英西3种语言、两个翻译方向。作为首届针对同声传译的顶级专业赛事,此次百度将行业首发超过70小时的高质量真实场景演讲语音及标注结果供参赛者进行模型训练,涵盖信息技术、经济、文化、生物、艺术等多个领域。 众所周知,高质量的数据是同声传译研究中面临的重要问题。参赛者经过报名审核后,百度将定向开放该数据集,这无疑将为开发者们提供珍贵的数据环境。此外,赛事共将提供4个赛道,综合评估各参赛队伍的翻译质量和延时情况,当前赛事已开放报名。 同时,基于百度深度学习平台飞桨的一站式 AI 开发实训平台百度大脑 AI Studio,百度还将为参赛选手提供在线编程环境、免费 GPU 算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。虽然在未来30年我们都无法取代人工翻译,但机器作为翻译尤其是口译辅助工作的必要性,以及对产品AI赋能所带来的商业利好是可预见的。
Copyright © 2007-2019 版权所有  ICP备05023612-1  同声传译设备租赁行业协会 同传设备销售 同声传译服务热线:4009942400