本篇文章1707字,读完约4分钟
今天,skype在中国市场发布了skype translator实时语音翻译中文预览版。 能够实现英语和汉语普通话之间的实时语音对话。
年12月skype translator发布英语和西班牙语的实时语音翻译后,这次在中国市场的发布又是skype translator之旅中的新内容,skype translator预览版为windows 8.1或windows 8.1 除了英语和中文普通话的语音翻译外,还支持40多种语言的即时拷贝翻译。
skype translator构建在机器学习平台之上。 在预览版阶段获取的训练数据中,加上其细微的差异,软件可以比较学习实际采用者的不同话题、口音、语言转换,从而实现更好的识别和翻译。
skype translator的机器学习协议可以训练和优化语音识别和机器翻译的任务。 该协议提高了已识别副本的翻译。 这个过程包括删除导致重复措辞的单词,将副本分解为句子,添加标点符号,以及区分大小写等。
语音识别和机器翻译的培训数据源多种多样,包括翻译的网页、带字幕的视频、事先翻译并转录到副本的一对一对话等。 skype translator通过记录这些对话来分解对话的副本,从而帮助系统更好地学习各种语言。 微软政府表示,已经有很多人分享了他们过去的谈话记录。 微软对其进行了分解,并制作了统计模型的培训数据,该模型教授如何将收集到的语音转换为文案新闻,并将文案新闻转换为其他语言。 使用skype translator的客户可以在对话开始前获得明确的系统提示,说明对话将被录制并用于提高微软翻译和语音识别服务的质量。
准备好的数据在机器学习系统中登记后,机器学习软件就会在这些对话和环境相关的单词中建立统计模型。 当客户讲话时,软件将在此统计模型中查找相似的副本,并将其应用于之前学习的转换程序。 这样可以将音频转换为副本,然后从副本转换为其他语言。
语音识别是近几十年来的重要研究课题,但该技术的快速发展一般错误率较高,受到麦克风灵敏度差异、噪声环境等因素的阻碍。 微软研究院将深层神经互联网( dnns )技术引入到语音识别中,大大降低了错误率,提高了可靠性,最终使包括skype translator在内的这种语音翻译技术得到了更广泛的应用。
skype translator的机器翻译部分负责将副本从一种语言翻译成另一种语言。 它运用了类似于在线翻译的技术:独创地组合句法和统计模型,进一步对比训练交互式语言。 这是非常困难的。 因为目前用于构建文案翻译系统的典型培训数据是结构清晰、结构严谨的书面语言。 我们的系统中包含了需要翻译的丰富的语言知识,还增加了口语对话中出现的单词和短语。
另外,为了调整产品的整体体验,制定了定制的机器人程序。 和电话第三方一样,建立电话连接,向语音引擎发送语音流以获取翻译副本,然后在双方讲完时翻译各自的副本。
要制定这样的计划,微软研究院和skype团队需要聚集双方共同的专业信息和工程能力,形成许多复杂的框架,但希望得到对客户来说简单直接的体验。
此外,语言翻译的顾客体验也有其固有的挑战。 例如,skype translator的自动翻译机就像第三方通话者一样出现。 skype发现,过去使用现场翻译服务的客户可以很快适应这种信息表示方法,但其他客户需要越来越多的时间。
与年12月发售的英语和西班牙语之间的实时语音对话相比,此次发售的中文预览版的功能更新如下。
客户可以通过语音接收交谈对象发送给自己的即时消息,并可以自由选择语音语言。
在对方发送语音新闻的时候进行可持续发展的文案翻译。
客户交谈者在实时语音翻译期间可以不间断地说话。 另外,由于客户端可以听到高音量的语音翻译,对话对方自身的语音新闻音量较低,因此将观察力集中在语音翻译上即可,从而使翻译新闻的收听更加顺畅。
可以任意打开或关闭语音翻译的语音,直接读取拷贝翻译。
除了语音翻译现有的4种语言(英语、西班牙语、中文标准语、意大利语)之外,skype translator的即时消息翻译还包括塞尔维亚语、波斯尼亚语、克罗地亚语、玛雅语、奥托米语40多种语言
标题:“Skype Translator发布实时语音翻译中文预览版”
地址:http://www.laszt.com/lhxinwen/4486.html