在视频当中,大屏幕的左侧是由计算机将识别出的演讲者语音转换出的文字,右侧则是机器翻译出的中文。微软研究带头人之一 Rick Rashid 在一次演讲当中向公众展示了微软新语音识别技术的成果。

这是在好玩的事情开始时(#有趣的事才刚刚开始)。演讲者说,微软分析了成千上万的数据,并且因此能得到说出的翻译出的中文(#由此得到较为确切中文翻译)。最后一个会踢的人(#最重要的是):当演讲者想系统中喂了一个小时的他自己的声音(#演讲者为了“训练”系统,对着语音识别系统说了一个小时),最终软件能说出中文了,用他自己的声音(#最终软件能学着演讲者的声音说出不那么地道的中文了)。

这很难以理解。是什么核心科技运营着工具(#是什么样的科技打造了这个神奇的工具)?根据微软研究领头人Rick Rashid的说法,那个给出演讲的人(#......

"仅仅两年前,研究者在微软研究中心和多伦多大学做了另一个突破(#微软研究中心和多伦多大学的研究者取得了另一个重大突破)。通过使用一个叫‘深度神经网络’的技术,这项技术根据人类大脑活动规律(#T皿T),研究者相比先前的方法能够训练更有判别力和更好的演讲识别器(#相比先前的语音识别方法,研究者能够依此制作出更高级的语音识别器。

我们已经能够降低演讲文字错误率达到30%,和先前的方法相比(#......)。这意味着错误率在每7-8个单词,而不是4-5个单词错误(#这意味着照比先前的错误率,每4-5个单词一次,现在的错误率可以下降到每7-8个单词一次。)"

这个视频是哦很值得你的几分钟(这个视频只有几分钟时间,但是很值得你看看。)未来,正在来了。(#T皿T

#发现学机器说话好难啊!尽管视频中,中文翻译还是有些蹩脚,但是照比很多机器翻译结果已经有了十分明显的进步了。只是,语言文字,毕竟还是高级智能的产物,计算机模拟人类说法还有很长的路要走。

本文译自 :TheNextWeb,由 pwwp 编辑发布。

[ 广告 ]
赞一个 (0)

PREV :
NEXT :