|
"ياخشىمۇسىز، مەن تېڭشۈن مىنخەن تەرجىمانى."-绍时间:2021-08-12 ياخشىمۇسىز (这是维语) ཁྱོད་བདེ་མོ། (这是藏语) 它们的汉语意思是 你好 为了便于民族交流,我们做了一款的小程序,名字叫——腾讯民汉翻译。(文章标题的意思就是:你好,我是腾讯民汉翻译。) (长按扫码体验) “ۋەئەلەيكۇم ئەسسالام، شىنجاڭغا كەلگەنلىكىڭلارنى قارشى ئالىمىز.”(你好,欢迎来到新疆),产品经理第一次去南疆的时候,一下飞机就被维吾尔族老乡这句话蒙住。 在这个有98%维吾尔族同胞的地方,语言的障碍成为交流的难题。实现民族语言和汉语无缝交流,是这款产品的初心。 目前它支持维语、藏语(卫藏藏、安多藏、康巴藏)与中文的互翻。 至于,翻译效果怎样?小编找到一位来自新疆的朋友: #整天就知道吃#系列↓↓↓ 他测了10分钟左右,说: 与其他翻译不一样的是,它实现了“实时语音识别+标点断句+翻译+语音合成”的首创。 它还加入了少数民族语言的OCR拍照翻译技术,意思就是它能翻译出照片里的文字。 产品上线以来,未进行任何商业推广,但已经得到各大民汉语言学习社区的认可与应用,作为一级翻译入口。 来自新疆的中国工程院院士 吾守尔斯拉木(维吾尔族) 也用了这款产品,他表示: 腾讯在民族语言的语音、图像、OCR、机器翻译等技术均已达到行业领先,并且有落地的产品打造出来,深入在新疆各地供群众使用。 我试了一下,语音和图像翻译的准确率相当高。 中国有腾讯这样的公司带领一队精英群体把最先进的AI技术带给民族同胞,感谢腾讯做了这项工作。 | 为什么要做这款产品?以下为产品负责人自述: 自己从小生活在西部边疆,虽然是汉族,但耳濡目染下,我渐渐喜欢上各地民族的语言,并选择了中科院自动化所攻读语音识别方向的博士。 一次去南疆做项目,发现那里会汉语的人很少。一位维吾尔族老大爷为了给我指路,说了一口维汉混合的汉语。老大爷说:“我这辈子最大的遗憾就是没有学好汉语,多希望我的孩子们能学好汉语。”。 这对我触动很大,我想用语音识别技术帮助边疆地区同胞们学习汉语。 现在的AI技术帮助人们实现了人机对话以及各种“锦上添花”的憧憬,但我们更希望利用AI技术解决“雪中送炭”的应用。 加入腾讯后,结合团队的能力,这个愿望得以实现。 2016年底,我们开始组建团队,虽然目前团队成员基本都是中科院、清华的博士。但做民族语言识别不同于英汉拥有大量语料资源,项目刚开始,困难就悄然而至。 最大的困难来自前期民族语言语料的获取,最开始录音地点选在大本营北京,但过程并不顺利。 大伙赶紧调整策略,把录音点换到了乌鲁木齐,在各大高校举办宣讲会。老师和同学们积极参加,让团队收获丰富的语料。 但问题又来了,普通的维吾尔语相对好采集,和田方言和罗布泊方言才是最亟待解决的问题,于是我们起身前往南疆,与维吾尔族老乡们深入交流,采集语音。 完全不懂民族语言,是团队的另一大难题。 我们买来了维吾尔语教程,大伙一起从字母、语法、拼音结构开始学,每天早上坚持听微信公众号,同时让团队所有博士每天必须学习微信公众号【维语吧】里的内容,开始啥也听不懂,就从维吾尔语歌曲开始听。一群对语音技术痴迷的博士专家们,从零学起,专注得像个孩子。 产品上线以来,虽未进行任何商业推广,但已经得到各大民汉语言学习社区的认可与应用,并引用我们的小程序,作为一级翻译入口,截至目前累计用户量7w,日活1.3w 。 不仅为语言学习者和旅游者,也在新疆驻村干部和维族用户中得到了良好的口碑,给他们的生活带来了极大便利。 最后,感谢所有为这个工具提供帮助的人。 未来,腾讯民汉翻译将深入教育、商务、办公、旅游等场景,贴近大家,进一步促进民族交流。 *本文转自微信公众号 腾讯(ID:tencent) |