(资料图)
为了让众多以地方方言为载体的区域历史、文化和习俗可以以短视频的形式制作、传播与保存,解决地方方言难以被更多用户阅读和理解的障碍。近期,抖音正式上线了地方方言自动翻译功能。创作者可以使用该功能,“一键”将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕,方便公众观看。
随着短视频的不断普及,越来越多以地方方言为载体的视频出现在了短视频平台。这些极具地方特色的视频,一方面让广大用户欣赏到了山南海北不同区域的口音与特色腔调;另一方面,也因为方言识别的天然障碍,使其难以更好得被深度了解和传播。
为此,抖音近期正式上线了地方方言自动翻译功能。创作者可在抖音投稿主界面点击“拍摄上传投稿”,上传视频后,使用“自动字幕”功能,选择“转为普通话字幕”,新功能即可完成对视频内容的方言语音自动识别,并将视频里的方言内容转化成普通话字幕。目前,新功能第一期已经上线,支持粤语、闽语、吴语(上海)、西南官话(四川)、中原官话(陕西、河南)等,未来还将支持更多方言转化。
据悉,由于各地方言常以口语形式流传,可用于模型训练的方言语料数据较少,对方言识别和翻译都提出了很大挑战。对此,来自火山引擎的技术团队采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。“基于日常服务抖音集团业务的技术积累,抖音方言字幕可实现超低延时和高准确率”,其团队负责人表示。