近日,微軟宣布其Azure認知服務翻譯的語言列表又添加了12種全新的語種和方言。至此,微軟翻譯可以提供翻譯支持的語言總數已達103種。新增語言的母語使用者合計達8460萬人。目前,最新版的微軟翻譯可以在全球56.6億人所使用的不同母語之間實現文本文檔的互譯。
微軟研究院在20多年前首次開發出機器翻譯系統。此后,微軟以統計機器翻譯模型為基礎,對系統做了進一步改良。隨著人工智能技術的發展,微軟研究院開始采用神經網絡機器翻譯技術,將所有機器翻譯系統遷移到基于Transformer架構的神經網絡模型上,因此翻譯的流暢度和準確性獲得了大幅提升。
盡管如此,缺少足夠的平行語料依然是小語種語言翻譯的最大難點。多年來,微軟亞洲研究院承擔了多個小語種語言和方言的模型構建工作,將新技術融入其中,幫助解決語料問題。微軟亞洲研究院首席研究員秦濤表示:“基于源語言和目標語言的平行語料及單語語料,我們在訓練階段將多語言模型與MASS預訓練模型相結合,同時再利用相關大語種的豐富語料及單語語料來提升模型的翻譯質量。”
Azure認知服務中的翻譯工具由微軟翻譯提供支持,旨在幫助企業擴大其全球影響力,讓他們能夠快速、可靠并以合理的成本跨越語言障礙,用客戶的母語與之進行合作、交流并提供內容服務。為了實現音頻或語音內容的翻譯,Azure認知服務的翻譯工具和語音工具緊密集成,通過Azure語音SDK為語音翻譯和多設備對話提供支持。(苗琳)