摘要
目前,微軟智能語音已賦能超過 100 個國家合作伙伴的產(chǎn)品及服務(wù),共同打造了語音交互生態(tài)。
多年來,微軟持續(xù)探索 AI 語音合成與識別技術(shù),獲得了大量成果:Azure Neural TTS(text-to-speech,語音合成)與 STT(speech-to-text,語音識別)支持的語言區(qū)域達到 140 余個,并支持超過 400 多個音色,并具有豐富細(xì)膩的情感,與真人聲音不相伯仲。目前,微軟智能語音已賦能超過 100 個國家合作伙伴的產(chǎn)品及服務(wù),共同打造了語音交互生態(tài)。
近兩年,微軟在漢語方言智能語音上加大了研究力度,在語音合成上實現(xiàn)了對吳方言和粵方言兩種漢語方言,以及西南官話、東北官話、冀魯官話、中原官話(包括河南、陜西地區(qū))等多種官話次方言的支持;在語音識別上支持吳方言、粵方言和西南官話,受到了眾多企業(yè)客戶的青睞,也得到了終端用戶的認(rèn)可。
值此辭舊迎新之際,微軟智能語音為大家送上新春祝福!一起感受方言朗讀的獨特魅力。
中原官話(河南)音頻:00:0000:17
中原官話(河南)朗誦的北宋王安石的《元日》
在智能家居領(lǐng)域,使用智能語音控制空調(diào)、電視、電燈等家居產(chǎn)品已經(jīng)越來越常見。在與智能機器人的對話中,人們往往需要使用標(biāo)準(zhǔn)普通話以得到準(zhǔn)確的反饋,但一些習(xí)慣使用方言的用戶群體——比如家中的老人可能更傾向使用方言進行交流。因此,若智能家居企業(yè)在產(chǎn)品中引入方言語音,便能更好地滿足人們對不同方言使用的需求。
以吳方言(上海)與智能空調(diào)進行交互:
吳方言(上海)音頻:00:0000:08
儂好,已為儂打開空調(diào),并將溫度調(diào)低至 25 度。稍后還有其它需要,可以隨時呼叫我。
在智能導(dǎo)航領(lǐng)域,各大地圖廠商將"聲音"作為吸引客戶的重要賣點,紛紛推出了明星語音包、幽默風(fēng)趣的相聲語音包等等。近兩年,越來越多的用戶認(rèn)為方言會讓他們感覺更親切、熟悉,也更容易理解。
以東北官話(遼寧)進行的語音導(dǎo)航:
東北官話(遼寧)音頻:00:0000:25
我們已經(jīng)駛?cè)?2022 年冬季,冬天常常與雪為伴,溫度將至零下,路面易結(jié)冰,所以請減速減速再減速。注意兩百米后有一個小小的急轉(zhuǎn)彎,但道路濕滑也容易讓你漂移,請收油慢行。前方路口行人較多,還請踩下剎車,不要讓它成為擺設(shè)。
在影視配音中,來自眾多地域的不同角色,有時需要搭配方言才能更好地呈現(xiàn)人物形象。比如,角色設(shè)定來自東北,性格熱情豪爽、快言快語,如果以普通話配音,就失去了特色;再比如,在美食介紹節(jié)目中,針對不同的菜系搭配當(dāng)?shù)氐奶厣窖裕芤鹑藗兊墓缠Q,想象中就能口齒生津。
以西南官話(四川)介紹美食:
西南官話(四川)音頻:00:0000:23
重慶火鍋以麻、辣、燙、鮮、香、嫩、脆著稱,然而正宗的重慶火鍋究竟應(yīng)該燙啥子才巴適?鮮脆毛肚、爽滑鴨腸必不可少,富有嚼勁;剁椒嫩牛肉不可錯過,雙椒口感鮮辣十足;井水豆芽口感獨特,石磨黑豆腐鮮香四溢,清爽荷心香甜解膩。
除了上述場景外,微軟智能語音也已經(jīng)在呼叫中心、新聞閱讀等眾多場景中應(yīng)用。越來越多的企業(yè)對方言智能語音有需求,包括智能汽車、智能手機等企業(yè)對語音助理、呼叫中心的方言場景規(guī)劃,以及(短)視頻配音等等。
漢語是世界上最古老的語言之一,受歷史與地理條件的影響,出現(xiàn)了眾多代表地域文化特色的方言。自 2017 年起,微軟一直致力于 AI for Good 計劃的推進,其中包括:通過提供前沿的技術(shù)、資源和專業(yè)知識,保護人文遺產(chǎn)以及創(chuàng)造更具可持續(xù)性和便利性的世界。微軟也將持續(xù)投入于方言智能語音的研究,助力中國傳統(tǒng)文化的保護與傳承。
在方言之外,古典詩歌也是文化傳承的重要載體。微軟通過學(xué)習(xí)大量詩歌朗誦者的語音數(shù)據(jù),可以讓 AI 更好地表達詩歌的韻律、停頓、情感。微軟可支持傳統(tǒng)詩歌、現(xiàn)代詩歌、五言、七言律等智能語音的朗誦。?
中原官話(陜西)朗誦唐朝李世民的《守歲》:
中原官話(陜西)音頻:00:0000:23
《守歲》,唐,李世民。暮景斜芳殿,年華麗綺宮。寒辭去冬雪,暖帶入春風(fēng)。階馥舒梅素,盤花卷燭紅。共歡新故歲,迎送一宵中。
從智能家居到車載語音助手,從呼叫中心轉(zhuǎn)寫到多人會議記錄,微軟智能語音技術(shù)不斷打破場景限制,讓人工智能以各種各樣的聲音形象來豐富人們的工作和生活。未來,微軟智能語音還將擴展覆蓋更多全球語言和方言,持續(xù)提升模型質(zhì)量、準(zhǔn)確度,盡全力滿足區(qū)域用戶的個性化、差異化定制需求,為使用者提供更好的語音服務(wù),解鎖更多交互場景。
附:漢語方言通常分為十大方言:官話方言、晉方言、吳方言、閩方言、客家方言、粵方言、湘方言、贛方言、徽方言、平話土話。各方言區(qū)內(nèi)又分布著若干次方言和許多種「土語」。其中使用人數(shù)最多的官話方言可分為東北官話、北京官話、冀魯官話、膠遼官話、中原官話、蘭銀官話、江淮官話、西南官話八種次方言。
來源:中國語言文字概況(2021 年版)
(完)