親愛的網友:
為確保您享有最佳的瀏覽體驗,建議您提升您的 IE 瀏覽器至最新版本,感謝您的配合。
三星摺疊機出包
數位焦點
通訊世界
社群網路
3C生活
軟體情報
科技娛樂
電玩電競

4.2萬年前小馬駒「血還在流」 科學家:有望復活

亞馬遜Alexa又有新技能! 實現主播聲音幫你報新聞

2018-11-27 15:56INSIDE

分享

先前亞馬遜自家智慧語音助理Alexa開發出新的 耳語模式 ,讓用戶深夜能輕聲細語和Alexa交談給予指令,透過神經網路的訓練突破語音助理在低頻低能量下的感應能力。近日,Alexa的新技能是實現主播的播報聲音。

新一代AI語音技術 超擬真背後真相?

隨著越來越多功能被實現,語音助理正朝向更人性化的面向發展,去年10月,Google Assistant利用 DeepMind「WaveNet」技術 ,透過分析原始聲波並用類神經網路 (Neural Network) 修正,實現更人性化的助理。

而這次Alexa背後使用的技術稱為「神經文字轉語音」(neural text-to-speech)技術,亞馬遜表示新的語音風格是由自家開發的「神經文字轉語音」(neural text-to-speech)技術簡稱 NTTS,透過機器學習更快地產生更加生動的聲音,是新一代的語音合成方法。

至於主播說話的聲音來自於現實生活中新聞頻道的錄音音頻片段,藉由機器學習技術辨識並模仿,使機器可以像主播一樣讀新聞,更驚人的是Alexa竟然只花了幾個小時來訓練Alexa的新聞主播的聲音。

亞馬遜的AI語音負責人Trevor Wood表示,這種方法更容易捕捉真人講話時的細節。雖然這其中微小的差異很難用語言描述,但很顯然使用AI技術,透過數據驅動,可以比人更有效捕捉和模擬這些聲音細節。

以下是過去語音合成技術到NTTS技術以及真人主播的聲音,很顯然新技術所呈現出來的語句更自然,抑揚頓挫也更為明顯,讓整體語音效果貼近真人主播。

過去語音合成技術:

Alexa新的NTTS技術:

真人主播:

語音合成的突破

過去Alexa所使用的語音到底是怎麽產生的呢?事實上,Alexa目前所使用的拼接語音合成技術(concatenative speech synthesis)已經使用數十年。背後是將語音樣本分解成不同的聲音,也就是音素,然後再將音素拼湊在一起以形成新的單字和句子。

雖然根據 路透社先前針對語音助理所做的報告 中說明用戶習慣使用語音助理仍在主動性的功能像是搜尋、和啟動設備,播報新聞場景在當今使用場景中所佔還是少數,Alexa實現主播的聲音在短時間內對用戶來說可能不會有太明顯的感受,但是在AI應用上仍是一項嶄新的嘗試,說不準未來亞馬遜還會開發出更多系列的人聲風格。

《原文刊登於合作媒體INSIDE,聯合新聞網獲授權轉載。》

Alexa亞馬遜機器學習AI

INSIDE

INSIDE 是台灣科技媒體領導品牌,成立於 2009 年 11 月底,係由一群熱愛網路的人所成立的共筆部落格。 我們專注於觀察創新、科技、新媒體與網路的趨勢發展,報導新創公司、創業家、網站、行動平台、社群媒體、行銷與數位內容。

熱門文章

試用記者爆:三星6萬元折疊手機兩天就掛

2019-04-18 08:21

他新買Galaxy Fold撕下「保護膜」 錯愕發現這是螢幕

2019-04-18 17:56

Mac電腦檔案搬家費3,000元 蘋果不收了

2019-04-18 19:09

影/三星螢幕折疊機用兩天就掛 美記者:暫停銷售吧

2019-04-18 17:59

可承受20萬次凹折?不便宜的Galaxy Fold螢幕兩天內出現問題

2019-04-18 16:25

清松手寫體免費下載 台灣網友自製中文手寫字型

2019-04-18 21:56

觀點/高通、蘋果最終選擇和解 是誰獲得的勝利?

2019-04-18 16:28

智慧音箱拚在地化服務 本土電信業參戰

2019-04-18 12:51

商品推薦

贊助廣告

商品推薦

留言


Top