親愛的網友:
為確保您享有最佳的瀏覽體驗,建議您提升您的 IE 瀏覽器至最新版本,感謝您的配合。
新款iPhone來了
數位焦點
通訊世界
社群網路
3C生活
軟體情報
科技娛樂
電玩電競

文化城已成沙漠?台中盧市府上任後的文資慘案

華為新旗艦Mate 30 Pro發表了!4800萬畫素、兩側無邊框

Google開源即時轉錄原始編碼 讓更多開發者以此打造豐富語音工具

2019-08-20 09:07楊又肇

Google在今年2月推出名為「即時轉錄 (Live Transcribe)」的語音工具,讓使用者能即時將口說或播放的語句內容快速識別轉換為文字內容,讓聽力有問題的人也能快速知曉。而在稍早時候,Google更進一步將此項語音工具開源,讓更多開發者能藉此打造便利的應用工具。

分享

「即時轉錄」的技術源自Google Cloud Platform所提供的Cloud Speech API,除了藉由雲端協同運算提高語音內容識別精準度,同時也能藉由Android裝置進行前期運算,讓實際識別轉換效果更好。

其實在今年準備釋出正式版本更新的Android Q (10.0)所搭載的Live Caption功能,在背後運作其實也採用相同運作模式,但可藉由Android裝置進行簡單運算,即便在沒有連網情況下也能完成一定程度的語音內容識別、轉換,而配合連網運作則可讓實際識別正確率提高,同時也能以更快效率完成轉換。

目前Google進一步將「即時轉錄」工具編碼內容開源,自然希望能藉由更多開發者已此打造更豐富的實用語音工具。

而為了讓「即時轉錄」有更好應用表現,Google更進一步降低背後需要使用網路頻寬,在不影響識別轉換精準度情況下,約讓網路頻寬使用量縮減為原本的10%,同時為了讓即時語音識別效率提昇,並且減少反應延遲表現,Google也藉由自訂Opus編碼器降低延遲問題。

在現階段裡,「即時轉錄」已經支援中文、日文、英文在內70種語言,但部分語言在內容識別仍有其侷限,例如日文暫時還難以判斷完整語句的結尾,因此實際辨識結果可能會變成所有語句均連接在一起,難以分辨前後句的情況。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

語言Google

楊又肇

聯合新聞網 (udn.com)數位頻道記者,同時身兼自由寫手與Mashdigi網站 (mashdigi.com)創辦者身分,平常喜歡電玩、科技類新品,以及軟體、網路相關內容,也喜歡隨手撰寫內容介紹新玩意。

更多數位新品、技術介紹與科技趨勢內容:https://mashdigi.com/

熱門文章

夜拍、背光超詳盡評測 外媒:iPhone 11 Pro是最強拍攝手機!

2019-09-19 17:14

歐美都不賣 華為Mate 30卻選在德國慕尼黑辦發表會

2019-09-19 10:48

他批Line「已讀」功能很夭壽 反遭網友酸是好設計

2019-09-19 17:13

華為新旗艦Mate 30 Pro發表了!4800萬畫素、兩側無邊框

2019-09-19 21:09

iPhone 11新機鏡頭充滿驚喜 星空都能捕捉

2019-09-18 23:57

Chrome v77推3項新功能 改善文字傳送消失問題

2019-09-19 13:16

PChome24h購物20日現貨開賣「iPhone 11系列」 10倍備貨量應戰

2019-09-19 17:17

iPhone11明開賣 網家拚北市消費者免出門上午拿新機

2019-09-19 15:03

商品推薦

贊助廣告

商品推薦

留言


Top