快訊

傅崐萁出訪 柯文哲:陸若梭哈「這3張牌」 就換台灣壓力大

台商返台資金活水注入房市、創造上兆元潛在購買力?央行發聲了

獨/開發金董事會決議 將向金管會申請更名為「凱基金控」

Meta AI MMS模型 可辨識全球超過4000種語言

Meta大規模多語言語音模型擴語音技術的應用範圍,從100種語言,至今已可轉換超過1100種語言。圖/Meta提供
Meta大規模多語言語音模型擴語音技術的應用範圍,從100種語言,至今已可轉換超過1100種語言。圖/Meta提供

世界上許多語言正面臨消失危機,Meta今日宣布,旗下大規模多語言語音模型(MSS)能擴展文字轉語音及語音轉文字技術應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,是過去的10倍,此外,還能夠辨識超過4000種口語語言,是過去的40倍。

Meta指出,這項技術已有許多應用案例,從 VR(虛擬實境)、AR(擴增實境) 至訊息服務,不僅能夠使用偏好的語言操作,更可理解每個人的聲音。Meta將開放這項技術的原始碼及模型,讓研究社群能以現有工作成果為基礎繼續開發,一同保存全球的言,拉近人們的距離。

過去,大型語音資料庫最多僅能涵蓋100種語言,因此,Meta開發此技術所面臨的第一個挑戰,即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文的「聖經」,作為語言文字訓練資料。

聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。

Meta指出,雖然資料集收錄聲音以男性居多,但測試成果顯示,不論是男性或女性的聲音,此語音模型皆能同等準確地辨識。此外,上述的語言訓練資料大多為宗教相關的內容,但分析顯示,這並不會使模型傾向生成出更多的宗教性質語言。

Meta表示,將持續擴增大規模多語言語音模型涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。

Meta 社群

延伸閱讀

5/23【早晨財經速解讀】外銷訂單續衰退 牛市開啟or反彈尾聲?股債賣壓將再現?

台積電ADR跌0.9% 較台北交易溢價6%

那斯達克收在今年最高 債務僵局陰影下大型股成避風港

媒體議價立法 主責機關要拿出擔當

相關新聞

台積電首度發表2奈米強化版A16新型晶片製造技術

台積電在美國當地時間24日舉辦2024年北美技術論壇,會中揭示其最新的製程技術、先進封裝技術、以及三維積體電路(3D I...

魏哲家出席北美技術論壇 台積電2026年完成矽光子整合

台積電於美國時間24日舉辦北美技術論壇,發表A16技術,預計2026年量產,屆時將邁入埃米世代。2025年完成緊湊型通用...

鴻海首部國產電動車上陣 展示完整電動車生態系

「2024 臺北國際車用電子展」17日於南港展覽館1館舉行。鴻海(2317)作為主要參展廠商,圍繞集團智慧電動車平台,進...

台積電下屆董事候選人名單出爐!林全與二外籍女獨董入列

台積電今日宣布十位董事被提名人,包括三位現任董事魏哲家、曾繁城、龔明鑫,四位現任獨立董事彼得‧邦菲爵士、麥克‧史賓林特、...

晶圓代工廠業者世界先進:電價若調漲15% 今年毛利率影響0.5%到1%

專業8吋晶圓代工廠世界先進董事長方略今日表示,政府決定宣布調漲電價,世界內部估算,若電價漲幅15%,世界因是用電大戶,一...

台積掀雲嘉搶水大戰 嘉義設廠向雲林借水

台積電將在嘉義科學園區設置兩座CoWos先進製程封裝廠,第一廠預計二○二八年量產,屆時每天需三點三萬公噸用水,水利署計畫...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。