聽新聞
0:00 /
0:00
AI模型抄襲阿里通義千問?華為盤古團隊否認

華為人工智慧研究部門駁斥網上有關其盤古大語言模型抄襲阿里巴巴模型的指控,稱其為自主研發並獨立訓練的模型。
據快科技和澎湃新聞報導,開源平台GitHub一項研究稱,華為盤古大模型與阿里通義千問Qwen-2.5 14B模型在注意力參數分布上有相關性,超正常範圍。
這項研究稱,這種相似性表明華為的模型可能是「再加工」(upcycling)而來,而非從頭訓練而成。該指控在人工智能圈子和中文科技媒體中引發廣泛討論。
針對質疑,華為諾亞方舟實驗室5日發布聲明稱,盤古Pro MoE開源模型是基於昇騰硬件平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。
盤古團隊在聲明中稱,盤古Pro MoE開源模型部分基礎組件的代碼實現參考了業界開源實踐,涉及其他開源大模型的部分開源代碼。盤古團隊嚴格遵循開源許可證的要求,在開源代碼文件中清晰標註開源代碼的版權聲明。
路透報導,華為早在2021年就推出初代盤古模型,較早進入大模型領域,但其後一直被外界視為在這一賽道上落後於競爭對手。今年6月底,華為將「盤古Pro Moe」模型開源,發布在中國開發者平台GitCode上,意在通過免費開放加快AI技術的推廣與應用。
相較而言,阿里的「通義千問」更偏向面向消費者市場,具有類似ChatGPT的聊天功能,華為的盤古系列則更多應用於政務、金融、製造等行業場景。
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言