商業財經

鴻海推AI大語言模型FoxBrain!技術亮點有哪些?架構、開源一次看

鴻海於今(10)日上午宣布,旗下鴻海研究院推出首款具有推理能力的AI繁體中文大型語言模型,內部開發代碼「FoxBrain」。FoxBrain是以高效率、低成本的模型訓練方式,專注於訓練過程優化,採用何種基礎架構?未來是否開源?《NOWnews今日新聞》帶您一次看懂!

我是廣告 請繼續往下閱讀 FoxBrain後續將對外開源!技術亮點有哪些?

鴻海研究院(HHRI)宣布推出首款繁體中文AI大型語言模型「FoxBrain」,此模型原為內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。

FoxBrain以優異的運算成本,於四週內完成訓練,鴻海表示,FoxBrain作為鴻海研究院AI推理LLM模型訓練成果,展現了強大的理解與推理能力,還能針對台灣使用者的語言風格進行優化,並在數學與邏輯推理測試中表現出色。

打造具備強大推理能力的本土AI模型 鴻海怎麼做到的?

鴻海研究院人工智慧研究所慄永徽所長指出,近幾個月,推理能力的深化以及GPU的高效運用逐漸成為AI領域發展主流,FoxBrain模型採用高效訓練策略,專注於訓練過程優化而非盲目堆砌算力。通過精心設計的訓練方法和資源優化,打造出具備強大推理能力的本土AI模型。

FoxBrain訓練過程中,使用120張「NVIDIA H100 GPU」,並透過NVIDIA Quantum-2 InfiniBand網路進行擴展,僅花約四周的時間完成,相較於近期其他公司所推出的推理模型,以更高效率,更低成本的模型訓練方式為台灣AI技術發展樹立新裏程碑。

FoxBrain採用Meta Llama 3.1為基礎架構,擁有70B參數,在TMMLU+測試資料集,大多數的領域優於國內相同規模的Llama-3-Taiwan-70B。

數學推理能力超越Meta同等級模型 與DeepSeek蒸餾模型有些微差距

在測試結果方面,鴻海提到,FoxBrain於數學領域較基礎模型Meta Llama 3.1全面提升,相較於目前最好的繁體中文大模型Taiwan Llama在數學測試中取得顯著進步 ,並在數學推理能力上超越Meta目前已推出的同等級模型,雖與 DeepSeek的蒸餾模型仍有些微差距,但表現已相當接近世界領先水準。

導入AI大型語言模型 優化鴻海3平台提升公司營運

鴻海指出,FoxBrain模型雖然起源於鴻海研究院為集團內部應用而設計,未來,鴻海將持續與技術夥伴合作,對外開源分享,擴大FoxBrain模型運用範圍,共同推動AI在製造業、供應鏈管理與智慧決策領域的應用。

鴻海未來將透過導入AI大型語言模型,優化智慧製造、智慧電動車、智慧城市等3大平台的數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,進一步提升公司營運效益。

鴻海表示,FoxBrain成果將於美國時間3月17日起登場的輝達年度GTC大會專題演講中,首次對外發表。

關鍵字
  • 鴻海
  • 鴻海AI大語言模型
  • Meta
  • DeepSeek
  • 鴻海FoxBrain

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。


標題:鴻海推AI大語言模型FoxBrain!技術亮點有哪些?架構、開源一次看

地址:https://www.twetclubs.com/post/95386.html