我是廣告 請繼續往下閱讀 DeepSeek R1 模型引發關注
根據美國有線電視新聞網(CNN)報導,DeepSeek在1月底推出的AI模型R1,轟動了全球科技界而登上新聞版面。該公司聲稱,R1模型的表現大致可與OpenAI的o1模型相匹敵,但成本僅為其一小部分。當DeepSeek短暫取代ChatGPT成為蘋果App Store下載榜首時,科技股應聲下跌。
報導指出,這促使美國科技巨頭重新審視美國在AI競賽中對抗中國的地位,以及投入該領域的巨額資金。
專家指出,DeepSeek的R1模型影響不僅來自其高效與強大性能。其推理與「思考」能力能產出高品質結果,而該公司決定將技術的關鍵部分公開,也將進一步推動AI領域的發展。
儘管AI長期以來已被應用於科技產品,但近兩年,隨著ChatGPT及其他生成式AI服務的崛起,這一領域迎來了突破性的轉折點,徹底改變了人們的工作、交流與獲取資訊的方式。AI的發展讓像輝達(Nvidia)這樣的晶片製造商成為華爾街的寵兒,也改變了矽谷科技巨頭的發展路線。因此,任何能夠促進更強大、更高效AI模型的技術突破,都將受到密切關注。
艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)前執行長埃齊奧尼(Oren Etzioni)表示,「這絕對不是炒作,但這也是一個發展極快的世界。」
AI的TikTok時刻
科技業領導者們迅速對DeepSeek的崛起做出回應。Google DeepMind執行長哈薩比斯(Demis Hassabis)雖然認為關於DeepSeek的炒作「被誇大了」,但他仍表示,這可能是「我見過的中國AI領域最出色的成果」。
然而,DeepSeek也並非只受到正面關注。半導體研究機構SemiAnalysis質疑DeepSeek所聲稱的560萬美元訓練成本是否屬實。OpenAI則向金融時報表示,他們發現DeepSeek可能利用OpenAI的模型來訓練其競爭產品。
此外,美國已有兩名國會議員呼籲禁止政府設備上使用該應用,原因是安全研究人員發現 DeepSeek可能與中國政府有關聯。類似的擔憂也曾圍繞著熱門社交媒體應用TikTok,而TikTok目前正面臨出售給美國企業或是在美國被禁用的處境。
埃齊奧尼指出,「DeepSeek 就是大語言模型(LLM)領域的 TikTok。」
科技巨頭們已開始思考,如何將DeepSeek的技術應用於自家產品與服務。 AI開發平台Hugging Face資深研究科學家坦斯托爾(Lewis Tunstall)表示,DeepSeek以技術報告的形式提供解決方案,卻沒有提供額外缺失部分。
報導指出,DeepSeek的模型並非唯一的開源模型,也不是第一個能在回答問題前進行推理的AI,去年的OpenAI o1模型也具備這項能力。但DeepSeek能夠從其他模型學習並進行推理,同時AI社群也能夠窺探其技術背後的運作機制。
坦斯托爾認為,不久的將來,可能會看到擁有與DeepSeek類似的推理能力的一波新模型誕生。因為科技巨頭正競相打造AI代理,矽谷普遍認為AI代理是聊天機器人下一個發展方向,也是消費者與裝置互動的方式,只是這種轉變還沒有完全發生。
埃齊奧尼表示,「我敢肯定,在未來12個月內,它將被某個新技術取代。但這次的進展是確實存在的。」
關鍵字
- DeepSeek
- ChatGPT
- AI競賽
- OpenAI
- AI推理模型
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:DeepSeek如AI界TikTok!技術震撼全球 專家:12個月內恐遭取代
地址:https://www.twetclubs.com/post/93763.html