DeepSeek如AI界TikTok！技術...

上個月，中國科技新創公司「深度求索」（DeepSeek）在全球科技界掀起波瀾，有人工智慧（AI）領域的專家指出，這可能只是DeepSeek對AI領域影響的開端，而在不久的將來，可能又會有新一波AI推理模型問世，「未來12個月內， DeepSeek將被其他東西取代。」

我是廣告請繼續往下閱讀 DeepSeek R1 模型引發關注

根據美國有線電視新聞網（CNN）報導，DeepSeek在1月底推出的AI模型R1，轟動了全球科技界而登上新聞版面。該公司聲稱，R1模型的表現大致可與OpenAI的o1模型相匹敵，但成本僅為其一小部分。當DeepSeek短暫取代ChatGPT成為蘋果App Store下載榜首時，科技股應聲下跌。

報導指出，這促使美國科技巨頭重新審視美國在AI競賽中對抗中國的地位，以及投入該領域的巨額資金。

專家指出，DeepSeek的R1模型影響不僅來自其高效與強大性能。其推理與「思考」能力能產出高品質結果，而該公司決定將技術的關鍵部分公開，也將進一步推動AI領域的發展。

儘管AI長期以來已被應用於科技產品，但近兩年，隨著ChatGPT及其他生成式AI服務的崛起，這一領域迎來了突破性的轉折點，徹底改變了人們的工作、交流與獲取資訊的方式。AI的發展讓像輝達（Nvidia）這樣的晶片製造商成為華爾街的寵兒，也改變了矽谷科技巨頭的發展路線。因此，任何能夠促進更強大、更高效AI模型的技術突破，都將受到密切關注。

艾倫人工智慧研究所（Allen Institute for Artificial Intelligence）前執行長埃齊奧尼（Oren Etzioni）表示，「這絕對不是炒作，但這也是一個發展極快的世界。」

AI的TikTok時刻

科技業領導者們迅速對DeepSeek的崛起做出回應。Google DeepMind執行長哈薩比斯（Demis Hassabis）雖然認為關於DeepSeek的炒作「被誇大了」，但他仍表示，這可能是「我見過的中國AI領域最出色的成果」。

然而，DeepSeek也並非只受到正面關注。半導體研究機構SemiAnalysis質疑DeepSeek所聲稱的560萬美元訓練成本是否屬實。OpenAI則向金融時報表示，他們發現DeepSeek可能利用OpenAI的模型來訓練其競爭產品。

此外，美國已有兩名國會議員呼籲禁止政府設備上使用該應用，原因是安全研究人員發現 DeepSeek可能與中國政府有關聯。類似的擔憂也曾圍繞著熱門社交媒體應用TikTok，而TikTok目前正面臨出售給美國企業或是在美國被禁用的處境。

埃齊奧尼指出，「DeepSeek 就是大語言模型（LLM）領域的 TikTok。」

科技巨頭們已開始思考，如何將DeepSeek的技術應用於自家產品與服務。 AI開發平台Hugging Face資深研究科學家坦斯托爾（Lewis Tunstall）表示，DeepSeek以技術報告的形式提供解決方案，卻沒有提供額外缺失部分。

報導指出，DeepSeek的模型並非唯一的開源模型，也不是第一個能在回答問題前進行推理的AI，去年的OpenAI o1模型也具備這項能力。但DeepSeek能夠從其他模型學習並進行推理，同時AI社群也能夠窺探其技術背後的運作機制。

坦斯托爾認為，不久的將來，可能會看到擁有與DeepSeek類似的推理能力的一波新模型誕生。因為科技巨頭正競相打造AI代理，矽谷普遍認為AI代理是聊天機器人下一個發展方向，也是消費者與裝置互動的方式，只是這種轉變還沒有完全發生。

埃齊奧尼表示，「我敢肯定，在未來12個月內，它將被某個新技術取代。但這次的進展是確實存在的。」

關鍵字