6月底,全球數據分析領域徹底炸鍋了。
兩大數據分析企業Databricks和Snowflake紛紛將目光瞄准了AI大模型。要知道,這兩位對手平時沒少對台戲,爲性能、產品和技術經常开撕。但在今年的自家大會上,兩家企業卻出奇的一致,不約而同將主題定位爲:Data+AI,並且宣布巨資加碼AI大模型!
先是Databricks宣布以13億美元收購AI大模型初創公司MosaicML,成爲今年以來生成式AI領域內公布的最大一筆收購案。後是Snowflake宣布與NVIDIA合作,共同聚焦AIGC和專有大模型的开發。
可能有人會認爲,數據分析企業“參和”到AI大模型領域,不是來添亂就是用於資本市場炒作。不過在筆者看來,數據分析企業們巨資加碼AI大模型的背後,恰恰是大數據、人工智能技術經過多年發展與積累之後,數智生產力逐漸深入人心,如何高效、安全、便捷地釋放數智生產力已成爲數智時代千行百業的一道必答題。
Data+AI的本質:釋放數智生產力
Databricks斥巨資收購AI大模型的背後邏輯是什么?
這其實是Data+AI的融合大趨勢。
衆所周知,進入到數字經濟時代,數據已被公認爲新的核心生產要素,而AI則被視爲具有變革性的生產工具,二者結合有望真正帶來生產力的飛躍。業界稱之爲釋放數智生產力。
但高效、安全、便捷地釋放數智生產力絕非易事。隨着海量數據的增長,以及數據技術、人工智能技術的不斷迭代與演進,千行百業的用戶們也面臨着極爲復雜的局面:
其一、數據走向海量化和多樣化,數據分析和各類模型也趨於復雜化。以OpenAI GPT大模型爲例,近年來每一代GPT模型的參數規模呈指數級增加。如今,市場中千億級的AI大模型屢見不鮮。
現在,訓練一個大模型不僅需要耗費巨大的硬件成本,更需要花費大量精力在數據處理、訓練等環節,這讓很多用戶對於AI大模型抱着“想用卻不敢用”的心態。
其二、大量智慧場景的湧現,反向推動了更多的數據訓練、推理和分析的需求,這對於數據處理、分析等環節要求會越來越高。而在行業領域,各個業務場景嘗試接入AI大模型,除了會帶來釋放生產力之外,還會將數據處理等環節的要求提升到新的高度。數據處理、分析等需要走向自動化、智能化。
其三、數據消費群體持續擴大,帶來了前所未有的數據消費局面。過去,數據消費群體往往是少數管理層;現在,大量的業務場景中均需要對數據進行分析、挖掘,這極大推動了數據消費群體的增加。比如,中國的一些股份制銀行或者大型制造企業,其數據消費的月活員工早已過萬,並且員工佔比還在持續提升,在日常業務場景中,“用數”已經融入到各類員工的工作之中。
事實上,爲了更好地幫助用戶們高效、安全、便捷地釋放數智生產力,數據分析企業這些年在加速推動Data+AI的融合。比如,集成TensorFlow等流行AI框架,支持機器學習工具的开發等。如今,布局AI大模型更像是Data+AI趨勢的進一步演進,水到渠成和順理成章。
那么,生成式AI或者AI大模型會對數據分析帶來哪些改變?
首先,AI的融合一定會讓數據分析的方式更加智能和便捷,持續降低數據消費和使用的門檻,而生成式AI或者AI大模型則會加速數據分析的智能化,且會對數據分析、智能用數方式帶來革命性的影響。
例如,在查詢和檢索、數據清洗和准備、分析和可視化等諸多環節融入生成式AI能力,讓數據分析極爲簡單與便捷。以數據分析需求的流轉爲例,過去以以人和人的對話、人和數據平台 GUI的互動過程來完成,業務人員、數據分析師和數據工程師之間需要形成從解釋需求到反饋方案的循環,且是預設流程,過程復雜、效率低下且優化迭代困難。
而將生成式AI融入之後,真正改變了過去輸入方式、交互方式,可以讓數據分析更好地契合用戶想法。
國內領先的大數據分析和指標平台廠商 Kyligence是業界最早探索Data+AI的突出代表。早在 2019 年,Kyligence 就推出了 AI 增強引擎,可以根據實際的數據特徵和查詢習慣等主動分析業務用數模式,以實現數據模型自適應匹配業務查詢需求,將高度依賴專家且工作量巨大的的數據建模开發與設計等工作變成自動化和智能化。
無疑,生成式AI和AI大模型的融入,帶來更加出色的自然語言理解准確度、思考推理能力和以及自然語言的輸出,除了進一步讓數據分析加速走向智能化之外,也會徹底影響數據分析、數據消費、用數交互等方式,帶來變革性的改變。
當下,無論是雲服務商,還是數據分析企業,均認可生成式AI融入到數據分析之中,且在加速布局。據悉,在7月14日即將舉辦的Kyligence用戶大會上,Kyligence將帶來Data+AI的重磅新品,目標直指大模型時代下的智能用數。
其次,生成式AI或者AI大模型與數據分析平台的結合,未來會讓行業的專有大模型訓練、推理等變得更加簡單,大模型成本未來有望大幅下降。
當前,大模型的訓練與推理依然是一項復雜且成本高昂的工作,動輒數百萬美元的訓練和研發費用,讓很多用戶都叫苦不迭,降門檻和降成本對很多用戶而言將是善莫大焉。
有專家就認爲,數據分析平台和大模型技術的結合,未來有望讓企業可以使用自己的專有數據來簡單、快速、低成本進行生成式AI模型的訓練和構建,在讓用戶擁有數據的控制權和所有權的情況下,便捷進行自定義AI模型的开發。
可以說,隨着生成式AI的融入,Data+AI正在加速开啓新時代,釋放數智生產力也指日可待。
如何釋放數智生產力:看這裏,上海見!
著名AI專家吳恩達認爲,隨着开源AI算法的普及,成功運用AI技術的關鍵是數據爲中心的AI (Data-centric AI)。深以爲然。
今年6月底,13億美元的收購案爲Data+AI打響了第一槍。隨着生成式AI、AI大模型开始與數據分析相結合,Data+AI的核心依然是以數據爲中心。接下來,Data+AI會對數據分析的交互方式、企業數據使用方式甚至專有大模型的建立等帶來哪些新變化和新影響?
即將在7月14日舉辦的2023 Kyligence用戶大會值得密切關注。Kyligence由 Apache Kylin 創始團隊於 2016 年創辦,是目前領先的大數據分析和指標平台供應商,連續三年進入Gartner 增強數據分析推薦廠商。
Kyligence在Data+AI的布局,表明中國數據分析企業一直走在業界變革的最前沿,對於AI大模型帶來的數據分析交互革命、智能用數同樣有着前瞻性的探索和布局。
據悉,在2023 Kyligence用戶大會上,Kyligence 將會發布 Data + AI 的重磅新產品。此外,本次大會還將雲集海內外行業領袖、技術專家、企業高管以及合作夥伴。此外,來自中金、德邦、平安銀行、中信銀行、三一重工、亞馬遜雲科技等多個領域的專家將分享 Data + AI 領域的諸多重磅內容。
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:13 億美金买個寂寞?No!AI 時代的數據行業蓄勢待發
地址:https://www.twetclubs.com/post/16178.html