🎉 Gate xStocks 交易開啓啦,現貨、合約、Alpha齊上線!
📝 在Gate廣場發帖,曬出你的交易體驗或精彩截圖,瓜分$1,000大獎池!
🎁 廣場優質創作者5名,每人獨享$100合約體驗券!
🎉 帖文同步分享到X(推特),瀏覽量前十再得$50獎勵!
參與方式:
1️⃣ 關注 @Gate廣場_Official
2️⃣ 帶 #Gate xStocks 交易体验# ,原創發帖(不少於20字,僅用活動標籤)
3️⃣ 若分享到推特,請將連結提交表單:https://www.gate.com/questionnaire/6854
注:表單可多次提交,發布更多帖文可提升獲獎機會!
📅 7月3日16:00—7月9日24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/45926
每一條體驗,都有機會贏取大獎!快在Gate廣場show出你的操作吧!
AI+Web3:探索分布式激勵在數據、算力與開源模型市場的應用
AI+Web3:塔樓與廣場
TL;DR
AI概念的Web3項目在一二級市場成爲吸金標的。
Web3在AI行業的機會體現在:利用分布式激勵協調長尾潛在供應,涉及數據、存儲和計算;同時建立開源模型和AI Agent的去中心化市場。
AI在Web3行業主要應用於鏈上金融(加密支付、交易、數據分析)以及輔助開發。
AI+Web3的效用體現在兩者的互補:Web3有望對抗AI集中化,AI有望幫助Web3破圈。
引言
近兩年,AI的發展像被按了加速鍵。這場由Chatgpt掀起的浪潮不僅開啓了生成式人工智能的新世界,也在Web3領域掀起了巨浪。
AI概念的加持下,加密市場融資明顯提振。據統計,僅2024上半年就有64個Web3+AI項目完成融資,基於人工智能的操作系統Zyber365在A輪就實現了1億美元的最高融資額。
二級市場更爲繁榮。加密聚合網站Coingecko數據顯示,短短一年多時間,AI賽道總市值已達485億美元,24小時交易量接近86億美元。主流AI技術進展帶來的利好明顯,OpenAI的Sora文本轉視頻模型發布後,AI板塊的平均價格上漲了151%。AI效應同樣輻射至加密貨幣吸金板塊之一Meme:首個AI Agent概念的MemeCoin——GOAT迅速走紅並獲14億美金估值,成功掀起AI Meme熱潮。
關於AI+Web3的研究和話題同樣火熱,從AI+Depin到AI Memecoin再到當前的AI Agent和AI DAO,FOMO情緒已然跟不上新敘事輪換的速度。
AI+Web3這個充滿熱錢、風口和未來幻想的術語組合,難免被視作一場被資本撮合的包辦婚姻。我們似乎很難分辨在這華麗外衣之下,到底是投機者的主場,還是黎明爆發的前夜?
要回答這個問題,一個對雙方都關鍵的思考是:有對方它會變得更好嗎?是否能從對方的模式中受益?本文試圖站在前人肩膀上審視這一格局:Web3如何在AI技術棧各環節發揮作用,AI又能給Web3帶來什麼新生機?
Part.1 AI堆棧下Web3有何機會?
在展開這個話題前,我們需要了解AI大模型的技術棧:
用通俗語言表述整個過程:"大模型"就像人類大腦,早期階段屬於剛降生的嬰兒,需要觀察攝入海量外界信息去理解世界,這就是數據的"收集"階段。由於計算機不具備人類多感官,訓練前外界大規模無標注信息需通過"預處理"轉化爲計算機可理解可用的信息格式。
輸入數據後AI通過"訓練"構建具理解和預測能力的模型,可看作嬰兒逐漸理解學習外界的過程,模型參數如嬰兒學習過程中不斷調整的語言能力。學習內容開始分科,或與人交流獲得反饋並修正,便進入大模型的"微調"環節。
孩童長大會說話後,可在新對話中理解意思並表達感受想法,這階段類似AI大模型的"推理",模型能對新語言文本輸入進行預測分析。嬰兒通過語言能力表達感受、描述物體和解決問題,也類似AI大模型完成訓練投入使用後在推理階段應用於各類特定任務,如圖像分類、語音識別等。
而AI Agent則更趨近大模型的下一形態——能獨立執行任務並追求復雜目標,不僅具備思考能力,還能記憶、規劃,且能運用工具與世界互動。
當前,針對AI在各堆棧的痛點,Web3初步形成了多層次、相互連接的生態系統,涵蓋AI模型流程的各個階段。
一、基礎層:算力與數據的Airbnb
算力
當前,AI的最高成本之一,是訓練模型與推理模型所需的算力與能源。
例如,Meta的LLAMA3需要16000個NVIDIA生產的H100GPU(這是專爲AI和高性能計算工作負載設計的頂級圖形處理單元)30天才能完成訓練。後者80GB版本單價在30,000至40,000美元之間,這需要4-7億美元的計算硬件投資(GPU+網路芯片),同時每月訓練需消耗16億千瓦時,能源支出每月近2000萬美元。
對AI算力的解壓,也正是Web3最早與AI交叉的領域——DePin(去中心化物理基礎設施網路)。目前,DePin Ninja數據網站已列出1400多個項目,其中GPU算力共享代表項目包括io.net、Aethir、Akash、Render Network等。
其主要邏輯在於:平台允許擁有閒置GPU資源的個人或實體以無需許可的去中心化方式貢獻計算能力,通過類似Uber或Airbnb的買賣雙方在線市場,提高未充分利用的GPU資源使用率,終端用戶也因此獲得更低成本的高效計算資源;同時,質押機制確保資源提供者違反質量控制機制或中斷網路時有相應懲罰。
其特點在於:
聚集閒置GPU資源:供應方主要爲第三方獨立中小型數據中心、加密礦場等運營商的過剩算力資源、共識機制爲PoS的挖礦硬件,如FileCoin與ETH礦機。目前也有項目致力於啓動門檻更低的設備,如exolab利用MacBook、iPhone、iPad等本地設備建立運行大模型推理的算力網路。
面對AI算力的長尾市場:
a. "於技術端而言"去中心化算力市場更適合推理步驟。訓練更依賴超大集羣規模GPU帶來的數據處理能力,而推理對GPU運算性能要求相對較低,如Aethir專注於低延遲的渲染工作和AI推理應用。
b. "於需求端而言"中小算力需求方不會單獨訓練自己的大模型,而只是選擇圍繞少數頭部大模型進行優化、微調,而這些場景都天然適合分布式閒置算力資源。
數據
數據是AI的地基。沒有數據,計算就如浮萍之末毫無用處。數據與模型之間的關係就像"Garbage in, Garbage out"那句俗諺,數據的數量與輸入質量決定最終模型的輸出質量。對現AI模型的訓練而言,數據決定了模型的語言能力、理解能力、甚至價值觀以及人性化表現。目前,AI的數據需求困境主要聚焦於以下四方面:
數據飢渴:AI模型訓練依賴大量數據輸入。公開資料顯示,OpenAI訓練GPT-4的參數量就達到了萬億級別。
數據質量:隨着AI與各行業結合,數據時效性、多樣性、垂類數據專業性、新興數據源如社交媒體情緒的攝入對其質量也提出了新要求。
隱私與合規問題:當前各國、企業逐漸注意到優質數據集的重要性,正在對數據集爬取進行限制。
數據處理成本高昂:數據量大,處理過程復雜。公開資料顯示,AI公司超過30%的研發成本用於基礎數據採集、處理。
目前,web3的解決方案體現在以下四個方面:
讓真正貢獻的用戶同樣參與數據帶來的價值創造,以及通過分布式網路與激勵機制,以低成本方式獲取用戶更私人、更具價值的數據,是Web3的願景。
Grass是一個去中心化的數據層和網路,用戶可通過運行Grass節點,貢獻閒置帶寬和中繼流量用以捕獲整個互聯網中的實時數據,並獲取代幣獎勵。
Vana引入了獨特的數據流動性池(DLP)概念,用戶可將私人數據(如購物記錄、瀏覽習慣、社交媒體活動等)上傳至特定DLP,並靈活選擇是否將這些數據授權給特定第三方使用。
在PublicAI中,用戶可在X上使用#AI或#Web3作爲分類標籤並@PublicAI即可實現數據收集。
目前,Grass與OpenLayer都正在考慮加入數據標注這一關鍵環節。
Synesis提出了"Train2earn"概念,強調數據質量,用戶可通過提供標注數據、注釋或其他形式的輸入獲得獎勵。
數據標注項目Sapien將標記任務遊戲化,並讓用戶質押積分以賺取更多積分。
當前Web3較爲普遍的隱私技術包括:
可信執行環境(TEE),例如Super Protocol。
完全同態加密(FHE),例如BasedAI、Fhenix.io或Inco Network。
零知識技術(zk),如Reclaim Protocol使用zkTLS技術,生成HTTPS流量的零知識證明,允許用戶從外部網站安全導入活動、聲譽和身分數據,而無需暴露敏感信息。
不過,目前該領域仍處早期階段,大部分項目仍在探索中,目前困境是計算成本太高,例如:
zkML框架EZKL需約80分鍾才能生成1M-nanoGPT模型的證明。
根據Modulus Labs數據,zkML的開銷比純計算高出1000倍以上。
二、中間件:模型的訓練與推理
開源模型去中心化市場
有關AI模型閉源還是開源的爭論從未消失。開源帶來的集體創新是閉源模型無法比擬的優勢,然而在毫無盈利模式前提下,開源模型如何提高開發者驅動力?是值得思