首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

各大AI模型訓練成本大比拼:谷歌Gemini Ultra高達1.9億美元

2024年6月6日 07:53  新浪科技  

像OpenAI的ChatGPT、谷歌(177.07, 1.94, 1.11%)的Gemini Ultra這樣的高級AI模型,訓練它們通常需要數(shù)百萬美元的費用,且該成本還在迅速上升。

隨著計算需求的增加,訓練它們所需的計算能力的費用也在飆升。為此,AI公司正在重新考慮如何訓練這些生成式AI系統(tǒng)。在許多情況下,這些策略包括在當前的增長軌跡下降低計算成本。

訓練成本是如何確定的?

斯坦福大學與研究公司Epoch AI合作,根據(jù)云計算租金估算了AI模型的訓練成本。雙方所分析的關(guān)鍵因素包括模型的訓練時長、硬件的利用率和訓練硬件的價值。

盡管許多人猜測,訓練AI模型的成本變得越來越高,但缺乏全面的數(shù)據(jù)來支持這些說法。而斯坦福大學發(fā)布的《2024年AI指數(shù)報告》正是支持這些說法的罕見來源之一。

不斷膨脹的訓練成本

去年,OpenAI的GPT-4培訓成本估計為7840萬美元,遠高于谷歌PaLM (540B) 的訓練成本。谷歌PaLM較GPT-4僅早一年推出,但訓練成本為1240萬美元。

相比之下,2017年開發(fā)的早期AI模型Transformer的訓練成本為930美元。該模型在塑造當前所使用的許多大型語言模型的體系結(jié)構(gòu)方面起著基礎(chǔ)性作用。

谷歌的AI模型Gemini Ultra的訓練成更高,達到了驚人的1.91億美元。截至2024年初,該模型在幾個指標上都超過了GPT-4,最引人注目的是在“大規(guī)模多任務(wù)語言理解”(MMLU)基準測試中勝出。這一基準是衡量大型語言模型能力的重要標尺。例如,它以評估57個學科領(lǐng)域的知識和解決問題的熟練程度而聞名。

訓練未來的AI模型

鑒于這些挑戰(zhàn),AI公司正在尋找新的解決方案來訓練語言模型,以應(yīng)對不斷上漲的成本。

其中的方法有多種,比如創(chuàng)建用于執(zhí)行特定任務(wù)的較小模型,而其他一些公司正在試驗創(chuàng)建自家的合成數(shù)據(jù)來“投喂”AI系統(tǒng)。但到目前為止,這方面還沒有取得明確的突破。

例如,使用合成數(shù)據(jù)的AI模型有時會“胡言亂語”,引發(fā)所謂的“模型崩潰”。

編 輯:魏德齡
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信董事長柯瑞文:天翼云作為國家云已經(jīng)越過向智能云發(fā)展的拐點
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像