網(wǎng)友在 LocalLLaMA 子 Reddit 板塊中發(fā)帖,分享了 4050 億參數(shù)的 Meta Llama 3.1 信息,從該 AI 模型在幾個關(guān)鍵 AI 基準(zhǔn)測試的結(jié)果來看,其性能超越目前的領(lǐng)先者(OpenAI 的 GPT-4o)。
這是開源人工智能社區(qū)的一個重要里程碑,標(biāo)志著開源模型可能首次擊敗目前最先進(jìn)的閉源 LLM 模型。
如基準(zhǔn)測試所示,Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd 等多項測試中均優(yōu)于 GPT-4o,但是,它在 HumanEval 和 MMLU-social sciences 方面卻落后于 GPT-4o。
值得注意的是,這些數(shù)據(jù)來自 Llama 3.1 的基本模型,意味著后續(xù)通過調(diào)整優(yōu)化,可以進(jìn)一步釋放該模型的潛力,在上述基準(zhǔn)測試中邁上更高的臺階。
注:上圖為機(jī)翻字幕,存在錯誤