網(wǎng)友在 LocalLLaMA 子 Reddit 板塊中發(fā)帖,分享了 4050 億參數(shù)的 Meta Llama 3.1 信息,從該 AI 模型在幾個(gè)關(guān)鍵 AI 基準(zhǔn)測(cè)試的結(jié)果來(lái)看,其性能超越目前的領(lǐng)先者(OpenAI 的 GPT-4o)。
這是開源人工智能社區(qū)的一個(gè)重要里程碑,標(biāo)志著開源模型可能首次擊敗目前最先進(jìn)的閉源 LLM 模型。
如基準(zhǔn)測(cè)試所示,Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd 等多項(xiàng)測(cè)試中均優(yōu)于 GPT-4o,但是,它在 HumanEval 和 MMLU-social sciences 方面卻落后于 GPT-4o。
值得注意的是,這些數(shù)據(jù)來(lái)自 Llama 3.1 的基本模型,意味著后續(xù)通過(guò)調(diào)整優(yōu)化,可以進(jìn)一步釋放該模型的潛力,在上述基準(zhǔn)測(cè)試中邁上更高的臺(tái)階。
注:上圖為機(jī)翻字幕,存在錯(cuò)誤