8 月 2 日消息,荷蘭內(nèi)梅亨大學(xué)近日發(fā)布研究報告,指出 Meta 和 OpenAI 等公司在使用“開源”術(shù)語時容易誤導(dǎo)用戶,部分標(biāo)記為“開源”的大語言模型實際上并非開源的。
該報告特別提及了 Meta 公司的 Llama 2 模型和 OpenAI 的 GPT / codex 模型,表示訓(xùn)練這些大語言模型的代碼并未向公眾開放。
研究人員表示,當(dāng)前 AI 社區(qū)中,缺乏開源大語言模型問題日益突顯。研究人員呼吁公司發(fā)布更多的開源 LLM,以便研究人員和開發(fā)人員可以訪問代碼并提高這些模型的性能。
OpenAI 的 ChatGPT 模型是最“神秘”的,不符合開源標(biāo)準(zhǔn);而 Meta 的 Llama 2 雖然宣稱是“開源”,但實際透明度只是稍微優(yōu)于 ChatGPT 模型,在開源排行榜上的程度依然很低。
研究報告認(rèn)為這些公司主要出于以下幾點(diǎn)原因:
想要保護(hù)自己的知識產(chǎn)權(quán)
想要控制如何使用大語言模型
而研究人員和開發(fā)人員在面臨開源大語言模型上存在天然的弱勢,可能無法研究論文結(jié)果、改進(jìn)現(xiàn)有大語言模型的性能。
Meta 的立場是諷刺的,因為該公司自豪地說,Llama 2 可用于研究。即便如此,該公司似乎仍將該項目的某些部分鎖定在開發(fā)人員和研究人員之外。