Open-AI 剛剛公布了其大型語言模型的最新版本 ——GPT-4(API 候補申請點此)。
GPT-4 可以更準(zhǔn)確地解決你的難題,多模態(tài)的 GPT-4 還可以生成、編輯具有創(chuàng)意性或技術(shù)性的文章,在高級推理方面的表現(xiàn)超過其前輩(當(dāng)前公開版 ChatGPT 基于 GPT-3.5)。當(dāng)然,正如大家所猜測的那樣,微軟 New Bing 的聊天功能確實基于 GPT-4。
此外,該公司正在與合作伙伴 Be My Eyes 一起測試 GPT-4 的圖像輸入能力(注:Be My Eyes 是一款即將推出的智能手機 App,可以識別場景并對其進(jìn)行描述,類似于大家常見的 AI 識圖的加強版)。
除了介紹網(wǎng)站,OpenAI 還提供了描述 GPT-4 功能的技術(shù)性論文,以及詳細(xì)描述其局限性的系統(tǒng)模型 Card。
OpenAI 計劃通過 ChatGPT 及其商業(yè) API 為用戶提供 GPT-4 的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4 目前僅 ChatGPT plus 賬號可用,可選 GPT4 模式進(jìn)行對話,每 4 小時限制發(fā)送 100 條消息。
收費方面,大約 750 個單詞的提示收取約 3 美分的費用,約 750 個單詞的響應(yīng)則收取 6 美分(就是問和答的區(qū)別)。
據(jù)介紹,GPT-4 比以前的版本“更大”,這意味著它已經(jīng)借助比前輩更多的數(shù)據(jù)進(jìn)行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,從而使得它的運行成本更高。
就任務(wù)而言,GPT-4 的表現(xiàn)比前輩更好,它可以遵循自然語言的復(fù)雜指令并生成技術(shù)或創(chuàng)意內(nèi)容,而且它可以還更深入地做到這一點:它支持生成和處理多達(dá) 32768 個標(biāo)記(約 25000 個文本單詞),從而實現(xiàn)比前輩更長的內(nèi)容創(chuàng)建或文本分析。
OpenAI 表示,GPT-4 錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測試中比人類表現(xiàn)得都要更好一些。
例如,GPT-4 在模擬律師考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數(shù)學(xué)考試中排名前 11% 左右。相比之下,GPT-3.5 在律師考試中的得分一般都是倒數(shù) 10% 左右。當(dāng)然,它們考個研究生還是沒問題的。
當(dāng)然,AI 畢竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多場景下的能力都不如人類。
據(jù)稱,該模型仍然存在“幻覺”或編造事實的問題,并且在事實方面也不一定總是可靠的,“它傾向于堅持認(rèn)為它是正確的,即使它錯了”。OpenAI 表示,GPT-4 正在努力解決其局限性,例如社會偏見、幻覺和對抗性提示。