日前,百度智能云方面表示,千帆大模型平臺已完成新一輪升級,重點升級了兩大功能。
據(jù)了解,目前千帆大模型平臺已經(jīng)全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成為國內(nèi)擁有大模型最多的平臺。接入的模型經(jīng)過千帆平臺二次性能增強,模型推理成本最高可降低50%。同時,千帆平臺上線了國內(nèi)最全的預(yù)置Prompt模板,模板數(shù)量多達103個,覆蓋對話、游戲、編程、寫作十余個場景。
2023年3月,百度智能云推出“千帆大模型平臺”,它是全球首個一站式的企業(yè)級大模型平臺,不但提供包括文心一言在內(nèi)的大模型服務(wù)及第三方大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套工具鏈,能夠幫助企業(yè)解決大模型開發(fā)和應(yīng)用過程中的所有問題。
百度智能云方面表示,本次千帆大模型平臺升級的目的是給企業(yè)、開發(fā)者提供更加靈活、多樣化、高效的大模型服務(wù),客戶可選擇最適合自身業(yè)務(wù)的大模型,再利用千帆平臺全套工具鏈進行模型再訓(xùn)練、指令微調(diào)等,高效率、低成本地打造企業(yè)專屬大模型。此外,海量Prompt模板庫可提高大模型內(nèi)容準確性和滿意度。
千帆接入Llama 2等33個優(yōu)質(zhì)模型,推理成本最高可降低50%
當前,開源大模型生態(tài)發(fā)展迅速,大量優(yōu)質(zhì)模型涌現(xiàn),在不同任務(wù)場景、參數(shù)量級與算力環(huán)境下體現(xiàn)出了差異化優(yōu)勢。如何選擇適合的大模型、如何應(yīng)用大模型能力提升市場競爭力,成為越來越多企業(yè)迫切探索的方向。
文心大模型是百度發(fā)布的產(chǎn)業(yè)級知識增強大模型,據(jù)IDC 最新發(fā)布的《AI 大模型技術(shù)能力評估報告,2023》顯示,文心大模型得到“綜合評分第一,算法模型第一,行業(yè)覆蓋第一”三個絕對第一。在文心大模型3.5版支持下的文心一言,中文能力突出,在多個公開測評也顯示有超出 GPT-4 的表現(xiàn)。
為了滿足企業(yè)對大模型多樣的需求,千帆大模型平臺以文心大模型為核心,同時全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成為國內(nèi)擁有大模型最多的平臺。
企業(yè)用戶可將不同大模型搭配使用,以滿足不同細分場景的業(yè)務(wù)需求。企業(yè)和開發(fā)者可以登陸千帆大模型平臺操作臺,在“模型倉庫”中直接調(diào)用、部署。
據(jù)了解,千帆平臺接入的大模型均經(jīng)過嚴格優(yōu)選,主要考核三大指標:模型效果、模型安全性、可商用。為給企業(yè)客戶帶來更好的模型產(chǎn)品,千帆對這33個大模型進行了性能+安全的雙重增強。
一方面,千帆對每一個大模型進行了二次性能增強。通過優(yōu)化模型吞吐、降低模型尺寸,實現(xiàn)模型推理速度的大幅提升。據(jù)測算,調(diào)優(yōu)后模型體積可壓縮至25%-50%,推理性能顯著提升。這意味著,企業(yè)在千帆上調(diào)用這些模型可極大地節(jié)約成本,提升效果。
另一方面,千帆對第三方大模型做了二次安全增強,更好管控模型輸出的安全性?蛻粼谇Х险{(diào)用第三方模型,也享有平臺的安全保障。
值得一提的是,為方便開發(fā)者和企業(yè)做模型調(diào)優(yōu),千帆還提供多種低門檻調(diào)優(yōu)工具,包括SFT(全量參數(shù)微調(diào)、Prompt Tuning、LoRA)及強化學(xué)習(xí)(獎勵模型學(xué)習(xí)、強化學(xué)習(xí)訓(xùn)練)等,同一模型可通過多種方式持續(xù)調(diào)優(yōu)。此外,千帆還支持數(shù)據(jù)回流功能,可在實際生產(chǎn)過程中持續(xù)微調(diào),提升模型效果。
上線國內(nèi)最全Prompt海量模板庫,大幅優(yōu)化模型輸出效果
Prompt是指通過自然語言向大模型提出問題/提示,幫助大模型更好的理解人類的問題。實際應(yīng)用時,大模型往往因為Prompt缺乏針對性、描述不清晰等原因影響到內(nèi)容準確性。
為幫助客戶提高Prompt提問質(zhì)量、提升模型輸出滿意度,本輪升級后,百度智能云千帆大模型平臺上線了海量預(yù)置Prompt模板庫,模板數(shù)量多達103個,包含對話、編程、電商、醫(yī)療、游戲、翻譯、演講等十余個常見場景。用戶可以根據(jù)需求選擇合適的模板,直接輸出給大模型, 即可提高模型內(nèi)容的針對性和準確度。
百度智能云表示,很多企業(yè)使用大模型時,認為效果不好是模型本身的問題,其實很多時候重新編寫Prompt就能達到預(yù)想的效果。海量Prompt模板的推出,大幅降低了Prompt撰寫難度。很多情況下,企業(yè)無需花費大量資源調(diào)優(yōu)大模型,基于模板優(yōu)化Prompt,即可得到滿意的模型效果。
如今,大模型正在重塑各行各業(yè),進入產(chǎn)業(yè)落地期。為降低大模型使用門檻,千帆大模型平臺將持續(xù)匯聚優(yōu)質(zhì)的大模型資源,提供易用可靠的大模型工具鏈,幫助每個企業(yè)、開發(fā)者打通擁抱大模型的最短路徑,共同探索大模型與行業(yè)結(jié)合的創(chuàng)新實踐。