11月14日,擁有千億參數(shù)的夸克自研大模型正式發(fā)布,立刻占據(jù)CMMLU榜單第一名。夸克大模型將應(yīng)用于通用搜索、醫(yī)療健康、教育學(xué)習(xí)、職場(chǎng)辦公等多個(gè)場(chǎng)景。性能方面,其整體水平已經(jīng)超過(guò)GPT-3.5,其中在寫作、考試等部分場(chǎng)景中可以超過(guò)GPT-4,成為國(guó)產(chǎn)大模型中名副其實(shí)的“學(xué)霸”。
評(píng)測(cè)成績(jī)顯示,夸克大模型在發(fā)布后一舉登頂CMMLU榜單,平均分達(dá)到77.08分,在社會(huì)科學(xué)和其他兩個(gè)類別中分別斬獲第一。在國(guó)內(nèi)專業(yè)考試測(cè)試中,夸克大模型取得高考滿分的成績(jī),還通過(guò)了臨床執(zhí)業(yè)醫(yī)師資格考試。一系列優(yōu)異成績(jī)的背后,是夸克在大模型技術(shù)研發(fā)方面的戰(zhàn)略定力與持續(xù)投入。經(jīng)過(guò)多年發(fā)展,夸克積累的四方面優(yōu)勢(shì),才是培養(yǎng)出這位“新學(xué)霸”的原動(dòng)力。
首先,夸克大模型擁有的海量數(shù)據(jù)優(yōu)勢(shì),基于智能化的搜索能力和自然語(yǔ)言處理技術(shù),夸克擁有最完整的中文數(shù)據(jù)庫(kù),在每天數(shù)以億計(jì)的信息處理后,能更好地理解、評(píng)估、提煉中文知識(shí)體系,了解不同用戶對(duì)工作、學(xué)習(xí)、生活上的真實(shí)需求。這些搜索請(qǐng)求和大數(shù)據(jù)也組成了夸克大模型的第一層優(yōu)勢(shì)。
第二,夸克在教育、醫(yī)療、文檔等垂直領(lǐng)域上的優(yōu)勢(shì)可以繼續(xù)在大模型領(lǐng)域發(fā)揮作用。目前,夸克自建及擁有各類題庫(kù)、知識(shí)點(diǎn)、醫(yī)療知識(shí)圖譜、書(shū)籍及出版物等資料,沉淀了非常豐富的數(shù)據(jù)及用戶場(chǎng)景,無(wú)論是考試資料還是硬核知識(shí),夸克都構(gòu)建了一套完整的知識(shí)內(nèi)容體系,在大模型原生應(yīng)用落地的過(guò)程中,將進(jìn)一步提升用戶效率。
第三,夸克通過(guò)技術(shù)能力可以更好地識(shí)別知識(shí)正確性。尤其在通用知識(shí)、圖文知識(shí)、專業(yè)知識(shí)、推理知識(shí)、寫作增強(qiáng)等方面,夸克建立了從內(nèi)容、搜索再到推理的一套可辨別知識(shí)真?zhèn)蔚募夹g(shù)體系,讓大模型提供的內(nèi)容更具有準(zhǔn)確性和專業(yè)性。
第四,就是夸克的平臺(tái)優(yōu)勢(shì)。據(jù)悉,為了實(shí)現(xiàn)全棧自研的技術(shù)路線,夸克搭建數(shù)百人規(guī)模的獨(dú)立產(chǎn)研團(tuán)隊(duì),每天處理過(guò)億級(jí)別的實(shí)時(shí)數(shù)據(jù)。同時(shí),在搜索、教育醫(yī)療垂直業(yè)務(wù),有行業(yè)團(tuán)隊(duì)會(huì)根據(jù)用戶需求的變化,進(jìn)行大模型的預(yù)訓(xùn)練與精調(diào),以幫助用戶解決生活中面臨的實(shí)際問(wèn)題。
在國(guó)內(nèi)大模型賽道持續(xù)火爆的當(dāng)下,夸克為什么能做出千億級(jí)參數(shù)的自研大模型?夸克技術(shù)負(fù)責(zé)人表示,堅(jiān)持自研大模型的研發(fā)路線是服務(wù)于夸克的業(yè)務(wù)戰(zhàn)略,也是持續(xù)推動(dòng)夸克App在產(chǎn)品體驗(yàn)創(chuàng)新和邁向新一代搜索的技術(shù)底座。
作為近年來(lái)成長(zhǎng)速度最快的互聯(lián)網(wǎng)產(chǎn)品之一,夸克App在跨場(chǎng)景應(yīng)用上引領(lǐng)行業(yè)風(fēng)向。根據(jù)QuestMobile發(fā)布的《2023年輕人群智能效率應(yīng)用研究》報(bào)告顯示,夸克App在泛學(xué)生人群和新生代職場(chǎng)人群的用戶占比最高,年輕用戶使用時(shí)長(zhǎng)位列行業(yè)第一。
去年底ChatGPT掀起新一輪人工智能熱潮以來(lái),業(yè)內(nèi)就有觀點(diǎn)認(rèn)為,以搜索為代表的信息服務(wù)場(chǎng)景是大模型開(kāi)發(fā)及應(yīng)用的最佳平臺(tái)。大模型產(chǎn)品仍在跑馬圈地,夸克大模型依托四大優(yōu)勢(shì),發(fā)布千億級(jí)參數(shù)的大模型,或?qū)㈤_(kāi)啟AIGC信息服務(wù)新風(fēng)向,更精準(zhǔn)、高效地滿足用戶解決實(shí)際問(wèn)題的需求。