飛象網(wǎng)訊 近日,科大訊飛董事長劉慶峰在公司成立 25 周年司慶活動(dòng)上透露,訊飛星火 V4.0 發(fā)布時(shí)將展示最新的端到端智能語音落地成果,同時(shí)公司的端到端的語音技術(shù)建模方案也排在計(jì)劃中,預(yù)計(jì)三季度推向市場。
除此之外,科大訊飛還將提供GPT-4o沒有的一句話復(fù)刻、高噪音場景語音識(shí)別、多方言多語種免切換功能。
在劉慶峰看來,OpeanAI 發(fā)布 GPT-4o 對(duì)萬物互聯(lián)時(shí)代語音浪潮的推動(dòng),類似于當(dāng)年 Siri 對(duì)語音應(yīng)用的推動(dòng)。它備受關(guān)注的原因有幾個(gè)點(diǎn):超擬人合成,使得說話不再是朗讀腔調(diào),而是真的像人一樣自由對(duì)話;全雙工交互,可以同時(shí)(瞬時(shí))進(jìn)行信號(hào)的雙向傳輸,人機(jī)對(duì)話可以隨時(shí)打斷和繼續(xù);通過語音到語音的端到端建模,實(shí)現(xiàn)快速反應(yīng)的極致交互體驗(yàn)。
劉慶峰透露,下一步,科大訊飛將發(fā)力遠(yuǎn)場高噪音多人說話場景、高表現(xiàn)力個(gè)性化場景、云邊端一體化、軟硬件一體化,從技術(shù)優(yōu)勢、市場先機(jī)、落地成效構(gòu)建全方位持續(xù)領(lǐng)先優(yōu)勢。據(jù)他介紹,在5月底上線的訊飛星火V3.5 Max版本,已在文本生成、知識(shí)問答、邏輯推理、數(shù)學(xué)能力上超越GPT-4 Turbo 0429的最新版本。