訊飛星火V4.0整體超越GPT-4 Turbo,8個國際權威測試集測評第一

訊飛星火V4.0來了!6月27日,科大訊飛在北京發佈訊飛星火大模型V4.0及相關落地應用。訊飛星火V4.0七大核心能力全面提升,整體超越GPT-4 Turbo,在8個國際主流測試集中排名第一,國內大模型全面領先。

大模型個性化時代到來!訊飛星火APP/Desk全新升級,發佈“個人空間”,打造更懂你的AI助手;面向專業領域的個性化應用,科大訊飛昇級訊飛曉醫APP,上線個人數字健康空間,打造每個人的健康助手;業界首發星火智能批閱機,“AI助教”助力老師減負增效、因材施教;訊飛AI學習機升級 1對1 答疑輔導功能,打造每個孩子的AI學習助手。

面向萬物互聯時代,星火語音大模型再突破,發佈74個語種/方言免切換對話,破解強幹擾場景下語音識別難題,發佈國際領先的極複雜場景語音轉寫技術,並通過雲邊端及軟硬一體化解決方案,賦能汽車、家電、機器人等領域人機交互變革。此外,面向企業“人工智能+”場景價值落地最後一公里,科大訊飛正式發佈星火企業智能體平臺,並推出星火商機助手、星火評標助手等典型智能體案例,助力企業價值創造。

8個國際主流測試集測評第一,訊飛星火V4.0 整體超越GPT-4 Turbo

今年中高考真題實測中,訊飛星火語數外各科“成績”均排名第一,被評爲“更會做題的大模型”;在科研上,訊飛星火助力中國科學技術大學劉海燕教授團隊,將蛋白質設計成功率從0.1%提升到20%,設計所需時間從6個月降到1天;賦能每個人,幫助一位不懂法律知識的70歲老人順利要回養老錢欠款、幫助一位聽障人士圓了文學夢······訊飛星火正成爲我們每個人的AI助手。

自去年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達1.31億次,在國內工具類通用大模型App中排名第一,並圍繞寫作、編程、工作、學習等涌現出一批用戶喜愛的熱門助手。今年“618大促”,星火大模型加持的智能硬件銷量同比增長超70%,月均使用次數超4000萬,越來越多的用戶開始享受到大模型帶來的紅利。

現場基於全國首個國產萬卡算力集羣“飛星一號”,訊飛星火大模型V4.0正式發佈。訊飛星火V4.0 七大核心能力全面升級,全面對標GPT-4 Turbo,並實現在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面的整體超越。

訊飛星火V4.0在圖文識別能力上進一步升級,在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。此外,星火長文本能力也全新升級,並針對長文檔知識問答的幻覺問題,業界首發溯源功能。

外部權威測試集也體現出訊飛星火V4.0的領先性。在國內外12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型,國內大模型全面領先。

現場,劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果,星火“智商”再度進化。以空間推理爲例,“Bob在客廳裡。他拿着一個杯子走到廚房。他把球放進杯子裡,然後拿着杯子走到臥室。他把杯子倒過來,然後走到花園。他把杯子放在花園裡,然後走到車庫。問題:球在什麼地方?”訊飛星火可以基於空間和常識推斷出球在臥室的地面上,這些能力的進步對於以後的具身智能、家庭機器人都具有意義。

大模型個性化時代到來!訊飛星火首發“個人空間”,數百萬用戶一鍵擁有“AI智能全家桶”

大模型在給我們的工作、生活帶來便利的同時,也存在各家生成內容差不多、生成內容較泛、不夠實用的情況,怎麼樣讓大模型更好用,在工作生活中形成獨特的價值?科大訊飛給出答案——打造更懂你的AI助手。

如何打造懂你的AI助手?劉慶峰提出,AI助手要能夠基於用戶畫像進行個性化表達,基於使用歷史進行記憶學習,基於個人資料進行增強學習。在構建用戶個人畫像時,人設風格可以自己選定,也可以根據對話和使用歷史動態完善,進而形成個性化的表達風格;AI助手再結合個人資料,就可以生成個性化和針對性內容。

基於此,訊飛星火APP及桌面版全新升級改版,率先發布“個人空間”,用戶可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再結合人設,讓大模型生成更個性化內容。此外,訊飛星火首批上線 14 個智能體,面向特定場景打造專屬助手。

科大訊飛研究院院長劉聰現場演示“個人空間”效果,當他上傳了女兒寫的小作文並選取符合女兒風格的AI人設標籤後,星火生成了一篇活潑、可愛更個性化的文章;當他上傳了訊飛翻譯機的產品海報、用戶短視頻、相關錄音,星火也可以根據這些多模態信息生成產品培訓文檔,還可以對生成的信息進行多模態溯源。大模型進入個性化時代,大模型工作、學習“可用性”飆升!

此外,星火大模型還打通了全系訊飛C端軟硬件產品生態,數百萬智能硬件用戶一鍵擁有“星火全家桶”。比如訊飛智能辦公本、智能錄音筆的文件可以一鍵同步到星火個人空間中,通過數據互通、操作聯動,把一篇辦公本里會議記錄同步到星火中,就可以讓星火進行公文寫作,還可以做PPT,以及生成待辦事項等,帶來更高效的辦公體驗。

個人數字健康空間來了!訊飛曉醫APP下載量超1200萬

面向專業領域的個性化應用,科大訊飛昇級訊飛曉醫APP,發佈個人數字健康空間,打造每個人、每個家庭的AI健康助手。

在醫療領域,訊飛星火醫療大模型再次升級,醫療核心能力全面超過GPT-4 Turbo和GPT-4o。在此基礎上,訊飛曉醫APP各項能力持續升級,覆蓋1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗,滿足用戶在看病前、用藥時、檢查後的核心場景健康需求。當前,訊飛曉醫APP累計下載量1200萬,用戶好評率98.8%,主動推薦率42%。

現場劉慶峰介紹,訊飛曉醫APP上線的“個人數字健康空間”,它能夠根據電子病歷、檢查報告、體檢報告等用戶個性化資料,構建個人數字健康空間,在看病前可以進一步剖析病症原因,用藥時給出藥物禁忌的個性判斷,在檢查後聯合對比給出數據變化,並通過角色切換,瞭解其他家庭成員的健康狀況。

目前訊飛曉醫APP已通過數據安全與隱私保護的多類權威認證,進一步保障健康數據的安全。在當前醫療資源相對匱乏的情況下,訊飛曉醫 APP 的出現有效緩解了社會對醫療服務的迫切需求,爲個人及家庭健康管理提供了新的模式。

老師最強輔助!星火智能批閱機讓老師作業批改負擔下降90%

得益於底座大模型的升級和麪向教育複雜場景的圖文識別效果進一步提升,科大訊飛發佈首款星火智能批閱機,它集智能批改、精準學情、個性學習於一體,它支持自由排版,不限紙張大小的作業,在支持多學科多題型智能批改的同時,還能即時生成多維學情報告,還爲老師作業講評和麪批輔導提供了素材。劉聰在現場演示了星火智能批閱機批改作業的全流程,15份學生作業半分鐘就能批改完成,批改模擬了真人筆跡,和老師平時批改作業幾乎一樣。

有了星火智能批閱機,老師多了一個減負增效、因材施教的AI助手,原先要90分鐘才能批改完的作業,現在只要5分鐘就能完成;人工分析學情要60分鐘,現在星火1分鐘就能完成;得益於個性化作業,學生的錯題解決率也從50%提升到73%。

在今年中高考評測中,訊飛星火被外界評爲“更會做題的大模型”。本次訊飛星火進一步升級了訊飛AI學習機的 AI 1對1 答疑輔導功能,既能進行多模態啓發式講解、自由問個性化解答,也可以進行互動探究式學習、超擬人引導式伴學等,讓孩子多了一位“AI輔學老師”。

數據顯示,相比較傳統解題視頻學習,AI答疑輔導的學習方式讓孩子的學習完成率提高到90%,錯題解決率提升到93%,孩子更願意主動思考,學習效率更高,自信心也增強了。

星火語音大模型發佈74個語種方言“自由對話”,破解強幹擾場景下語音識別難題

近期科大訊飛作爲第一完成單位的《多語種智能語音關鍵技術及產業化》項目,獲得國家科學技術進步獎一等獎。發佈會現場國獎得主再出“王炸”,星火語音大模型迎來新突破。

劉慶峰認爲,語音將成爲萬物互聯時代人機交互的主要方式,人機交互最重要的場景是遠場、噪聲、多人說話、多語言,因此萬物互聯時代的AIUI(人工智能用戶界面)要滿足遠場高噪聲、多語言多方言、全雙工、多模態等標準。科大訊飛也主導制定了全雙工語音交互ISO/IEC國際標準,並於2023年5月發佈。

面向萬物互聯時代,本次星火語音大模型發佈國際領先的多語種多方言免切換語音識別能力,可支持37個語種、37種方言“自由對話”。其中,37個語種識別效果領先OpenAI whisper-V3,37個方言識別效果平均提升30%。現場,科大訊飛演示了訊飛輸入法混合方言和外語的語音輸入效果,能讓輸入效率大大提高。

科大訊飛還發布了軟硬件一體化訊飛同傳系統,可支持大會同傳、會議同傳、展廳同傳、旅遊同傳等多場景使用。本次參會的嘉賓座位上同樣配備訊飛同傳的收聽設備,佩戴後即可實時收聽多語種AI同聲傳譯。

針對強幹擾場景下的語音識別難題,科大訊飛突破了多人混疊場景下的極複雜場景語音轉寫,即使在三人混疊說話場景也能實現86%的語音識別準確率。三位訊飛研究院的研究員現場實測了在噪音場景下,同時混疊着說話,正常人耳已難以聽清,只見訊飛星火的多模態能力不但實現了三人重疊語音的角色分離,還能實時轉寫出每個人說的話,炸裂的效果引發現場掌聲不斷。未來基於多模態的聲音識別技術,將應用在訊飛聽見智慧辦公、智慧屏等會議辦公產品中。

大模型正在推動人機交互變革,語音領域的所有應用都值得被重構。在大模型加持下,星火汽車智能座艙全新升級,不但具備了多語種多方言的“自由交互”,還具備多情感多模態的超擬人交互,讓人車交互更有溫度。當前,訊飛語音交互產品國內市佔率穩居第一,同時廣泛出口到世界各地。星火大模型爲一汽、奇瑞、廣汽、江淮、長城等車企的衆多車型,賦予了高度智能的交互體驗。

爲了讓大模型更好落地,科大訊飛還打造了雲邊端一體化和軟硬件一體化的解決方案,賦能家電、運營商、機器人等更多行業場景。面向具身智能和人形機器人企業需求,本次科大訊飛正式發佈機器人超腦平臺2.0,業內首個支持多模態交互。目前,400+機器人企業已經採用訊飛機器人超腦平臺。

星火企業智能體平臺正式發佈,打造每個崗位專屬AI助手

自去年5月6日發佈以來,訊飛星火大模型正成爲國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大衆汽車、江汽集團、海爾集團、美的集團等多領域頭部企業的首選。

訊飛星火已經在代碼、合規審查、客服、評標、智能交互等多個典型場景產生應用成效,以交通銀行爲例,基於星火大模型能力的產品iFlyCode覆蓋6000+研發人員,代碼採納率達38%,工作效率顯著提升。

如何更好地解決企業大模型應用的最後一公里問題?劉慶峰談到,企業首先要科學地認識大模型能力的邊界,根據任務難度選擇合適方案,並且用更少的算力、更高的效率,打造企業專屬大模型。隨着星火V4.0的發佈,他認爲用智能體平臺打造每個崗位的專屬助手的時間已經到了。

現場星火企業智能體平臺正式發佈。圍繞搭建智能體的三大關鍵能力,當前企業智能體平臺已覆蓋400+AI原子能力,集成90+外部信源,打通100+內部IT系統,可供企業結合業務場景快速構建可落地的智能體應用。平臺還圍繞生產域、科創域、辦公域、管理域上線32個企業智能體,供企業即插即用。

基於企業智能體平臺,科大訊飛打造了星火商機助手、星火評標助手等典型應用案例,爲企業應用打了個樣。

在代碼智能體iFlyCode中,它集成了代碼生成助手、架構設計助手、代碼問答助手、測試助手、數據庫優化助手、代碼審覈助手等六大場景智能體,將採納率提升80%,由30%提升至52%,大幅度提升企業智能體的實用性。

星火商機助手可以實現商機線索應知盡知、客戶拜訪提質增效、銷售管理智能研判,助力一線銷售和商機管理效能提升。星火評標助手通過標前尋源、智能評標、定標審覈等功能,智能評標結果人機一致率達98%,投標異常檢出率超過80%,在大幅提升企業評標效率同時降低採購成本。

星火開發者生態加速增長:5個月開發者增長超100萬,總開發者數破700萬

訊飛星火大模型帶來行業賦能的同時,也在助力開發者生態蓬勃發展。自今年1月30日訊飛星火V3.5發佈以來,短短5個月,星火開發者生態加速增長,開發者數從598萬增長到702萬,新增超104萬;海外開發者數超40萬;大模型開發者達57萬。越來越多開發者正加入星火生態,釋放更多剛需場景的應用價值。

劉慶峰說,只有自主可控的繁榮生態,纔有中國通用人工智能的大未來。面向未來的人工智能新生態,他強調要關注源頭技術生態、智能體生態、應用生態和行業生態,實現自主可控和軟硬一體,才能實現大模型的深度落地;既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到產業生態、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI產業生態。