訊飛星火3.5死磕大模型的第二種可能

文/每日資本論

“這一年下來,星火大模型究竟跟國際最頂尖的技術相比,水平到底怎麼樣?”

2024年元月30日,科大訊飛董事長劉慶峰在訊飛星火認知大模型V3.5升級發佈會上,大膽地提出了一個衆多人想問又不好意思開口的問題。

答案令人驚喜——相較於訊飛星火V3.0,星火V3.5在邏輯推理、文本生成、代碼、多模態等七大方面能力均有提升。其中,語言理解、數學能力超過GPT-4 Turbo,代碼能力達到GPT-4 Turbo的96%,多模態理解能力達到GPT-4V的91%。

敲黑板!這是中國首個真正意義上自主可控的算力平臺上訓練出來的大模型,而非只是簡單地在應用層面取得進步。這也意味着,中國企業有能力發展基於國產算力底層的大模型,維護算力安全和國家安全。

劉慶峰說:“在今天的大模型時代,我們絕不能只用開源模型做應用落地,在通用大模型的底座上一定要有國家隊站出來。”

坦率地講,能做到如此實屬不易。誰都知道,做應用難,做算力更難。而且,在高科技領域美國正在對中國企業持續極限施壓,而且勢頭越來越猛,華爲手機被美國打壓就是典型的警示案例。如今,中國企業連“閹割版”的芯片都不容易買到,而且美國商務部還企圖從雲計算領域,進一步阻止中國獲得其想要用來訓練本國人工智能模型的算力。

那麼,中國的“算力荒”有多嚴重?

相關數據顯示,中國目前的算力需求量約爲每年1.5億臺的服務器,而中國的算力供給量僅爲每年3000萬臺的服務器,缺口達到了1.2億臺,佔到了全球算力缺口的80%。

這意味着,中國每年需要從美國進口價值約爲600億美元的服務器,而這些服務器都受到美國的出口管制和監控,隨時可能被美國切斷或植入後門。這對中國的算力安全和發展,構成了巨大的威脅和障礙。而快速成長的中國AI企業科大訊飛,早2019年就被美國拉入了“黑名單”。

慶幸的是,科大訊飛在技術層面實現了大部分的自主,有着大量的備胎選項,所以即便是被針對,也未就此一蹶不振。更爲重要的是,科大訊飛得到了合肥市的全力支持。

早在4年前,合肥市數字經濟規模就已超4000億元,佔GDP比重超4成。2021年、2022年連續入選數字經濟發展新一線城市。爲加快佈局智能算力基礎設施,合肥加快推進了合肥市通用人工智能算力數據中心項目、合肥城市雲算力中心項目等大規模算力設施。

2023年6月,“巢湖明月”算力集羣二期合肥人工智能計算中心開始試運行,該項目入選科技部“國家新一代人工智能公共算力開放創新平臺建設名單”;10月24日,在第六屆聲博會暨2023科大訊飛全球1024開發者節上,科大訊飛聯合華爲在合肥發佈“飛星一號”大模型算力平臺;10月底,規模達3000P級(1P約等於每秒1000萬億次的計算速度)算力的合肥市通用人工智能算力集羣項目正式投產。

毫無疑問,合肥在對高質量算力的佈局很有遠見。也正是這種遠見與企業努力,纔有了星火V3.5,纔有了訊飛與華爲在大模型算力底座上的深度共建,纔有了維護算力國家安全的能力……如此,不僅走出一條自主創新的大模型之路,也爲大模型的發展提供第二種選擇,產業意義極其重大。

好了,星火V3.5到底帶來了哪些亮點呢?

到底靚在哪兒?

“聽說今年‘爾濱’特別火,作爲南方小土豆還挺想去玩一下。要不,你用東北話介紹下有啥好玩的唄?”科大訊飛研究院院長劉聰操着一口安徽口音的普通話問星火V3.5。

很快,星火V3.5居然用一口地道的東北話,快速爲劉聰定製了旅遊攻略,還催促他趕快買票,春運機票緊俏。

“每日資本論”最直觀的感受是,“星火V3.5”更像一個人了。其不僅能夠幫助用戶帶來解決方案,還能像“知冷知熱”的朋友對話一般帶入情緒互動,超高的擬人度口音,讓大模型更具人情味。

用劉慶峰的話說:“這是科大訊飛從創業起就一直希望做到的人機自然對話,相信全語音的自然交互可以賦能整個萬物互聯時代,推動整個產業出現新的繁榮。”

而且其人機互動的內容創作能力令人眼前一亮。簡單說,星火V3.5可以將一篇小短文迅速分層次提煉要點,並按照指令進行適度擴充內容,而且還能細化要點內容。這就讓文案工作變得智能,極大提高工作效率。

最讓打工人激動的或許是,訊飛星火V3.5對年終總結計劃、述職PPT、活動策劃、政策問答等任務“信手拈來”。基於此,科大訊飛推出了可以一鍵快速自動生成文檔和PPT的辦公產品——訊飛智文,可以一鍵快速自動生成文檔和PPT的辦公產品“訊飛智文”,主要功能有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動配圖、多種模板選擇、演講備註等。

劉聰現場使用訊飛智文製作了“合肥市2024年春節旅遊推廣策略”PPT。短時間內,星火V3.5就製作了超20頁內容豐富的PPT一氣呵成。不僅如此,劉聰還演示了,提出指令將單頁PPT細化的功能,讓PPT變得更有個性化令人印象深刻。

如此“打工神器”自然獲得線上線下掌聲不斷。據劉慶峰介紹,星火V3.5在要素抽取、問題生成等底層能力的進步,能夠幫助知識學習和內容創作領域,產生更豐富更有用的智能體。同時,大模型能夠結合外部知識進行合理拓展,做到“旁徵博引”。在真實過程中讓用戶參與人機共創,既是人工智能時代技術追求的方向,也是將來的基本理念追求。

智慧黑板也是吸睛產品。其不僅能與老師的板書同步,而且能夠將立體幾何圖形進行分拆、重新組合、色塊區分等,這樣讓抽象的幾何學習變得生動形象,更容易讓學生掌握。

此外,對於學生們腦洞大開的問題,智慧黑板也能深入淺出地做出解答。比如,愛因斯坦出現在星火智慧黑板上,用“吸力巨大的吸塵器”來比喻黑洞,讓學生們能快速理解“黑洞是什麼”。

據悉,星火智慧黑板,具備多模態理解與推薦、全自然交互、虛擬人輔學、智慧化錄課與分享四大功能。訊飛對於智慧黑板定位是,不再是簡單的板書工具,而是躍遷成爲教師的AI助手。

爲什麼人工智能的每次進步都有對教育領域的賦能?劉慶峰解釋稱,通用人工智能作爲能夠改變世界生產生活方式的全新技術,可以推動人類進步。“而教育是人類進步的根本,關乎每一位個體,是真正的全民剛需。”

更像人的語音大模型

如果是說教育是人類進步的剛需,那麼語音則是大模型發展的剛需中的剛需。恰巧,科大訊飛早在25年前就是這方面的翹楚。

衆所周知,科大訊飛成立於1999年,而2000年前中國的語音產業全部控制在微軟、IBM等國外巨頭手上。科大訊飛通過努力,逐漸扭轉了中文語音市場幾乎全被國外IT巨頭壟斷的格局,打破“”,併成爲國內最大智能語音技術廠商。

2008年,科大訊飛成功上市,成爲中國語音產業界第一家上市公司。2006年到2019年,連續14年榮獲國際語音合成大賽冠軍。2016年到2023年,連續4屆獲得國際多通道語音分離和識別比賽CHiME冠軍;2019年,科大訊飛新一代語音翻譯關鍵技術及系統榮獲世界人工智能大會最高榮譽SAIL應用獎。2021年到2023年,連續三年獲得國際語音翻譯比賽IWSLT冠軍……

即便如此,或許所有人都未曾預見,語音技術的全新機遇出現在大模型時代。劉慶峰強調,讓機器具備學習、推理和決策的能力,就是認知大模型要乾的主要工作。“簡單來說,藉助大模型,我們讓一段語音具備更加豐富的屬性,有語種、有內容、有韻律、有音色,還有情緒。”

據悉,星火語音大模型效果國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。

本次發佈會上,劉慶峰又拿出一款重量級產品——搭載語音大模型的訊飛翻譯機。

訊飛翻譯機即將上線支持85個語種自動識別和增強式翻譯兩個重要功能,分別於今年1月底和3月中旬完成升級。多語種自動識別讓國際溝通更加便捷,增強式翻譯技術讓翻譯機化身AI翻譯助手。

很多人或許會問,手機上也自帶翻譯軟件爲何要使用獨立的翻譯機?

這恰恰是訊飛翻譯機的賣點之一。首先獨立翻譯機自帶的麥克風抗干擾能力不是手機麥克風可以比擬的。也就是說,前者在旅遊、市場、機場、餐廳等複雜語音環境中更能準確分辨語音。其次,出國或在使用到翻譯機時會經常遇到特殊環境。比如,遭遇無手機和網絡信號以及無法使用通訊設備時,翻譯機就會體現出強大的實用價值。

最讓人驚訝的是,當用戶通過語言向星火語言大模型提出理財等金融服務時,後者近乎完美的口語化表達、多意圖理解、情感關懷,即便中途被用戶語言打斷,也會迅速根據用戶要求回答相關問題,讓用戶壓根沒有意識到對方是AI智能人而非真正的客服人員。

這種功能看起來十分尋常,但就是這種“絲滑的客服對接”,讓星火語言大模型可以“百搭”更多的應用場景——在汽車、客服、家庭、陪伴機器人等場景中,星火語音大模型還有更多用武之地,帶來人機交互變革。如賦能汽車,智能駕艙、智能座艙、智能導航、音樂控制等交互體驗將進一步優化;陪伴機器人、導購機器人、輔診機器人、智能家居、穿戴式設備等產業也將隨着語音大模型的賦能進一步被引爆。

可以這麼說,大模型時代訊飛語言技術變得舉足輕重,能夠更好的擁抱萬物互聯時代,也會成爲科大訊飛持續高速發展的強力引擎。

科大訊飛還下了一步雄心勃勃的大棋——開源。

很多企業在與科大訊飛合作中提出了一個想法,“訊飛能不能把星火做開源?”2023年5月6日,訊飛星火V1.0是13B的版本,推出來至少有不下5所學校測評,認爲訊飛的大模型都比很多號稱千億的模型效果還好。彼時,就有部分企業希望訊飛能把模型開放出來。

如今,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B也正式發佈。而基於“飛星一號”訓練,星火開源大模型全棧國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的 90%。這不僅是對昇騰AI硬件的進一步深度優化,也展示了國產算力在追趕國際先進水平方面的決心和能力。

短短半年,星火大模型總開發者數量已達35萬,其中有22萬是企業開發者,佔比最多的是企業服務,其次跟教育有關,然後是客服、醫療等,都是社會的剛需和痛點。星火大模型開發者數量在業內最高,且用戶口碑極好。

目前,華爲昇思開源社區已正式上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索,必將推動國產大模型的自主創新。未來,開源必然會讓更多的場景落地,星火的生態圈也必將越來越大。

懂了吧?形象點說,科大訊飛正在做“大模型時代的谷歌”。一旦生態圈打造成功,就等於再造一個甚至N個科大訊飛。

劉慶峰表示,要清醒理智看到差距。當前在小樣本快速訓練、多模態深度學習訓練、超複雜深度理解等領域距離GPT-4的最好水平還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。他說:“今天的通用大模型並不一定代表人工智能的全部未來,還有很多創新要做,但我們一定要有勇氣、有期許走在最前列。”

【文章只供交流,並非投資建議,請注意投資風險。碼字不易,若您手機還有電,請幫忙點贊、轉發。非常感謝】