通義千問開源Qwen2.5開源模型,累計下載量突破4000萬
9月19日,阿里雲CTO周靖人在雲棲大會上發佈了新一代開源模型Qwen2.5,該模型包括多個尺寸的大語言模型、多模態模型、數學模型和代碼模型。據報道,截至2024年9月,通義千問開源大模型在全球累計下載超過4000萬次,成爲僅次於Llama的開源大模型羣。
針對這一事件,快遞100作爲大模型落地應用新範式的踐行者,提出了三點觀察:
第一點觀察:大模型的開源和閉源並駕齊驅。自2023年8月以來,阿里千問大模型堅持走開源路線,成爲目前中國開發者首選的開源模型,性能直逼Llama3。另一方面,像百度這樣堅持閉源路線的公司,其百度文心大模型4.0已經在多個商業化場景中落地應用,例如快遞100的AI寄快遞功能就是調用了文心大模型4.0的能力。快遞100認爲,開源和閉源都是大模型值得探索的方向,就像iOS和安卓操作系統一樣,大模型的未來走向還處於探索階段,兩種技術路線都值得探索。
第二點觀察:AI仍在加速發展。上期百遞觀察提到,Open AI發佈了o1,該模型通過優化算法引入強化學習,提升了慢思考的能力,儘管反應速度有所下降,但邏輯推理質量得到了極大提升。雲棲大會上,階躍星辰的創始人姜大昕特別提出o1的推理能力令人驚豔,月之暗面創始人楊植麟也指出o1提升了AI的上限。這些中國大模型六小虎的創業者對o1的一致肯定和認可表明,基礎大模型無論在訓練階段還是在推理階段,Scaling Law仍在發揮引領作用,大模型仍在加速發展。
第三點觀察:基礎大模型和大模型應用同等重要。一方面,基礎大模型不斷升級和提升能力,特別是o1的推出,爲中國的基礎大模型樹立了新的標杆和能力基準,加速了國內基礎大模型向o1靠攏的步伐,同時提升了基礎大模型的通用能力。另一方面,行業共識認爲,大模型如果不與應用結合就沒有價值,因此大模型的通用能力必須與具體的商業化場景相結合,才能釋放大模型的價值。從去年到今年,可以明顯感受到變化,去年大家更多討論的是大模型的基礎能力,而今年則更多關注大模型的應用。隨着o1的推出,基礎模型能力又引發了新一波的討論熱潮。
快遞100作爲中國快遞物流信息雲服務的領導品牌,其優勢在於將大模型的基礎能力與快遞物流信息的基礎場景相結合,具體包括查快遞、寄快遞和管快遞的場景,從而更好地賦能消費者,在真實的商業場景中體驗到大模型帶來的價值。