AI週報|李飛飛首個“空間智能”模型發佈;朱嘯虎、楊植麟分別迴應月之暗面仲裁案風波
李飛飛首個“空間智能”模型發佈
“AI教母”、斯坦福大學教授李飛飛在當地時間12月2日公佈了她第一個創業項目World Labs的成果——能用單張靜態圖片生成3D世界的AI產品。這一模型亮點在於:直接生成3D場景,且場景具有交互性、可編輯、可擴圖。該AI工具有可預測3D場景能力,即利用AI技術對3D空間中的物體、環境結構及其動態變化進行預測和理解,讓AI工具僅憑部分圖片就能“擴圖”,想象出整個3D場景。在World Labs的博客中,該團隊展示了他們如何實現短視頻上流行的“希區柯克式變焦”,模擬調節景深效果、產生虛化營造專業的攝影效果等。
點評:此前李飛飛表示,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎。她還提到,AI的發展不會侷限於處理平面圖像或文本,而是會邁向對三維世界的理解,這是智能發展的自然延伸。據官方消息,World Labs已經完成超過2.3億美元的融資,投資方包括硅谷風投a16z、NEA和Radical Ventures等。
谷歌DeepMind發佈基礎世界模型Genie 2
在李飛飛發佈了其首個“空間智能”模型後,12月5日凌晨,谷歌DeepMind在官網發佈了大型基礎世界模型Genie 2,可通過單張圖片和文字描述生成種類多樣的可玩3D世界。作爲今年初推出的 Genie 模型的升級版,Genie 2標誌着人工智能在虛擬世界生成領域的又一次突破。
DeepMind透露,Genie 2具備從不同視角(如第一人稱視角與等距視角)生成連貫世界的能力,這些生成的世界可持續時間長達一分鐘,但多數情況下維持在10秒到20秒之間。
點評:谷歌對世界模型研究的投入正在持續擴大。今年 10 月,DeepMind 聘請了OpenAI前視頻生成項目負責人Tim Brooks,同時兩年前從Meta挖來了以開放式實驗聞名的Tim Rocktäschel。
朱嘯虎、楊植麟分別迴應月之暗面仲裁案風波
金沙江創投聯合多家循環智能投資機構向月之暗面創始人楊植麟、聯合創始人兼CTO張宇韜提起仲裁後,12月5日,金沙江創投主管合夥人朱嘯虎連發兩條朋友圈,提到月之暗面本來是循環智能內部已開發2年的項目,分拆至今未得到循環智能股東決議的簽字,金沙江創投前合夥人張予彤向基金合夥人、其他循環智能投資人/股東隱瞞自己在新拆分的公司有巨大的免費股份的事實,違反了基金合夥人對LP的受託責任。
12月6日晚,楊植麟發文迴應稱,循環董事會決議通過了月之暗面成立新公司的安排,月之暗面授予張予彤股份的本質是其作爲公司聯合創始人對公司後續多年持續工作的對價,跟循環及其股東對於自己離開循環重新創業的決策是獨立的。
點評:此事的所有細節還未全部清晰,朱嘯虎又表示楊植麟的迴應迴避了關鍵問題。此外,朱嘯虎認爲張予彤向基金合夥人等人隱瞞自己在月之暗面有大額免費股份,楊植麟的說法則是授予股份與循環及其股東對於自己重新創業的決策、部分股東沒有投資月之暗面的決策是獨立的,雙方各執一詞。矛盾凸顯後,雙方可能會尋找方法達成和解。
阿里對通義前員工周暢起訴索賠
原阿里通義千問技術負責人周暢近期被曝加入字節跳動,記者從知情人士處瞭解到,目前,阿里巴巴已起訴周暢違反競業協議。公開資料顯示,周暢於2017年7月入職阿里。今年7月,周暢以創業爲由提出離職,並簽署競業協議。
點評:大模型“搶人”大戰愈演愈烈。國內人工智能人才的稀缺和大廠對大模型的持續投入,讓各家企業在人才競爭中的壓力日漸加大。大廠間的大模型競爭尚未形成定局,技術比拼之外,大廠也在進入持續投入、組織快速迭代能力等深度比拼。
具身智能初創公司穹徹智能完成數億元融資
12月5日,具身智能初創公司穹徹智能(Noematrix)宣佈完成數億元人民幣Pre-A+輪融資,本輪融資由紅杉中國領投,老股東Prosperity7 Ventures、小苗朗程及璞躍中國(Plug and Play China)持續加註。據悉,穹徹智能專注具身智能基礎模型和系統的研發,提供覆蓋智能機器人應用開發全週期的軟硬件工具和平臺。新一輪融資將主要用於加速穹徹的產品研發、人才招募、推動商業化和生態合作,進一步強化技術壁壘。
點評:在人工智能如火如荼的2024年,具身智能正成爲科技圈最炙手可熱的賽道。從天使輪迅速推進至Pre-A+輪,穹徹智能一年內已完成三輪融資。除了穹徹智能外,僅在上個月,就至少有星海圖、自變量機器人、埃斯頓酷卓、銀河通用、戴盟機器人5家人形機器人廠商完成億元級融資。
微信公衆號後臺新增 AI 配圖功能
12月2日消息,微信公衆號近日正在測試全新的 AI 配圖功能,在後臺文章編輯選擇插入圖片時,除了原本從圖片庫選擇和本地上傳之外,多了一個新的選項——“AI配圖”。點擊這個選項,創作者會進入一個AI圖像生成頁面,只需要輸入一段文字描述想要的配圖,然後等上十幾秒,系統就會生成四張照片。根據這四張照片,可以進一步選擇圖片風格和比例,然後對圖片進一步生成修訂,直到滿意之後,將其插入到文章當中。目前該功能尚未全面上線。
點評:這項功能的加入,意味着以後微信公衆號的配圖都可以通過AI生成解決,創作者也不必再因爲圖片版權的風險而擔憂了。微信公衆號不是第一個更新這項功能的平臺。2023年初,百家號在文心一言剛發佈不久就上線了類似的功能。微信公衆號更新的意義在於,作爲行業最早、影響力最大,但更新最緩慢的平臺,它的改變代表一個新階段的開始。
騰訊混元開源130億參數視頻模型
12月3日,騰訊混元大模型上線了視頻生成能力,並開源了這個參數量130億的視頻生成大模型HunYuan-Vieo。據稱該模型是業界參數最大的開源視頻模型,可生成5秒視頻。據混元團隊公佈的文生視頻模型效果評估,混元視頻生成模型總體評分41.3%,高於未公開名稱的國內模型A和B以及海外的GEN-3 alpha和Luma1.6。
點評:此前已有多家大模型廠商發佈了視頻大模型,不過騰訊現在入局也不能算太晚,因爲視頻大模型整體還未進入商業化階段。騰訊混元多模態生成技術負責人凱撒也認爲,文生視頻還不處於很成熟的階段,各模型成功率都不高,至少文生視頻的技術程度在混元內部的評估中,還沒有到大規模商業化的程度。技術上,視頻大模型還要解決不符合物理規律、視頻時長較短等各種問題。
MiniMax副總裁劉華:基礎大模型賽道將只剩個位數的企業
接受第一財經等媒體採訪時,MiniMax副總裁劉華表示,基礎大模型賽道將會侷限在個位數的企業,其中包括大廠和創業公司,除此之外,很多人要轉去做AI應用。目前國內AI產業總體上沒有太多泡沫,此前之所以行業存在一些資源浪費,是因爲太多企業認爲自己能做基礎大模型。泡沫撇去,更好的情況將是大家認識到能做基礎模型的企業不多,更多人有志於做大模型應用。
點評:近期一些業內人士發聲都認爲大模型創業公司未來至少能有一家留在牌桌上,目前的幾家獨角獸公司都有機會。與能在多個領域同時出擊的科技大廠不同,資源相對較少的創業企業要找到自己的發力點,做好基礎大模型的同時佈局商業化,讓商業化齒輪轉動起來。
OpenAI首發o1正式版和200美元/月Pro會員
北京時間12月6日凌晨,OpenAI舉行了“12天12場直播”活動的首秀,正式推出名爲ChatGPT Pro的套餐,每月訂閱收費200美元。OpenAI稱,該套餐的訂閱用戶可以無限制訪問OpenAI最智能的模型 OpenAI o1以及同系列較小模型o1-mini、GPT-4o、類人的ChatGPT高級語音模式Advanced Voice。ChatGPT Pro的套餐中還可以包括名爲o1 pro mode的新o1版本,也是ChatGPT Pro獨有的o1版本。OpenAI稱,這個新版本使用更多的計算,能更深入地思考,併爲最困難的問題提供更好的答案。
點評:OpenAI宣佈將開啓“12天12場直播”活動後,就有人預測o1正式版將在直播中亮相,因爲o1預覽版已經在今年9月推出了。此次直播活動中,最大的懸念還是視頻大模型Sora是否會推出,不過,如此密集的產品更新活動可能還是以比較零散的新功能爲主。一個月訂閱收費200美元的ChatGPT Pro推出後,則有人稱之爲“世界最貴的大模型”。
OpenAI推出強化微調技術
北京時間12月7日,OpenAI推出強化微調技術(Reinforcement Fine-Tuning),幫助開發者和機器學習工程師打造針對特定複雜領域任務的專家模型。該項目通過全新的模型定製技術,讓開發者可以使用高質量任務集對模型進行微調,並利用參考答案評估模型的響應,從而提升模型在特定領域任務中的推理能力和準確性。OpenAI CEO山姆·奧爾特曼(Sam Altman)表示,強化微調的效果非常棒,這是他今年最大的驚喜之一。
點評:強化微調可以降低大模型的錯誤率,據OpenAI研究員演示,強化微調後的o1 mini測試通過率比正式版o1高24%,比未強化微調的o1 mini提高了82%。在一些對準確率要求嚴格的領域,例如生物化學、安全、法律和醫療保健,強化微調將能讓大模型有更好的表現。