☰

大模型時代，沒有超級應用，只有超級智能，爲什麼？

在繪畫、寫文章、創作視頻之後，AGI 應用的另一大場景是：編程。

曾經大家認爲編程有很高門檻，但在 AGI 時代，它在變成人人觸手可及的技術，越來越多的 AI 編程工具，讓不會代碼的普通人也能輕鬆製作 App。

我們如何擺脫基於移動互聯網時代的想象，展開大模型時代新的可能性？未來是不是人人都能成爲 AI 程序員，創造專屬於自己的「個性化應用」？

對於這些問題，AIGCode 創始人宿文在極客公園 IF2025 創新大會上，給出了自己的答案。

宿文認爲，在 AGI 的賦能下，AGI 代碼可以把應用帶入更有「個性化」的階段，讓每個用戶可以實現自己小衆但精準的需求，小團隊也可以降低成本，快速迭代。這是宿文眼中編程的終極場景。

在宿文看來：

以下是 AIGCode 創始人宿文在極客公園 IF2025 創新大會上的現場演講實錄，由極客公園整理。

宿文在極客公園 IF2025 創新大會上進行演講｜圖片來源：極客公園

從 Copilot 到 Autopilot

即將過去的 2024 年，大模型賽道引發了許多討論，AI 編程是其中一個繞不開的話題。

大家都會說程序員被大模型改造得很深刻，全世界程序員羣體有七八千萬，佔世界人口 1% 左右。這麼厲害的軟件代碼改造技術，怎麼讓其他 99% 的人使用呢？

我們可以舉一個例子，今天中午極客公園鵬總突然說這個活動辦得很好，除了線上買票、線上收費，咱們線上直播行不行？會務組小夥伴崩潰了，去哪找直播管理平臺，去哪找 SaaS，如果自己定需求，自己去做開發，至少幾個周、幾個月時間。

爲了方便大家瞭解 AIGCode 的產品 AutoCoder，我們把這個平臺給大家看一下。

AIGcode 演示界面｜圖源：AGIcode

這個產品完全面向不會編程的人羣。

另外很重要的點，相比大家現在拿到的類似產品，主要圍繞前端，但是 AIGCode 能夠把後端和數據庫一體化交付給大家，能交付出一個完整的軟件工程。

做這個事的源頭，跟我上一段創業有關係。我上段創業是做軟件，有一個比較大的痛點是效率，我們經常提出一個需求，程序員要做幾周甚至幾個月，我們看到很多很好的技術棧，字節、阿里用得很好，但我們程序員用不起來，而且程序員成本很貴。

所以做軟件，怎麼做得又快又好又便宜，這是每個行業都面臨的難題，不可能在一個維度上去解決。然而大模型來了，又好又快又便宜可以實現了。

當然實現過程中，目前主要有兩類解決方案：一類就是 Copilot，就像名字一樣的，幫程序員做輔助駕駛。另外就是我們想做的 Autopilot 這樣的產品。

Copilot，目前主要還是圍繞程序員工作場景在 IDE 裡面做代碼補齊，中國沒有 IDE，甚至全球最主要的 IDE 80%、90% 的市場都在微軟手裡，作爲初創公司很難在生態裡 PK，只能繞開這個很大的生態競爭。我們在 Web 端做 IDE Free 的產品，端到端去做。我們用戶會完全不一樣，我們把用戶羣體從 1% 放大到 10%、20% 都有可能。

目前大家所用到的模型和 Copilot 產品，主模型能夠用上最好的基模，不管海外還是國內，大家都在使用 Deepseek 這種水平的基模。要把代碼鏈條優化得足夠好，核心的技術都卡在模型上，所以自研模型不會套殼，不會用 Llama 去做，我們會有自己的模型架構解決這個問題。

還有很重要一點，傳統軟件架構跟生成式軟件架構不一樣，兩大支柱做了算法和軟件架構層面的創新，這是我們兩塊主要的工作。

右面是模型上的工作，核心解決兩個點：又大又準，大的是「大上下文」，而不是後半段做 4K 窗口的串聯。另外是新的網絡結構帶來的收益，還有一塊是在軟件結構的創新。

ChatGPT 的火爆正好兩年多，我們其實站在今天這個節點來看，我們很憧憬大模型可以解決很多問題。

今天可以解決的問題主要在寫字和畫畫兩個場景，很多理科生的的問題，比如數學、編程這樣的工作還沒有解決得很好，我們遇到了很多其他問題，比如訓練成本、資金、模型本身的泛化能力、訓練效率等等。

目前網絡結構在 Transformer 往前迭代，去年上半年提出的 MOE 這種架構也在改造整個大模型，在 MOE 之後還有 MMOE 等很多技術迭代。

我們率先使用 PLE 架構，核心是我們能夠在網絡結構層讓專家或大模型，更有結構化地深度學習人類高質量樣本。至於樣本不夠用的問題，其實不會出現，因爲我們有很多高質量的樣本，像論文、代碼這些樣本還沒有被徹底學到。

爲了讓整個模型可以支撐起完整的代碼生成，模型底層還要配套很強的算法，所以我們自己去做優化，包括不同的算力平臺的整合，一體化平臺上的算力加速，我們看到的技術卡點，都解決掉了。

我們自己的模型成果，也不會拿國內任何一個軟柿子去捏，去對比，我們還是拿全球頂尖的團隊的最新版本，最大參數量去做，我們在泛化指標上，是跟主流模型基本平齊的水平。

我們會在接下來三個季度把 13B 和 33B 也發佈出來，給有模型使用能力的團隊使用。

這句話是我們公司的願景，剛剛主要解釋了上半句，Auto-coding is AGI，我們看起來在解決代碼編程的問題，但是核心問題是：能不能把端到端代替程序員寫完代碼。

Autocoding 加速「個性化」

這問題由 AGI 模型本身決定，我們發現，無論解決上下文還是網絡結構、底層優化器、算力加速等等問題，都是目前 AGI 最大的痛點，這兩個問題幾乎是等價的，AGI 和 Auto-coding 基本上同一個時間點到來。

底層邏輯有兩個：一、代碼本身就是一種高質量語言，對於模型訓練非常重要。另外，我們覺得 AGI 本身從一個新技術的出現，到兩年前的 ChatGPT 進入大衆視野，我們對它有很多憧憬，但它解決很多行業問題還不成熟，所以很多行業專家或者用戶就會罵街，說這個工具不成熟，解決不了問題。

但是對於代碼這個賽道來說，比較幸福的是：我們算法工程師，95% 都是程序員出身，因此思路上閉環很快，自己做得好不好，我們自己心裡有數。

第二點是，這樣的 Auto-coding 準備好後，解決問題時，怎麼端到端，要打到哪些需求點？

用戶體驗上的核心之處：第一個點是準確，我們所有需求，怎麼達成底層產品鏈條裡的準確率？今天使用很多 Agent 類產品，第一個生成的版本很好，但細微的需求點沒有辦法實現。

第二個點是靈活性，在一個應用的生成過程中，最重要的是要實現各種各樣個性化的要求，比如一個搜索框，能不能實現得足夠靈活，能跟所有功能邏輯串通。

第三個點是完整度，這是軟件工程上的工作，要解決工程的安全問題、部署問題。在這些工作做完後，這套方案就會變成基礎設施，程序員的工作全部用推理算力成本就可以解決。我們想去做的 Personal App（個性化應用）就可以實現。

大家看到這個場景的時候可能會說：「我們手機裡裝的都是通用應用，我要一個 Personal App 做什麼呢？」也有很多人問我：「你們要 ToB 還是 ToC？」

其實一個新的生產力工具出現時，這些問題都不重要，舉兩個很有意思的例子：

上週我去雲南某城參加一個會議，會議組織方帶我們去景區，很多人排長隊在買票，但旁邊有好幾臺自動售票的機器，我走近一看都開着機，機內裝着 Windows 系統，這時候如果有一個管理人員可以提出一個售票系統的需求，都不需要在當地找程序員，用可以在 Windows 裡部署一套售票管理軟件，排長隊買票的問題就很好解決。

另外一個例子，我跟一個朋友討論播客，我們聽播客很多都依賴於小宇宙這種播客客戶端。在美國，很多主播會在 YouTube 上有視頻播客的頻道，國內很少用視頻的方式做播客，這個朋友說我們不太想露臉，如果有一個卡通形象體出鏡，去做視頻播客，主播就會自然舒服很多了。

所以大家會發現，在我們場景裡有非常多個性化應用的需求，哪怕是基於一個通用的平臺，都可以加很多個性化的功能進去，這在編程的終極場景裡都可以實現。

我們在小紅書、知乎或者百度上，想搜索一個軟件去解決我們一些問題時，本質上都是在提需求。如果這樣的需求可以通過自動生成的代碼和應用實現，而不需要用戶去找各種各樣的應用，找到後還要剋制自己的需求。這兩種體驗完全不一樣。

大模型的核心功能，究竟是什麼？

關於代碼生成和我們公司要做的事情，介紹到這裡就結束了。接下來我有三個真話想說：

一、大家一直在追求 AGI 或者解決 AGI 問題，是很割裂的。比如很多大佬都會說，整個大模型目前還處於嬰兒期，但是從 2024 年初到現在，大家都說今年是 Agent 元年，但一個嬰兒期的工具怎麼解決那麼多問題？

我們經常聽到說 Scaling Law 走到盡頭了，但是囤卡樂此不疲，H100、B200，1 萬張，10 萬張，大幾十萬張卡，現在大廠甚至開始搞核電站了，包括 Ilay 最近提到的，預訓練期結束了，其實裡面沒有什麼乾貨，主要把樣本學完，但是還有很多高質量樣本，需要結構化輸入進整個網絡結構裡。

所以有什麼資源，大家就會依賴什麼路徑，對於我們這樣的公司來說，我們看到更多的是網絡結構層帶來了非常大的紅利。從 Transformer 出現，到前面幾十年，大家對於通用人工智能的追求，都避不開網絡結構這個環節，這一層獲得的收益和待解決的問題更多。

宿文對大模型的核心做出預測｜圖片來源：極客公園

二、互聯網或者移動互聯網，給大家留下的思維慣性太強了，不管投資人、創業者、產業分析師，在大模型出現的第一天，很快就出現了一個分析框架，這個框架鏈條裡有基模、OS、Agent、應用……但這些分類的基礎，都是從上個時代復刻下來的，大模型時代的鏈條會長什麼樣，我們都不知道，它大概率不會長成上個時代的樣子。

我們做的過程中發現，做 Infra 這一層、做基模、做應用，各個環節的基礎鏈條都不成熟，在不成熟的時候，大家如果去等待鏈條成熟，或者自己找一段去完善，這個商業通路很難跑通，因爲它很難把價值直接傳遞給用戶。對我們來說，我們有能力把這些鏈條打通到一起做，而不會很刻板地停留在過去的技術思路里。

三、在大模型出現第一天起，就很多人提超級應用，這同樣是互聯網時代留給我們的想象。移動互聯網時代，我們看到這種超級應用本身不產生內容，更多是做一個信息的嫁接平臺或者一箇中間平臺，讓我們搜內容搜得越來越快，給我們推薦信息越來越準，讓我們交易越來越高效，但這個平臺本身不會提供內容服務。

但是到了大模型時代，這些互聯網產品特性基本都消失了，大模型只有一個核心功能：在底層幫大家生成內容。

這個競爭力一定是最底層的，未來超級應用長什麼樣不知道，甚至不會存在。但是超級應用底層是對超級智能的支持，這一點是一定避不開的，這是最內核的競爭力。

看起來我們是在做 AICoding，但其實我們是在這樣一個商業場景裡，去解決 AGI 自身的問題，我們朝着 AGI 一路狂奔，也是希望有更多小夥伴像我們一樣，大家向上卷，向核心技術卷，最後把這些技術沉澱在產品上，提供給我們的用戶。

謝謝大家。

大模型時代，沒有超級應用，只有超級智能，爲什麼？

相關資訊