AI 又一突破!新型神經元網絡模型問世:更強的環境感知,更好的人腦模仿
當前,以 ChatGPT 爲代表的認知智能大模型正在加速發展,如何讓人工智能(AI)像人類大腦一樣聰明,神經網絡扮演着重要的角色。
上世紀四十年代,科學家受大腦神經元的啓發,提出了人工神經網絡模型,通過模擬大腦神經元和神經網絡的結構和功能,使計算機能夠學習並做出類似人類思維的決策。
近期,OpenAI 發佈的 GPT-4o 模型的“類人”交互能力表現驚人,它的音頻響應速度甚至已經達到和人類相似的水平。這是否意味着神經網絡已達到人類大腦處理信息的能力?
近日,來自 Flatiron Institute 和印第安納大學的研究團隊發現,儘管人工神經網絡在不同程度和層次上可以模仿人腦神經系統的信息處理功能,但其距離人腦神經元系統的運行機制仍存在很大差距。他們表示,人工神經網絡並未捕捉到真實神經元的所有計算能力,而且可能會阻礙人工智能的發展。
相關研究論文以“The neuron as a direct data-driven controller”爲題,已發表在 Proceedings of the National Academy of Sciences 上。
據介紹,他們開發了一種 DD-DC(direct data-driven control)新型神經元網絡模型,其證明單個神經元對周圍環境的控制力比之前想象的更強。他們認爲,DD-DC 神經元網絡模型可能會生成更強大的人工神經網絡,還能更好地模仿大腦的運作。
該論文的通訊作者 Dmitri Chklovskii 表示:“過去 60 年來,神經科學已經取得了長足的進步,我們現在認識到以前的神經元模型非常簡陋,神經元其實比這個模型複雜得多、也聰明得多。”
神經元網絡新突破
人工神經網絡由許多神經元連接形成一個網絡結構,當神經元從前一層神經元接收到的總輸入超過某個閾值時,它纔會將信息傳遞到下一層。模型在訓練時,信息僅單向通過某個神經元,且無法影響神經元從鏈中較早的神經元接收到的信息。
儘管人工神經網絡已經在各領域取得了顯著的進步,但受生物神經元固有的可變性限制,目前神經元的參數還難以量化,構建可推廣的大腦功能模型仍然是神經科學領域的一項艱鉅挑戰。
在此前的研究中,科學家們提出效率編碼與預測信息理論等理論,試圖通過優化未來相關信息的編碼,將神經元生理學概念化爲計算目標的優化。然而,這些觀點並沒能很好地解釋神經元的某些生理屬性。
爲了實現大腦在反饋控制的功能,DD-DC 神經元網絡模型將神經元建模爲周邊環境的反饋控制器,避開受控動態系統的顯式表示和潛在狀態的顯式推斷,直接將觀測結果映射到控制信號。
DD-DC 神經元網絡模型從單個假設開始,爲多種先前不相關的神經生理現象提供瞭解釋,每一個解釋都只提供間接證據,但它們的多樣性可以爲 DD-DC 模型提供支持。
圖 | 一組開關 DD-DC 控制的開關線性系統( 左圖:使用多個開關 DD-DC 控制非線性動態系統的示意圖。右圖:描繪了一個深度網絡模型,其中每個神經元對其周圍環境實施控制,從而促進整個大腦對外部環境實施更廣泛的控制。 )
Chklovskii 表示,這種更逼真的神經元控制器模型可能對於提高許多機器學習應用的性能和效率至關重要。但他也表示,“雖然 AI 取得了令人矚目的成就,但仍存在許多問題。目前的應用可能會給你錯誤的答案,或者產生幻覺,而且需要大量的訓練成本。”
DD-DC 神經元網絡模型利用先進的數據驅動控制框架,說明了生物神經元作爲有效反饋控制器的可行性,提出神經元不僅可以預測,還可以通過其輸出積極影響其未來的輸入。
研究人員表示,DD-DC 神經元網絡模型將加深人們對大腦的理解,或許有助於受生物學啓發的人工神經網絡的發展。
將神經元視爲微型控制器
該研究揭示了在神經迴路中,後期處理鏈中的神經元可以反饋影響早期處理鏈中的神經元,這與傳統概念中的單向流動完全不同。就像恆溫器維持房屋或建築物的溫度一樣,大腦神經網絡需要保持自身穩定,從而避免身體系統被活動壓垮。
研究發現,在神經元連接點(突觸)處,電信號的傳遞偶爾會被隨機干擾,這種隨機性實際上有助於神經元適應不斷變化的環境,從而提高它們的性能。
更具體地說,在一個神經元與另一個神經元連接的“突觸”部分,經常會出現神經元傳輸電信號但下游耦合神經元未收到消息的情況。下游神經元是否收到、何時接收突觸信號,似乎很大程度上取決於偶然性。
Chklovskii 說,將神經元視爲微型控制器也可以解釋一些以前無法解釋的生物現象。例如,人們長期以來一直認爲大腦中存在大量噪聲,這種生物隨機性的目的一直存在爭議,但該研究團隊通過建模發現,某些類型的噪聲實際上可以增強神經元的性能。
研究人員表示,人們認爲大腦是一個整體,甚至是大腦的一部分,但沒有人認爲單個神經元可以做到這一點。控制是一項計算密集型任務,神經元很難擁有足夠的計算能力。
儘管一些科學家推測這種隨機性只是小型生物系統的本質,對神經元行爲並不重要。但研究團隊發現,向模型添加噪聲,有助於神經元適應不斷變化的環境,從而提高它們的性能。隨機性對於複製真實神經元的功能似乎也很重要。
然而,儘管這一新模型展示了其優越性,但其計算需求較高,尤其是在大規模神經網絡的實際應用中。
因此,研究團隊建議將其更多地應用於特定領域的深入分析,如視覺環境中的神經元行爲研究。未來的研究將繼續探索不同類型神經元的行爲,並將這一新模型與其他技術結合,如對抗性訓練和強化學習,從而進一步提高 AI 模型的可靠性和準確性。
他們也計劃分析不適合這一新模型的神經元類型。例如,視網膜中的神經元接收來自視覺環境的直接輸入。這些神經元可能無法像大腦深處的神經元那樣控制它們的輸入,但可能會使用研究團隊發現的一些相同原理。
Chklovskii 說:“控制和預測實際上非常相關,如果不預測你的行爲對世界的影響,你就無法有效地進行控制。”
參考資料:https://www.pnas.org/doi/10.1073/pnas.2311893121#executive-summary-abstract
|點擊關注我 記得標星|