由以色列希伯來大學以及美國普林斯頓大學的研究團隊,近日發表在《Nature Communications》期刊的最新研究顯示,人類大腦處理口語語言的順序,與先進人工智慧大型語言模型(LLMs)的分層架構高度相似。像 GPT-2 與 Llama-2 這類大型語言模型,其內部架構與人類理解語言時的大腦活動時間順序相互對應。研究員們藉由分析受試者聆聽故事時所取得的皮質腦電圖(electrocorticography, ECoG)資料後發現,人工智慧模型較深層的層級,可對應到較晚出現在大腦語言關鍵區域(如布洛卡區)的神經反應。這個發現挑戰了傳統以規則為基礎的語言理解理論,為研究大腦如何建構意義提供新的理論方向。
當我們聆聽他人說話時,大腦會透過一連串神經運算,逐步轉換每一個接收到的詞彙。本研究的團隊發現,這些隨時間展開的轉換模式,與大型語言模型的分層結構具有一致性。人工智慧模型較淺層的架構會追蹤詞彙的簡單特徵,而較深層的架構則負責整合語境、語氣與語意。研究結果顯示,人類大腦活動也具有相似的運作方式:早期出現的神經反應對應模型較淺層結構,可預測詞彙被聽見當下的神經活動;較晚期的神經反應則對應模型較深層結構,也就是與後續語意整合過程相關的運作機制。這種對應關係在布洛卡區等高階語言區域尤其明顯。在這些區域中,對應到越深層的大型語言模型層級,其大腦反應峰值出現的時間也越晚。
研究團隊表示:「最令我們驚訝的是,大腦隨時間進行的意義形成過程,竟與大型語言模型內部的層級轉換序列如此接近。雖然兩者是以截然不同的方式建構,但似乎都收斂到一種可逐步累積理解的模式。」
這些結果意味著,大腦可能透過類似深度學習領域的非線性轉換機制,隨時間逐步建構複雜的語言意義。這也顯示,人工智慧不只是生成文字的工具,也可能為理解人類大腦如何處理意義提供新的視角。
數十年來,科學界普遍認為語言理解仰賴符號規則與嚴格的語言階層結構。然而,這項新研究挑戰了此一觀點。相反地,研究結果支持一種更具動態性與統計性的語言觀點,也就是語意是在多層次語境處理中逐步浮現。研究人員也發現,傳統語言學特徵,例如音位(phonemes)與詞素(morphemes)等,在預測大腦即時活動方面的表現,不如大型語言模型所衍生出的語境嵌入表示(contextual embeddings)。此外,大型語言模型在預測特定神經活動模式的準確度上,也優於傳統以規則為基礎的符號模型。這些結果顯示,大腦整合語意的方式,比過去所認知的更具流動性,也更加依賴語境。
為推進此領域發展,研究團隊同時公開完整電生理記錄資料集,以及其所搭配的相關語言特徵資料。這項新資源讓全球科學家得以驗證不同理論假說,進一步了解大腦如何理解自然語言,並推動建立更貼近人類認知方式的計算模型。
資料來源:https://en.huji.ac.il/news/how-your-brain-understands-language-may-be-more-ai-we-ever-imagined
原始論文:https://doi.org/10.1038/s41467-025-65518-0