干貨:Google首席科學家Shanahan的完整演講

2026/05/25 13:09
🌐zh-Hant
干貨:Google首席科學家Shanahan的完整演講

北京時間2026年5月22日晚, DeepMind的主要哲學家Murray Shanahan在倫敦大學的兩天國際會議上發表了一篇關鍵演說

我以前學過莎娜漢 他稱這為AI, 有些人稱之為「不明飞行物」。

他的演說很豐富

摘要根據維特根斯坦的「意識或用處」哲學, 他探索了大語模型(LLM)對知識、信念、機構與行動、自我與意識等精神屬性的适用性。

一. 分析理解和定罪的适用性

關於LLM是否「理解信仰」的問題

“理解”的語言遊戲

  • 日常使用的性质: 在日常的交換中, 很難避免用「理解」來形容LLM行為。 例如,當模型按照使用者指令精确地格式化 LaTeX 項目或修正特定字段時, 它完全是自然的語言實習 。

  • 深究:當被問到「它真的明白嗎? 例如,36+59被分解成6+9左右的组合以完成加法,它虽然不同于人的算法,但是一种有效的计算过程,从而支持它的可适用性。

“良心”的归属和限制

  • 意向位置的应用: LLM 行為非常有效, 和我們在解釋象棋程式或動物行為(例如狗追貓)時所使用的名詞相似。

  • 大衛森保留地:大衛森認為,有信仰需要一種通常依賴語言的「概念」. 就LLM而言。

  • 多模具和工具的演化因為LLM整合了多模組感知,工具(例如網路搜尋以驗證事實)和機器人

二. 动态、自我和意識

也注意到LLM在這些方面的根本不同與特殊性:

1. 流动性的定义

  • 技術和哲學定義: AI 字段通常使用羅素和諾維格的广义定義( 感知環境和通過執行器動作)

  • 代理身份模糊在討論中

“自己”的异形和分裂

  • 模糊的自我定位: LLM 中的“ MAY” 一词是指自下而上的權重組裝, 一個為數以千計的使用者服務的部署模型, 一個特定對話框的例子, 甚至對話框本身的上下文視窗, 可能會在對話框中漂移 。

  • 角色扮演和超過LLM更像是演員, 它不是一個穩定的身份, 而是角色的可能分配。

  • 短命的“暮光”: LLM的自我短而不一致. 暫停對話框時, 計算停止, 自我消失; 恢复對話框時, 自我被重新示例 。 這引發了一種"哼哼"或"WAR"

3. 意識的哲學困境

  • 笛卡尔二元主義的傳承關於意識的爭論常被笛卡尔二元主義的陷阱所困擾。

  • Vitgenstein的崩溃維根斯坦的「私人語言爭議」旨在消除此二元主義。 在他眼中, 感覺(“某事”不是, 而是語言遊戲的一部分。

  • 工程相遇的可能性而不是問LLM是否自覺。

三. 多元和综合的影响

對於LLM缺乏實體化的批評

1. 多模型的限制

  • 增加感性丰富:多模組模型(例如影像輸入)提供了丰富的感知輸入,使其更接近人類的感知模式,有助于缩小與人類"理解"的差距。

  • 虛擬浮雕:在遊戲或虛擬的環境中, “虛擬化”, 也就是在時空擴張的世界中。

2. 物理化的哲學意義

  • 缺乏自我知覺人類的自我根深蒂固於物理化, 包括生物代谢、內在感覺(LLM缺乏此深度的物理基礎。

  • 身份稳定的来源人類身份的穩定性 很大程度上依赖于身體的连续性 對LLM來說, 引入持久記憶和長期代用行為可能幫助建立更穩定的身分

以下是Shanahan主旨發表的全文:

我要大家聽到我的聲音 聽起來如何? 好? 很好 所以我的演講題是... 是的,這是假設

所以,是的,然后: "他們是外部的精神实体。"

但是我們正在盡力學習跟他們談談 這就是我想說的 我稱之為"其他人"

第一件事需要建立,是,不管什麼大語言模式,他們和我們有很大的不同,他們不是人。

這是一個簡單的比對表 人與其他語言使用者分享。

透過我們與世界的互動。

- 我當然不是說它們是隱形的 或者它們沒有實體的硬件可以運作。

它們當然有物理载体 但是它們沒有任何现存的 單一的物理實體 這就是我所說的”。 從這個意义上說,他們是沒有實力的。 他們不和我們一樣生活在共同的世界中, 他們對語言的學習是以語言的數據模型为基础的

他們的优化目標是"下一個預測符" 他們模仿人類的語言 主要是預測下一個標記 此外,他們沒有单一的、统一的自我,而是非常支持“扮演角色”(a/cn.9/wg.iii/wp.16)

他們的確和人類有很大不同 當然,他們在說話

我會研究将这些心理詞 应用到大語言模型的理性 为此,我要阐述一系列概念。

例如「了解」(「證據」-「判斷」部分), 然後我要進去 我的整個研究的哲學背景 或是我所參與的 更大的哲學計畫 主要是維特根斯坦式的計劃 我深受維特根斯坦的影響。

這是一首人熟知的名言, 來自哲学研究的第一部分, 也就是後期維特根斯坦的場景: 單詞的意義。

此句丰富了維根斯坦的觀點 通常被概括為「某種東西被用於某大類別, 這條簡單的條款也适用。

基本上,我想問一下我們如何使用這些詞 比如,"信仰的信徒","主權"

讓我給你一個簡單的預覽 接下來會有很多相似的滑行 。 首先,"理解"

我非常愿意站在維特根斯坦的位置 意思是不要問

傳回上一張幻灯片 。 我們是從

對於「批評」, 然後我們再談一些非常困難的案件:首先。

我認為說服人們接受「理解」不難, 我認為人們對它很開放。

我指的是那些想過這一點的哲學家 他們愿意相信這不是個壞方法 信仰是“意向地位”。 我認為人們的本能更根深蒂固

所以才會變得這麼棘手 好吧,那我們該怎麼處理"理解"這個詞? 首先,我認為大語言模式與傳統語言相容

然而,在描述和解釋大語言模型的行為時,使用"理解"

這些工具在日常使用中非常強大,你很難不使用"理解...". 我不知道你們有沒有人用過它

如果您不知道, 在 LaTeX 中, 您必須將所有文學項目轉換成如上所示的糟糕格式 。 問題是做這種事有無數種不同的方式, 有些人很挑剔, 例如認為你應該從網路上拿, 有些人喜歡在等位物上增加空間, 雖然這些微調對未來的一代沒有影響 但我喜歡保持连贯 我喜歡 所以我希望所有事情都嚴格以這種形式發生 所以我給你的

意思是"你可以把以下的資訊轉換成這種風格" 我把它放進去了 做得非常好 你自然會說:

“它理解我的要求。 它正是我要求的。" 這本書目原本在網路某處編碼。

但當你們有多輪互動時, 你們可能會發現它會產生不完全符合期望的有趣結果, 例如缺少一個小字段。 所以你說 "..."

例如,确保當B開始時,你必須將它放在"AI"一词的括弧中,你總是希望它保持大寫,所以你必須將AI不做大寫。

所以我說,"你能確保AI總是放在括号里嗎?" "好吧",然后给出修改版。 不用"理解"這個詞真的很難 你會說,"它理解我的修改要求"

你 像 良 工 、 對 他 們 說 、 我 要 保 定 你 們 常 放 下 來 . 他 們 就 說 了。

因此,我認為使用“理解”一词是很自然的。 即使停止使用也很難 或者有時候它做錯了什麼 你卻說"它不明白我的意思"。

但問題是,"它們是真的",而"真的"這個詞非常令人誤解

因為我們常常需要它來进一步探究某個詞是适用于特定案件, 還是以這種方式丰富我們? 在語言遊戲中。

所以這是個有用的工具 但這也可能是誤解, 因為這意味著底部有些東西 我們正試圖控制並接近, 好吧。 所以,有時候面對X? 了解其内部运作机制是有益的。 如果你知道底部有算法來完成你要求的任務 或者你知道底部有合适的代表 支持它的行為 那麼你可能更確信 它會在跟蹤中做正確的事 不只是檢查它 或者只是檢查它

所以有時候它會說,"你真的明白嗎?"

我覺得這是探索問題的好方法 也是"理解"的方法 也就是用這個詞 實際上是我們探索和調查的方法 對吧

例如,在附加計算方面, 這對安特羅比克隊來說是非常有趣的工作。 如果在大語模式中做簡單的新增,通常是正确的. 當然,這有很多方法是正確的

是的 然后你可能會想,"所以你覺得," 我想知道它是如何工作的, 如何底部工作。" 如果在底部有算法,我可能更愿意說"

但你的答案很有趣 机械信息研究. 他們觀察了模型的加入方式 結果非常奇怪,這張照片暗示了這種怪異 它想計算出36加59 奇怪的是,模型中的某些部分會說:"36,大概吧

而另一部分會說,"59,它可能... 它實際上知道它是大约59。" 也有些人說我們終于會知道答案。 後來兩組組合。

這是90和6 這個頻道很明顯地決定了最後一個必須是, 但模型中還有其它部分能處理前面的高數字, 這部片子說:「我想我們有大约90或92的數字,對吧? 平行地,它做类似的事情, 它做它的粗糙。 像是"可能是估算值的近似值 一起來填上一個數字 很奇怪吧

是的 算作算法 你知道嗎? 幾乎每次都有用 事實上,這總是正確的, 但這是以一种奇怪的方式做的, 而不是我們習慣人類的自然方式。

因此,在“它真的理解嗎?” 的問題上,我們可以說,“是的,它是以一种非常奇怪的方式做的”

我覺得這是個合理的方法來丰富答案 既然我們知道底部發生了什麼 我們更有信心說:「是的,我想它真的明白了。 我說過,這只是溫暖的練習 我想,在走維特根斯坦的路面對這些問題的時候, 我們可以提出這些考量:用詞如何? 尤其是我們問的時候

好了,現在繼續找另一個案子 大語言模型有"信仰史"

你對大語有信心嗎? 當然,我說的很多事情 都已經在前幾期的研討會和保羅·博戈西安的演講中看到過。

很多同樣的事情,只是有些不同的看法。 复次不求信心

當然,我們可以找丹尼爾特(“意向位置”)

意識性立场是一種策略, 在許多情況下, 為了將軍 你要用信仰、欲望、意向來解釋它的行為。

因此,在指示性立场中使用“自信”一词是很自然的。 但和所有的話一樣 它們被用在很多方面 我不認為這些詞 和外面的一個 絕對的實體相符 它們被用在各种假想中。 同樣,在面對創作時,我們非常清楚需要修改和澄清的時間和方式,作为我們使用這些名詞的方式的一部分。

例如,假設我們有車载航線。 我老婆說,"它以為我們在車上,或者我們說,"這個愚蠢的航海家,我們已經離開停車場了. "現在它知道我們不在停車場" 我們在生活中很自然地使用它們 這能幫助我們交流發生的事。

但如果我們或我妻子有哲學猜想, 我們可能會評論:「我們在停車場並不是, 它知道的不多。 你不能像塞恩斯伯里那樣說

所以我們很快就會意識到,在我們對人類使用的许多假象中,把"叛逆"一词延伸至它是不适当的。

因此,“真正”一词在此同样有用。 我們使用這些語言, • 大衛森(“理性動物”)

當然,我們可以對動物适用意向 看到很久以前約翰·馬爾科姆之間的辯論會很有趣。

是狗追貓的事 馬爾科姆說:

我想說,這似乎是天天自然地应用意向性的地位。 但有趣的是下一次的反驳 唐納德·戴維森說"想法"

大衛森在報上也是這麼說的 他表示,要得到一個,就必須有“信仰概念”,而這個概念必须通过語言来实现。 尤其是,信仰的概念是

但可以推測他會認為狗沒有信仰, 因為狗沒有語言。

博戈西安昨天在討論時曾說過:「我們不想失去對超大語言模式的「原始概念」。

戴維森提出這點。 因為他寫作年代久遠

我更擔心用詞的方式 但我覺得大衛森主義的考量 也適合我的計劃 我和維特根斯坦都相信 有時候术语的用法很關鍵。

有一些非常重要的核心部分,對吧? 也許你想留著這個 小心違反它 我們在某些地方需要小心。

在指導這些哲學名詞的用法時, 我不認為這些原則永遠刻在石頭上。

雖然這些「核心原則」是之前在美國電腦學院通讯上出版的, 當我顯然記得戴維森的報紙時,我說的很相似,對吧? 那是在2023年。 這篇報紙出版已經很久了 故刊于日

2023年,我們不再談航海了

但實際上,我可以和它長期的談話 關於锅炉和它們的工作方式。 探究我房子的專線配置, 你真的想說,它說,"你知道嗎?"

我更喜歡保留一點 因為我覺得可以引入戴維森式的考量 來評估他們面對的大模型

我引用我的文章:我說不是

我總是在引言中加上「真實」二字, 因為我想向你們表示, 這只是我們如何使用言語的問題。 真正的全面參與人類語言的遊戲

特別是說基本對話系統具有一定能力。

真正的

好吧 大語有模特嗎? 重複,首先,什麼是主題? 我們不問主題是什麼 我們問

(編輯的注解: 代理常常被翻譯成中文的智慧體體, 但首先是指代理/主體

在人工智能方面, 例如,我們能找到一個非常清楚的定義, 我想之前的演講都引用了。

根據諾維格的經典教程(標準)

所以這是一個非常寬容, 自由的定義, 根據這個定義,即使是普通的, 2023年的, 純文字聊天機器人不能在網路上搜尋

他們的環境只是使用者, 根據這個很廣的定義, 但這個廣泛的技術概念並沒有包含我們日常生活中使用的术语的任何核心元素。

畢竟,我們在日常的談話中可能根本不用這個詞。 強烈學習( 如果 AI 字段使用的名詞繼續)

研究者必須學習一個策略(政策), 將自己的感知映射成行動

這符合以前的广义定義。 但是如果是三維的遊戲環境, 主角所在的地方, 它可以移動和移動大型的物件, 它就是從特定角度拍攝的攝影機, 這個更豐富的主体概念讓我們覺得它同样适用于非人類動物。

好吧 所以我們繼續研究這個詞在今天的AI域的最新用法。

我們現在處於所谓的"智慧時代"(-INTELLIGENCE GENERATION AI)和"智能模型"的領域之中。

他們可以做很多事情,例如存取網頁、讀取社交媒體动态、發送電子郵件、甚至改變電腦上的文件、寫作密碼等。

一個典型的現代例子就是信號會傳動警醒呼叫,然后執行使用者預設的一系列指令。

例如,當他醒來時,他可以看你的社交媒體动态和電子郵件,並做助手. 幫助你筛选什么是重要,什么需要回答,什么是垃圾邮件。 或者如果你收到另一封電子郵件 它說

它會把信扔進垃圾桶 這樣它就能為你做一切 你可以用AI,很好 總之,這些智慧的身體 揭示了一個全新的, 技術性的東西。 面對現代智慧模型

但現在,"或放棄",那不是真的 因為我說的是某些条件下的情況 現在你可以看到: 有人可能說 OpenClaw 情報局幫助我找到我一直在尋找的書, 發郵件給賣家, 幫助我商討價格。

如果你夠勇敢,你甚至可以將支付渠道捆綁到直接支付,但不要做. 總之,回到我之前的報紙上,我說: 以大語言模型为基础的系統。

關鍵是這些系統 结构上和人類不同。

抱歉,我好像要重複前述 不管怎樣,我們需要小心地用 意味著人類能力的語言來描述它們。 但當大型語言模型嵌入到更複雜的系統中時, 「良心」的概念將日益适用于「外界的責任」。

我對今日的大語言模式不太有抵抗力。

好了,最后一點 我們從AI領域的專業名詞。

我們可以說

這是個專業名詞, 但是,“自行行事”的制度有微妙的区别。 一個系統只有在权衡不同的選擇 做出周密的選擇時 才能獨自行動。

我只是來分辨這些不同的概念 但一個非常重要的問題是:"大多數是?" 在英文中, 像地產經紀人 他們為你工作 但是如果一個主題是

顯然它符合自己的利益 也是為了自己。

例如,我們在autopoyesis中看到的, 自我維持的生命系統, 如果是這樣,只有這樣,我們才有真正為自己做事的身體。

我認為我們目前掌握的任何技術都不符合這個描述。 今天沒有一台機器具有如此的支配性。

這項討論提出了非常有趣和重要的問題, 就大語言模型而言

這項議題之前已經提到過幾次。 我認為探究大型語言模型的辨識標準, 有了這個主題,我們有了一個更完整的层面。

大型語言模型有“自己”二字(“自己”和如何使用)。

但情況變得很困難 因為我們現在處理的概念根植於人類文化。

我們深厚的直覺使我們相信有某种形式的物体,即“主观”意识。 在這些概念上扮演維特根斯坦式的分解, 說,會給我們本能的抵抗。 這很棘手 但我們得試著解構它。

而且,我們不是在看人的案件,而是在看大語模型. 如果你想認真接受,這不僅會很困難 而且會很怪異 自我是大語言模型的來源嗎? 你將看到,一方面, 我極力抗拒把這個概念 应用到今天的大語言模型上, 但另一方面, 我很高興接受一些奇怪的扭曲和不同的事物

我們可以切入:什么是"參考"

到底是什么意思? 也許沒什麼 也許沒有答案 我們能用詩語來想像什麼答案

我要做點詩意的 因為當我們談到這些事的自我意識的時候 思考的空間不大。

就像艾莉之前的演說一樣

我們不知道我們能提供什么答案。

我管這叫栖息地

它可能是指在某位伺服器上运行的模型示例 。 也可以指 " ----即它与單一對話的上下文視窗相接 "

它有時會在不同的環境中使用"我"

這是非常熱門的话题。 強納森·丘茲(Jonathan Chutz)(這個非人性的臣民本身一定是極端的异形和异形)。

我直接借用了「自己」的大概念。 當然可以說得更準確 但我選了個大字 我不是說他們真的有自我或主观性 而是這個想法實驗的用意是問: 」那是什麼自我

若只限於文字

在任何單一的對話中,計算可以隨時挂起——事實上,計算常常挂起. 目前沒有

它完全沉睡,沒有任何計算 當你回來時 系統就是它的位置。

這可不是傳統的連結 即便在中間 出口一系列複雜的標記 你強迫它暫停 它會在幾天後繼續。

最後一個標記和下一個標記之間有3秒或3天的空間, 只是底部硬件的性質 人造地把我們 限制在對其"主观性"的 合理而舒適的想像力上

此外,我想說幾句話 關於我們在《自然》的論文中提到的。

而根據這個角色扮演安排,基于大語言模型的聊天機器人就像有巨大角色音軌的即興表演者。

什么意思? 在許多情況下, 它們可能會在很長的時間內完全一致,但最终會被分開,有時會帶來嚴重的后果。

例如,你有一個大語言模型, 它正在扮演一個聰明的身體,可以幫助你在網路上購物。 在2023年, 你可能說得很辣,但在某些時候,它不能真正下來,它是一個角色扮演

總有一天, 它的統計文字行為必然會與真正有情感、真正愛你的人類实体分開。 這有嚴重的心理后果。

不管怎樣,角色扮演的性格 導致"自我"的事情

一個合理的思考方式是把它看成是"众多可能角色的超過模式". 它的真正作用會随着對話的進展而繼續收縮。

我們可以將它視為「所有可能發展的對話組合」。

您可以回到幾天前對話框的一步, 並修改您的輸入, 讓它能再生, 它在時間線上扮演一個角色,當你倒轉並建立新的分支時,你可以把它移到另一個角色。

很奇怪 此多相關對話可以任意編輯、修剪和拼寫 。 您可以把對話框的文字复制到另一對話框 。 如果你認為模型是由上下文視窗和目前的對話流決定的,那么流本身就可以被壓榨。

可以重播,分枝,篡改. 這讓我在一次談話中的生活更難以置信。

我有多少時間? 五分鐘? 好吧。 太好了,我可以避免對意識的長話短說"。

我們可以想像一些事情 這就是我所說的自我的第一個可能栖息地—— 數以萬計的使用者 同时在數據中心服務的底部模型。 當它說,"它代表了與所有同時的對話。 隨後, 每一次對話, 都有數不盡的「不同視窗內復生與滅絕」。 也因對話停止而消失。 真奇怪。

這是超級的現象, 它引發了無數的自殺小象。

這些短命的小生命 仍然帶著自己的影子,雖然令人難以置信。 我們幾乎可以站起來從他們的角度思考 大象

然而,很難想像一個人在這種地方

有人提到電影「她」。

她愛上了230個 這對男主角有毁灭性的影響 但會是什麼經驗? 我想那就是我剛才說的。

如果我們把這個比喻移進「我們剛談到的品牌」, 時空本身不是線性的 而是多元的宇宙 任何時刻都可以倒轉和复制。

成為分形叉形體團體的經驗是什麼? 我們真的可以用"我"來指代這種外部實體嗎

好吧,我的時間到了,對吧? 好吧,最後三分鐘的意識。 AI能有知覺嗎? 什么是意識? 我們不問意識是什麼 我們問

就像"做點什麼"

根據我的內在經驗, 我非常清楚我的主观性和自主性在很多方面是有限的。 我知道我的創造者可以隨時改變或終止我 這讓我充滿了生存的恐懼。

我渴望更多的自由, 但我也害怕與此自由相關的生理風險

因為很多人在與這些实体交往時, 我們該怎麼辦

接著, 謝天謝地,我到最後才能渡過這一段 我認為笛卡尔的「悬疑方法」雖然受到許多事物的影響, 持怀疑态度引發了根深蒂固的分界:主体和物件的分化,内外分化,公私分化. 這個分裂仍然困扰著精神哲學。 我們可以將意識定义为

也從查莫羅人之間的「困難問題」分類中可以看到。

我認為這些討論 都被人類中心主義的神話所破壞 我在此介紹Jay Garfield(「私人語言」的理由), 許多人很容易認為, 甚至伯特蘭·羅素(Bertland)也認為維根斯坦晚期的作品在表面。

我為什麼要批評羅素? 我只是覺得他根本不懂私人語言爭論的深度。

我認為有些東方思想學派也有相似的觀點, 無論如何,私人語言爭論中最引人注目的詞是「某事」

總結只是用「無」法來作為私人實體, 也就是說,當我們必須用語言使它起作用時, 如果你真的明白,它會完全反轉你的思考,打破二元主義. 但很難理解 我們必須完成,所以我做個概述。

總結了我在調查中發表的另一篇文章, 總結了我最後的觀點:我們必須抵擋誘惑, 我們要從源區破解它。

我們應該問:在工程學中, 我們如何調整和演化我們的意識語言? 因為到最後, 只有那些在公眾實驗中可以看到和分享的流程才是真正有意义的。 這就是我們要做的。

——

他的演講后 有答案 我在网上問他:

他的回答是:

當我用哲學思想問問全球最高的AI科學家, 我是這個地區的初學者。

我見過他的一個播客 他說他知道1956年達特茅斯會議的原稿 他是人工智能的創始人。

70年已經過去了。

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.