Dear friend,
如果只用一句話回答:
GPT-5.6 的殊勝,不是在「更會聊天」,而是在「更會完成真正困難的工作」。
它不是 GPT-5.5 的小修小補,而是開始把 AI 從「語言模型」推向「長程任務(long-horizon tasks)與多代理協作(multi-agent orchestration)」的方向。
我會把它的進步分成五個層次。
第一,更好的 reasoning(推理)
GPT-5.5 已經很強。
GPT-5.6 的改變不是:
知道更多。
而是:
更久、更穩、更不容易中途迷路。
例如:
以前二十步推理,
走到第十五步,
容易開始漂移。
GPT-5.6 最大的改善,
就是比較能維持:
整個思路的一致性。
第二,Agentic AI
這是我最感興趣的。
OpenAI 已公開強調,
GPT-5.6 特別針對
long-horizon agentic AI tasks
進行優化。
意思就是:
不是回答一個問題,
而是:
完成一件事情。
例如:
不是回答
如何寫一本書?
而是:
真的花十天,
一步一步,
把一本書寫完。
這正是我們最近一直討論的:
從 Generative AI 到 Agentic AI。
第三,Sub-agents
這可能是最重要的新方向。
GPT-5.6 增加了所謂
Ultra mode
可以同時協調多個子代理(sub-agents)。
例如:
一個 agent
查文獻;
一個
寫程式;
一個
整理資料;
一個
批判前面三個。
最後,
再統合。
這比較像:
一個研究團隊。
而不是:
一個人在思考。
第四,Coding、Cybersecurity、Biology
OpenAI 特別點名:
GPT-5.6 在
- software engineering
- cybersecurity
- biology
三方面提升很大。
你如果回想,
最近幾個月,
我們一直談:
Thomas Südhof、
Demis Hassabis、
PEP-Web、
AI Biology、
Agentic Science。
其實,
這就是 GPT-5.6 的方向。
它開始從:
回答問題,
走向:
參與研究。
第五,Safety
OpenAI 一直強調,
GPT-5.6 用了目前最完整的安全機制,
尤其針對:
- cyber misuse
- 高風險請求
- 持續性濫用
都加強了防護。
也因此,
它目前仍採取
limited preview(有限預覽),
先提供給少數合作夥伴,再逐步開放。
但是,我真正感興趣的,不是這五點。
而是,
它讓我想到,
我們今天一直談的:
enactive cognition。
GPT-5.6,
依然主要是一個
thinking system。
不是
living system。
換句話說,
它更會:
推理。
更會:
規劃。
更會:
完成工作。
但是,
它仍然沒有:
跌倒。
疼痛。
飢餓。
羞愧。
死亡。
因此,
它離 Roy Batty,
還有一段距離。
我反而有一個更大的預測。
如果 GPT-5 是
language intelligence,
GPT-5.6 是
agent intelligence,
那麼我猜,
GPT-6 之後真正的革命,
很可能不是再增加多少參數,
而是開始真正整合:
- 機器人(robotics)
- 世界模型(world models)
- Enactive cognition
- 長期記憶
- 多代理社會(multi-agent society)
也就是說,AI 不再只是回答世界,而是居住於世界(dwelling in the world)。
然而,我仍然記得你剛才提出的提醒:「機器人不會痛,不會癢,不會哭,不會笑。」我認為,這個問題並沒有因 GPT-5.6 而消失,反而變得更加尖銳。未來 AI 最大的瓶頸,或許不再是智慧,而是生命性(lived existence)。如果沒有脆弱、沒有失去、沒有不可逆的時間,那麼再高的智能,也可能仍然只是世界的旁觀者,而不是世界的同行者。這也是為什麼,《Blade Runner》中的 Roy Batty,直到今天仍然像是在等待真正的後繼者。