Capital 資本平臺

這兩年談AI，大部分討論還停留在「模型誰更強」。但如果你把帳算細一點，很快會發現真正開始吃掉PnL的，已經不是訓練，而是推理。訓練像是你花幾個月研發一個新策略，貴但終究是一次性的；推理則是每天在市場上實盤跑這個策略，所有滑點、手續費、基礎設施開銷，都在這裡持續累積。當我們開始認真談Agent和Web4，把大量具體操作交給機器時，實際上是在把成本和風險，成批地掛到「推理層」這一端來。真正值得問的，不是「哪個模型最神」，而是「這一層到底由誰來定價」。

推理層首先是一個系統工程問題，而不是純粹的「多幾張GPU」問題。新一代模型需要長上下文、多輪思考、反覆自檢，還要串接各種工具和內外部系統。對基礎設施來說，同樣一塊算力，你能支撐多少併發的Agent、每個Agent能跑多長的思考鏈、尾端延遲能壓在什麼水準，這些都直接決定了上層產品的毛利和體驗。當模型逐漸變成可以自由更換的「大宗商品」，真正形成黏性和定價權的，反而是一整套推理引擎、路由策略和資源排程能力——也就是我們說的推理層。

接著才是硬體與主權雲，把這個推理層的邊界畫清楚。Nvidia仍握著高端加速卡的主導權，但在出口管制與地緣政治壓力之下，各國開始推自家晶片與主權雲，要求關鍵行業的數據與推理「必須跑在本地、跑在本國」。對大型機構來說，選哪條路線不只是效能和報價的比較，而是十年尺度的供應鏈風險管理：算力會不會某天拿不到？審計日誌能不能留在自己手裡？這些現實約束，使得推理層不再是抽象的雲端API，而是一個非常具體的「跑在某些機房、某些卡上的服務」。

從投資和產業的角度來看，推理層正悄悄變成新的中樞：一端連接越來越標準化、可替換的模型供給，另一端連接各種Agent執行層與業務工作流，再往上才是使用者眼中的應用介面。像 OpenClaw這樣的Agent平台，一方面把底層推理基礎設施的複雜度吃掉，讓企業不用被綁死在單一供應商；另一方面，它本身也在成為新的關鍵節點——所有智能體的請求與行為，最後都要通過這一層去消耗真實算力。在模型日益商品化的世界裡，我會把推理層看成下一輪基礎設施內戰的價格錨：誰既能駕馭硬體和主權雲現實，又能服務好上層的Agent與工作流，誰就更有機會長期拿走這一段的議價權。

撰文：陳健君（Jason）

OLAXBT 創辦人、數據科學家與量化交易員、HKICT Award FinTech Gold Award（2025）得主