alt not available
名家觀點
陳健君:基礎設施內戰——推理層正在被重新定價
名家觀點
編輯精選
2026.04.05
陳健君:基礎設施內戰——推理層正在被重新定價
alt not available
Editorial Team
追蹤
Bookmark
alt not available
Loading...

這兩年談AI,大部分討論還停留在「模型誰更強」。但如果你把帳算細一點,很快會發現真正開始吃掉PnL的,已經不是訓練,而是推理。訓練像是你花幾個月研發一個新策略,貴但終究是一次性的;推理則是每天在市場上實盤跑這個策略,所有滑點、手續費、基礎設施開銷,都在這裡持續累積。當我們開始認真談Agent和Web4,把大量具體操作交給機器時,實際上是在把成本和風險,成批地掛到「推理層」這一端來。真正值得問的,不是「哪個模型最神」,而是「這一層到底由誰來定價」。

推理層首先是一個系統工程問題,而不是純粹的「多幾張GPU」問題。新一代模型需要長上下文、多輪思考、反覆自檢,還要串接各種工具和內外部系統。對基礎設施來說,同樣一塊算力,你能支撐多少併發的Agent、每個Agent能跑多長的思考鏈、尾端延遲能壓在什麼水準,這些都直接決定了上層產品的毛利和體驗。當模型逐漸變成可以自由更換的「大宗商品」,真正形成黏性和定價權的,反而是一整套推理引擎、路由策略和資源排程能力——也就是我們說的推理層。

接著才是硬體與主權雲,把這個推理層的邊界畫清楚。Nvidia仍握著高端加速卡的主導權,但在出口管制與地緣政治壓力之下,各國開始推自家晶片與主權雲,要求關鍵行業的數據與推理「必須跑在本地、跑在本國」。對大型機構來說,選哪條路線不只是效能和報價的比較,而是十年尺度的供應鏈風險管理:算力會不會某天拿不到?審計日誌能不能留在自己手裡?這些現實約束,使得推理層不再是抽象的雲端API,而是一個非常具體的「跑在某些機房、某些卡上的服務」。

從投資和產業的角度來看,推理層正悄悄變成新的中樞:一端連接越來越標準化、可替換的模型供給,另一端連接各種Agent執行層與業務工作流,再往上才是使用者眼中的應用介面。像 OpenClaw這樣的Agent平台,一方面把底層推理基礎設施的複雜度吃掉,讓企業不用被綁死在單一供應商;另一方面,它本身也在成為新的關鍵節點——所有智能體的請求與行為,最後都要通過這一層去消耗真實算力。在模型日益商品化的世界裡,我會把推理層看成下一輪基礎設施內戰的價格錨:誰既能駕馭硬體和主權雲現實,又能服務好上層的Agent與工作流,誰就更有機會長期拿走這一段的議價權。

撰文:陳健君(Jason)

OLAXBT 創辦人、數據科學家與量化交易員、HKICT Award FinTech Gold Award(2025)得主

alt not available