AI 論文變產品

PART 1 ｜ YC 為什麼辦 Paper Club

這不是讀書會，
而是把研究變成公司的入口

開場時，YC 說有超過一千人申請參加，最後只留下約一百人。主持人請現場舉手：誰有 citation、誰募過一百萬、五百萬、一千萬、五千萬美元。這個房間同時有研究聲望與公司經驗。

YC 選在 Pioneer 舉辦也有脈絡。主持人回憶 2016 年自己在 YC 時，早期 OpenAI 團隊會坐在旁邊問創辦人正在解什麼問題，因為他們也在找研究方向。這場 Paper Club 想重建同一件事：讓 AI 研究不只在論文裡循環，也能碰到產品壓力、客戶需求與公司判斷。

創業者讀 AI 論文，不是為了背新名詞。要問的是：哪個限制正在變貴、哪個能力快要變便宜、哪種產品以前做不到，現在開始有機會。

這支影片的五段分享剛好形成一張地圖：推論速度、機器人控制、世界模型、泛化理論與資料效率。它們看起來分散，放在新創視角下，其實都在回答同一題：下一個 AI 公司會卡在哪裡，又能從哪裡長出來。

PART 2 ｜五篇 paper 的創業翻譯

每篇論文都對應一種產品問題，
不是一段技術展示

01

推論

速度不只省錢，會決定模型能想多久、能服務多少人。

02

擴散控制

代理人先想像多個行動結果，再挑最接近目標的路徑。

03

世界模型

系統要知道自己預測錯了，才有機會安全地進入真實場景。

04

泛化

大模型不是魔法，壓縮、平坦解與偏好會影響學得多好。

05

資料效率

當好資料稀缺、算力變多，訓練配方本身會變成競爭力。

如果只把這些分享當成技術趨勢，會錯過 YC 的用意。Paper Club 把研究者和創辦人放在一起，是因為 AI 新創的產品邊界，常常先出現在研究限制裡。推論慢，產品就不能即時互動；代理人不會預測後果，就不敢接高風險流程；資料不夠，募再多錢也可能只是在重複訓練相同資訊。

創辦人要看的不是「哪篇 paper 最紅」，而是哪個限制會變成客戶願意付錢的痛點。這也是技術團隊和市場團隊最需要共用的語言。

PART 3 ｜推論不是成本中心

當模型會思考，
速度就變成產品能力

第一段分享談 Speculative Speculative Decoding。一般的 speculative decoding 會讓小模型先猜幾個 token，大模型再一次驗證。因為驗證比逐字生成更容易，系統可以用較低延遲接近大模型輸出。

新的想法是把原本前後相依的流程拆開。小模型不只先猜下一批 token，還會預測大模型可能接受到哪裡、接著會補哪個 token，並在大模型驗證時同步準備下一輪。若猜中，就把草稿延遲藏起來。分享者說這類預測可達到約 80% 到 90% 命中率，足以帶來速度提升。

推論系統的產品含義

更低延遲使用者感覺像即時互動

更多 token代理人能做更長規劃

更低成本同一預算服務更多請求

更高上限速度決定可交付的思考量

這對早期公司很重要。很多 AI 產品不是輸在模型不夠聰明，而是使用者等不起、單次請求太貴、代理人想得不夠久。當模型表現會隨思考量增加，tokens per second 就不只是工程指標，而是使用體驗、毛利與能力上限。

PART 4 ｜世界模型與可控代理人

下一代代理人不能只回覆，
還要先想像行動後果

第二段談 Diffusion Model Predictive Control。做法是把控制拆成三件事：提出一組可能行動、用 dynamics model 預測未來狀態、依照目標選出最好的行動。擴散模型的角色，是更好地產生多步行動提案與多步未來預測，減少一步一步推下去的誤差。

第三段延伸到 latent world model。世界模型的目標，是讓系統學會「如果我做這個動作，世界會變成什麼樣」。它可以在潛在空間裡快速規劃，也可以偵測模型誤差。當物體顏色被改掉、位置突然被移動，模型錯誤會出現尖峰，表示代理人知道自己碰到不熟悉的狀況。

產品場景

只有回覆模型

有世界模型的代理人

機器人

模仿看過的動作，環境變了就容易失準。

先預測行動後果，再依新目標或新動態調整。

企業流程

依照指令呼叫工具，但不一定知道副作用。

把不同路徑的結果先攤開，降低錯誤操作成本。

高風險產品

回答看起來順，但不知道自己何時不確定。

能偵測預測錯誤，必要時停下來或交給人。

這給 AI 新創一個清楚方向：真正能進入工作流的代理人，不只要會生成文字，也要能規劃、校正、知道自己可能錯。能把「可控」和「可偵錯」做進產品的人，會比只做聊天介面的人更接近企業採購。

PART 5 ｜泛化與資料效率

算力變多之後，
好資料反而更稀缺

第四段分享 Andrew Gordon Wilson 的觀點：深度學習沒有那麼神祕。過度參數化、benign overfitting、double descent 這些現象，不必被當成不可解釋的魔法。PAC-Bayes、壓縮、平坦解與 soft inductive bias，仍然能幫助理解為什麼大模型可以在訓練資料上擬合得很好，卻仍能在新資料上表現不錯。

第五段把問題推到更接近商業現實的地方：如果資料有限，但算力很多，預訓練該怎麼做？分享者提到，公開估計的人類文字資料成長很慢，而預訓練算力投入成長快很多。未來每個資料點能分到更多算力，訓練方法就要改。

30x

更強 weight decay

在資料受限設定下，強正則化讓更大模型繼續降低 loss。

5x

資料效率

regularization 加 ensembling 的配方，帶來有效資料量提升。

83%

蒸餾保留

把 ensemble 蒸餾回小模型，仍保留多數 loss 改善。

17x

延續預訓練

在數學資料設定裡，少量資料加配方可接近完整資料效果。

這對創辦人的翻譯很直接。當所有人都能買 GPU，資料、評估方法、訓練配方與蒸餾管線會變得更重要。護城河不一定是「我有最大的模型」，也可能是「我能用有限資料做出足夠好的模型，而且推論成本可接受」。

PART 6 ｜從 paper 到成長路徑

創辦人要找的不是技術名詞，
而是會持續變痛的瓶頸

把五段分享放在一起，會看到 AI 新創的成長路徑不是「先做 demo，再等市場出現」。更好的順序是先找正在變痛的限制，再看技術是否讓你能交付新能力，最後找到願意為那個能力付錢的客戶。

你讀到的 paper

創業者該問

可能的公司路線

推論加速

誰的產品受限於延遲、成本或思考長度？

代理人平台、推論基礎設施、即時互動產品。

擴散控制

哪個場景需要在部署時適應新目標？

機器人、自動化流程、能重規劃的操作代理人。

世界模型

客戶為什麼不敢讓 AI 自己行動？

可偵錯代理人、安全監控、真實場景模擬。

泛化理論

你的模型如何在新客戶、新資料上保持可靠？

評估、模型壓縮、訓練偏好設計、可靠性工具。

資料效率

你的稀缺資產是資料、標註、回饋還是領域知識？

垂直模型、蒸餾管線、合成資料與高品質資料產品。

募資故事也會跟著改變。投資人不只想聽「我們用了最新模型」，而是想知道你掌握哪個瓶頸、為誰省下多少成本、讓哪個新工作流第一次變可行。研究可以讓你比市場早一步看到能力變化，但公司要靠產品與客戶把那一步走完。

⏱️

能力是否變便宜

若推論或訓練成本下降，原本太貴的使用情境會重新打開。

🧭

風險是否可管理

能預測後果、偵測錯誤、知道何時停下來，企業才敢部署。

📦

資產是否可累積

資料、評估、蒸餾與客戶回饋，會決定 demo 能不能變成公司。

AI 論文變產品，
創業者該看哪裡？

這不是讀書會，
而是把研究變成公司的入口

每篇論文都對應一種產品問題，
不是一段技術展示

當模型會思考，
速度就變成產品能力

下一代代理人不能只回覆，
還要先想像行動後果

算力變多之後，
好資料反而更稀缺

創辦人要找的不是技術名詞，
而是會持續變痛的瓶頸

如果你今天做 AI 新創，
會先押哪個瓶頸？

想聽原始分享？

AI 論文變產品，創業者該看哪裡？

這不是讀書會，而是把研究變成公司的入口

每篇論文都對應一種產品問題，不是一段技術展示

當模型會思考，速度就變成產品能力

下一代代理人不能只回覆，還要先想像行動後果

算力變多之後，好資料反而更稀缺

創辦人要找的不是技術名詞，而是會持續變痛的瓶頸

如果你今天做 AI 新創，會先押哪個瓶頸？

想聽原始分享？

區塊勢每週深入拆解一個你該知道的科技趨勢

AI 論文變產品，
創業者該看哪裡？

這不是讀書會，
而是把研究變成公司的入口

每篇論文都對應一種產品問題，
不是一段技術展示

當模型會思考，
速度就變成產品能力

下一代代理人不能只回覆，
還要先想像行動後果

算力變多之後，
好資料反而更稀缺

創辦人要找的不是技術名詞，
而是會持續變痛的瓶頸

如果你今天做 AI 新創，
會先押哪個瓶頸？

區塊勢每週深入拆解一個
你該知道的科技趨勢