AI 論文變產品,
創業者該看哪裡?

YC 第一場 Paper Club,
把研究者、創辦人與投資人
拉進同一個房間。
重點不是講完公式,
而是看見下一批產品、
市場與募資故事。

來源:Y Combinator

SCROLL
PART 1 | YC 為什麼辦 Paper Club

這不是讀書會,
而是把研究變成公司的入口

開場時,YC 說有超過一千人申請參加,最後只留下約一百人。主持人請現場舉手:誰有 citation、誰募過一百萬、五百萬、一千萬、五千萬美元。這個房間同時有研究聲望與公司經驗。

YC 選在 Pioneer 舉辦也有脈絡。主持人回憶 2016 年自己在 YC 時,早期 OpenAI 團隊會坐在旁邊問創辦人正在解什麼問題,因為他們也在找研究方向。這場 Paper Club 想重建同一件事:讓 AI 研究不只在論文裡循環,也能碰到產品壓力、客戶需求與公司判斷。

創業者讀 AI 論文,不是為了背新名詞。要問的是:哪個限制正在變貴、哪個能力快要變便宜、哪種產品以前做不到,現在開始有機會。

這支影片的五段分享剛好形成一張地圖:推論速度、機器人控制、世界模型、泛化理論與資料效率。它們看起來分散,放在新創視角下,其實都在回答同一題:下一個 AI 公司會卡在哪裡,又能從哪裡長出來。

PART 2 | 五篇 paper 的創業翻譯

每篇論文都對應一種產品問題,
不是一段技術展示

01
推論
速度不只省錢,會決定模型能想多久、能服務多少人。
02
擴散控制
代理人先想像多個行動結果,再挑最接近目標的路徑。
03
世界模型
系統要知道自己預測錯了,才有機會安全地進入真實場景。
04
泛化
大模型不是魔法,壓縮、平坦解與偏好會影響學得多好。
05
資料效率
當好資料稀缺、算力變多,訓練配方本身會變成競爭力。

如果只把這些分享當成技術趨勢,會錯過 YC 的用意。Paper Club 把研究者和創辦人放在一起,是因為 AI 新創的產品邊界,常常先出現在研究限制裡。推論慢,產品就不能即時互動;代理人不會預測後果,就不敢接高風險流程;資料不夠,募再多錢也可能只是在重複訓練相同資訊。

創辦人要看的不是「哪篇 paper 最紅」,而是哪個限制會變成客戶願意付錢的痛點。這也是技術團隊和市場團隊最需要共用的語言。

PART 3 | 推論不是成本中心

當模型會思考,
速度就變成產品能力

第一段分享談 Speculative Speculative Decoding。一般的 speculative decoding 會讓小模型先猜幾個 token,大模型再一次驗證。因為驗證比逐字生成更容易,系統可以用較低延遲接近大模型輸出。

新的想法是把原本前後相依的流程拆開。小模型不只先猜下一批 token,還會預測大模型可能接受到哪裡、接著會補哪個 token,並在大模型驗證時同步準備下一輪。若猜中,就把草稿延遲藏起來。分享者說這類預測可達到約 80% 到 90% 命中率,足以帶來速度提升。

推論系統的產品含義
更低延遲使用者感覺像即時互動
更多 token代理人能做更長規劃
更低成本同一預算服務更多請求
更高上限速度決定可交付的思考量

這對早期公司很重要。很多 AI 產品不是輸在模型不夠聰明,而是使用者等不起、單次請求太貴、代理人想得不夠久。當模型表現會隨思考量增加,tokens per second 就不只是工程指標,而是使用體驗、毛利與能力上限。

PART 4 | 世界模型與可控代理人

下一代代理人不能只回覆,
還要先想像行動後果

第二段談 Diffusion Model Predictive Control。做法是把控制拆成三件事:提出一組可能行動、用 dynamics model 預測未來狀態、依照目標選出最好的行動。擴散模型的角色,是更好地產生多步行動提案與多步未來預測,減少一步一步推下去的誤差。

第三段延伸到 latent world model。世界模型的目標,是讓系統學會「如果我做這個動作,世界會變成什麼樣」。它可以在潛在空間裡快速規劃,也可以偵測模型誤差。當物體顏色被改掉、位置突然被移動,模型錯誤會出現尖峰,表示代理人知道自己碰到不熟悉的狀況。

產品場景
只有回覆模型
有世界模型的代理人
機器人
模仿看過的動作,環境變了就容易失準。
先預測行動後果,再依新目標或新動態調整。
企業流程
依照指令呼叫工具,但不一定知道副作用。
把不同路徑的結果先攤開,降低錯誤操作成本。
高風險產品
回答看起來順,但不知道自己何時不確定。
能偵測預測錯誤,必要時停下來或交給人。

這給 AI 新創一個清楚方向:真正能進入工作流的代理人,不只要會生成文字,也要能規劃、校正、知道自己可能錯。能把「可控」和「可偵錯」做進產品的人,會比只做聊天介面的人更接近企業採購。

PART 5 | 泛化與資料效率

算力變多之後,
好資料反而更稀缺

第四段分享 Andrew Gordon Wilson 的觀點:深度學習沒有那麼神祕。過度參數化、benign overfitting、double descent 這些現象,不必被當成不可解釋的魔法。PAC-Bayes、壓縮、平坦解與 soft inductive bias,仍然能幫助理解為什麼大模型可以在訓練資料上擬合得很好,卻仍能在新資料上表現不錯。

第五段把問題推到更接近商業現實的地方:如果資料有限,但算力很多,預訓練該怎麼做?分享者提到,公開估計的人類文字資料成長很慢,而預訓練算力投入成長快很多。未來每個資料點能分到更多算力,訓練方法就要改。

30x
更強 weight decay
在資料受限設定下,強正則化讓更大模型繼續降低 loss。
5x
資料效率
regularization 加 ensembling 的配方,帶來有效資料量提升。
83%
蒸餾保留
把 ensemble 蒸餾回小模型,仍保留多數 loss 改善。
17x
延續預訓練
在數學資料設定裡,少量資料加配方可接近完整資料效果。

這對創辦人的翻譯很直接。當所有人都能買 GPU,資料、評估方法、訓練配方與蒸餾管線會變得更重要。護城河不一定是「我有最大的模型」,也可能是「我能用有限資料做出足夠好的模型,而且推論成本可接受」。

PART 6 | 從 paper 到成長路徑

創辦人要找的不是技術名詞,
而是會持續變痛的瓶頸

把五段分享放在一起,會看到 AI 新創的成長路徑不是「先做 demo,再等市場出現」。更好的順序是先找正在變痛的限制,再看技術是否讓你能交付新能力,最後找到願意為那個能力付錢的客戶。

你讀到的 paper
創業者該問
可能的公司路線
推論加速
誰的產品受限於延遲、成本或思考長度?
代理人平台、推論基礎設施、即時互動產品。
擴散控制
哪個場景需要在部署時適應新目標?
機器人、自動化流程、能重規劃的操作代理人。
世界模型
客戶為什麼不敢讓 AI 自己行動?
可偵錯代理人、安全監控、真實場景模擬。
泛化理論
你的模型如何在新客戶、新資料上保持可靠?
評估、模型壓縮、訓練偏好設計、可靠性工具。
資料效率
你的稀缺資產是資料、標註、回饋還是領域知識?
垂直模型、蒸餾管線、合成資料與高品質資料產品。

募資故事也會跟著改變。投資人不只想聽「我們用了最新模型」,而是想知道你掌握哪個瓶頸、為誰省下多少成本、讓哪個新工作流第一次變可行。研究可以讓你比市場早一步看到能力變化,但公司要靠產品與客戶把那一步走完。

⏱️
能力是否變便宜
若推論或訓練成本下降,原本太貴的使用情境會重新打開。
🧭
風險是否可管理
能預測後果、偵測錯誤、知道何時停下來,企業才敢部署。
📦
資產是否可累積
資料、評估、蒸餾與客戶回饋,會決定 demo 能不能變成公司。

在 AI 新創裡,論文不是產品路線圖;它是提早看見下一個成本、延遲、資料或信任瓶頸的工具。

YC Paper Club 的價值,是把研究問題翻成創辦人能行動的市場問題。

如果你今天做 AI 新創,
會先押哪個瓶頸?

選完之後,分享你的觀點

你的觀點

想聽原始分享?

這頁整理自 Y Combinator YouTube 頻道影片。原始影片保留了五段 paper talk 對推論、擴散控制、世界模型、泛化與資料效率的完整說明。

前往 YouTube →