YC 第一場 Paper Club,
把研究者、創辦人與投資人
拉進同一個房間。
重點不是講完公式,
而是看見下一批產品、
市場與募資故事。
來源:Y Combinator
開場時,YC 說有超過一千人申請參加,最後只留下約一百人。主持人請現場舉手:誰有 citation、誰募過一百萬、五百萬、一千萬、五千萬美元。這個房間同時有研究聲望與公司經驗。
YC 選在 Pioneer 舉辦也有脈絡。主持人回憶 2016 年自己在 YC 時,早期 OpenAI 團隊會坐在旁邊問創辦人正在解什麼問題,因為他們也在找研究方向。這場 Paper Club 想重建同一件事:讓 AI 研究不只在論文裡循環,也能碰到產品壓力、客戶需求與公司判斷。
創業者讀 AI 論文,不是為了背新名詞。要問的是:哪個限制正在變貴、哪個能力快要變便宜、哪種產品以前做不到,現在開始有機會。
這支影片的五段分享剛好形成一張地圖:推論速度、機器人控制、世界模型、泛化理論與資料效率。它們看起來分散,放在新創視角下,其實都在回答同一題:下一個 AI 公司會卡在哪裡,又能從哪裡長出來。
如果只把這些分享當成技術趨勢,會錯過 YC 的用意。Paper Club 把研究者和創辦人放在一起,是因為 AI 新創的產品邊界,常常先出現在研究限制裡。推論慢,產品就不能即時互動;代理人不會預測後果,就不敢接高風險流程;資料不夠,募再多錢也可能只是在重複訓練相同資訊。
創辦人要看的不是「哪篇 paper 最紅」,而是哪個限制會變成客戶願意付錢的痛點。這也是技術團隊和市場團隊最需要共用的語言。
第一段分享談 Speculative Speculative Decoding。一般的 speculative decoding 會讓小模型先猜幾個 token,大模型再一次驗證。因為驗證比逐字生成更容易,系統可以用較低延遲接近大模型輸出。
新的想法是把原本前後相依的流程拆開。小模型不只先猜下一批 token,還會預測大模型可能接受到哪裡、接著會補哪個 token,並在大模型驗證時同步準備下一輪。若猜中,就把草稿延遲藏起來。分享者說這類預測可達到約 80% 到 90% 命中率,足以帶來速度提升。
這對早期公司很重要。很多 AI 產品不是輸在模型不夠聰明,而是使用者等不起、單次請求太貴、代理人想得不夠久。當模型表現會隨思考量增加,tokens per second 就不只是工程指標,而是使用體驗、毛利與能力上限。
第二段談 Diffusion Model Predictive Control。做法是把控制拆成三件事:提出一組可能行動、用 dynamics model 預測未來狀態、依照目標選出最好的行動。擴散模型的角色,是更好地產生多步行動提案與多步未來預測,減少一步一步推下去的誤差。
第三段延伸到 latent world model。世界模型的目標,是讓系統學會「如果我做這個動作,世界會變成什麼樣」。它可以在潛在空間裡快速規劃,也可以偵測模型誤差。當物體顏色被改掉、位置突然被移動,模型錯誤會出現尖峰,表示代理人知道自己碰到不熟悉的狀況。
這給 AI 新創一個清楚方向:真正能進入工作流的代理人,不只要會生成文字,也要能規劃、校正、知道自己可能錯。能把「可控」和「可偵錯」做進產品的人,會比只做聊天介面的人更接近企業採購。
第四段分享 Andrew Gordon Wilson 的觀點:深度學習沒有那麼神祕。過度參數化、benign overfitting、double descent 這些現象,不必被當成不可解釋的魔法。PAC-Bayes、壓縮、平坦解與 soft inductive bias,仍然能幫助理解為什麼大模型可以在訓練資料上擬合得很好,卻仍能在新資料上表現不錯。
第五段把問題推到更接近商業現實的地方:如果資料有限,但算力很多,預訓練該怎麼做?分享者提到,公開估計的人類文字資料成長很慢,而預訓練算力投入成長快很多。未來每個資料點能分到更多算力,訓練方法就要改。
這對創辦人的翻譯很直接。當所有人都能買 GPU,資料、評估方法、訓練配方與蒸餾管線會變得更重要。護城河不一定是「我有最大的模型」,也可能是「我能用有限資料做出足夠好的模型,而且推論成本可接受」。
把五段分享放在一起,會看到 AI 新創的成長路徑不是「先做 demo,再等市場出現」。更好的順序是先找正在變痛的限制,再看技術是否讓你能交付新能力,最後找到願意為那個能力付錢的客戶。
募資故事也會跟著改變。投資人不只想聽「我們用了最新模型」,而是想知道你掌握哪個瓶頸、為誰省下多少成本、讓哪個新工作流第一次變可行。研究可以讓你比市場早一步看到能力變化,但公司要靠產品與客戶把那一步走完。
在 AI 新創裡,論文不是產品路線圖;它是提早看見下一個成本、延遲、資料或信任瓶頸的工具。
YC Paper Club 的價值,是把研究問題翻成創辦人能行動的市場問題。
選完之後,分享你的觀點
這頁整理自 Y Combinator YouTube 頻道影片。原始影片保留了五段 paper talk 對推論、擴散控制、世界模型、泛化與資料效率的完整說明。
前往 YouTube →喜歡這種分析嗎?
從 AI 代理人、創投生態到平台策略,用台灣讀者看得懂的語言,把複雜的產業變局說清楚。目前已有超過 2 萬位讀者訂閱。
免費訂閱區塊勢 →也可以直接付費支持,解鎖每週完整文章