随着DeepSeek登上苹果App Store榜首,这款低成本、高性能的开源模型引发全球关注的同时,也造成了英伟达股价在1月27日下跌近17%,市值蒸发5890亿美元。按理说,像DeepSeek这样的开源模型会带动AI创业繁荣,进而推高GPU需求。为什么英伟达却不涨反跌?本期节目我们将和模型算法、GPU虚拟化领域的学者与创业者,一起探讨DeepSeek的核心优势,它对芯片产业和开源生态的影响,还原这场市场震动背后的逻辑。
【主播】
泓君Jane,硅谷101创始人,播客主理人
【嘉宾】
陈羽北,加州大学戴维斯分校电子与计算机工程系助理教授,AIzip.ai联合创始人
John Yue,Inference.ai创始人兼CEO
【你将听到】
02:29 DeepSeek的三板斧:低成本、高性能、全开源
03:57 大模型创新瓶颈:技术路线趋同,突破性想法变少
05:09 核心创新:V3基础模型能力强
07:01 创新一:MOE与绕过稀疏奖励
09:04 创新二: 通过蒸馏学习传递能力,大模型教小模型
12:46 为何V3出来一个月之后才引爆股市
13:54 对英伟达利好与利空:冲击溢价但并未冲垮壁垒
16:01 DeepSeek冲击英伟达两大护城河:“绕过”NVLink和CUDA
23:00 类似于Groq的推理芯片能崛起吗?软件依然是难点
29:11 《The Bitter Lesson》的启发:AI的两种基本能力是学习与搜索
30:06 效率困境:AI需要跨越三个数量级才能达到人类智能
35:20 开源的意义:降低AI应用开发准入门槛
38:06 重构API价格体系:DeepSeek R1通过技术优化将成本降至OpenAI O1的1/27
39:47 降级芯片难持续:老款芯片停产限制了成本优化空间
43:08 小模型特定场景突破:某些任务已可媲美大模型表现
45:34 未来AI基建分层化:端、边、云分工协同是趋势
48:32 Anthropic的预测过分乐观:AI学习效率太低不足以追赶人类智能
53:10 大模型本身不足以通向AGI,但基础研究方向正在取得进展
56:00 模型自我能力提升是达到AGI的核心门槛
57:33 通往AGI的多条路径:世界模型等不同技术方向并存
01:03:22 提问DeepSeek :数据与持续创新能力
【其他相关信息】
【监制】
杜秀
【后期】
AMEI
【BGM】
Dusk Movers - Alexandra Woodward
City Phases STEMS INSTRUMENTS - John Abbot
【在这里找到我们】
公众号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|YouTube|Amazon Music
联系我们:podcast@sv101.net
Special Guests: John Yue and 陈羽北.
En liten tjänst av I'm With Friends. Finns även på engelska.