Start / 硅谷101 / E179%ef%bd%9cdeepseek%e6%8a%80%e6%9c%af%e8%a7%a3%e6%9e%90%ef%bc%9a%e4%b8%ba%e4%bd%95%e5%bc%95%e5%8f%91%e8%8b%b1%e4%bc%9f%e8%be%be%e8%82%a1%e4%bb%b7%e4%b8%8b%e8%b7%8c%ef%bc%9f

E179｜DeepSeek技术解析：为何引发英伟达股价下跌？

65 min • 6 februari 2025

随着DeepSeek登上苹果App Store榜首，这款低成本、高性能的开源模型引发全球关注的同时，也造成了英伟达股价在1月27日下跌近17%，市值蒸发5890亿美元。按理说，像DeepSeek这样的开源模型会带动AI创业繁荣，进而推高GPU需求。为什么英伟达却不涨反跌？本期节目我们将和模型算法、GPU虚拟化领域的学者与创业者，一起探讨DeepSeek的核心优势，它对芯片产业和开源生态的影响，还原这场市场震动背后的逻辑。

【主播】
泓君Jane，硅谷101创始人，播客主理人
【嘉宾】
陈羽北，加州大学戴维斯分校电子与计算机工程系助理教授，AIzip.ai联合创始人
John Yue，Inference.ai创始人兼CEO

【你将听到】
02:29 DeepSeek的三板斧：低成本、高性能、全开源
03:57 大模型创新瓶颈：技术路线趋同，突破性想法变少
05:09 核心创新：V3基础模型能力强
07:01 创新一：MOE与绕过稀疏奖励
09:04 创新二：通过蒸馏学习传递能力，大模型教小模型
12:46 为何V3出来一个月之后才引爆股市
13:54 对英伟达利好与利空：冲击溢价但并未冲垮壁垒
16:01 DeepSeek冲击英伟达两大护城河：“绕过”NVLink和CUDA
23:00 类似于Groq的推理芯片能崛起吗？软件依然是难点
29:11 《The Bitter Lesson》的启发：AI的两种基本能力是学习与搜索
30:06 效率困境：AI需要跨越三个数量级才能达到人类智能
35:20 开源的意义：降低AI应用开发准入门槛
38:06 重构API价格体系：DeepSeek R1通过技术优化将成本降至OpenAI O1的1/27
39:47 降级芯片难持续：老款芯片停产限制了成本优化空间
43:08 小模型特定场景突破：某些任务已可媲美大模型表现
45:34 未来AI基建分层化：端、边、云分工协同是趋势
48:32 Anthropic的预测过分乐观：AI学习效率太低不足以追赶人类智能
53:10 大模型本身不足以通向AGI，但基础研究方向正在取得进展
56:00 模型自我能力提升是达到AGI的核心门槛
57:33 通往AGI的多条路径：世界模型等不同技术方向并存
01:03:22 提问DeepSeek ：数据与持续创新能力

【其他相关信息】

MOE (Mixture of Experts，专家混合模型)：一种神经网络架构，结合多个专家子模型进行工作，通过负载均衡提高效率，适用于大规模模型。
Bootstrap (自举法)：模型通过生成多个答案并选择最佳结果，来提升自身性能的自我改进方法。
蒸馏 (Distillation)：将大模型的知识转移给小模型，通过模仿大模型的输出，提高小模型的能力。
GRPO (Group Relative Policy Optimization ，分组相对策略优化）：一种用于强化学习的优化算法，通过在同一问题下生成多个输出（即“分组”），并对这些输出进行相对比较来计算奖励。这种方法避免了传统 PPO 中对价值函数的依赖，从而显著减少了内存和计算资源的消耗。
PPO (Proximal Policy Optimization，近端策略优化)：一种强化学习算法，通过限制策略更新的幅度来保持优化的稳定性。
负载均衡 (Load Balance)：在分布式系统中平衡计算任务，避免过度集中或资源闲置。
强化学习 (Reinforcement Learning)：通过奖励机制引导AI模型学习最优策略的机器学习方法。
模型预测控制 (Model Predictive Control)：基于对未来状态的预测来优化当前决策的方法，广泛用于自动化控制。
NV Link (NVIDIA Link)：英伟达开发的高速芯片互联技术，支持多GPU协同工作，提升计算效率。
CUDA (Compute Unified Device Architecture，统一计算设备架构)：英伟达推出的并行计算平台和编程模型，用于加速GPU上的计算任务。
PTX (Parallel Thread Execution，并行线程执行)：CUDA平台底层的指令集架构，直接与GPU硬件交互。
CUDA Core/Tensor Core：CUDA Core 是GPU中的基础计算单元，负责执行并行计算任务；而 Tensor Core 是专门为加速深度学习中的矩阵运算和AI任务设计的计算单元，提供更高的计算效率。
ASIC (Application Specific Integrated Circuit，专用集成电路)：为特定应用定制的集成电路，通常用于高效处理特定任务。
Groq：一家专注于开发AI专用芯片的美国公司，提供高效的AI计算解决方案。
《The Bitter Lesson》(痛苦的教训)：Rich Sutton的经典文章，提出在AI发展中，计算能力和规模比算法精巧性更为重要。
世界模型 (World Model)：一种能够预测动作后果的AI模型，常用于环境模拟、决策规划和强化学习中。
《Genie 2》：DeepMind的研究论文，介绍了一个可以在任意2D图像中进行自由移动探索的AI模型 - 给它一张图片，AI就能变成图中的"主角"，可以在画面中前后左右走动，仿佛真的进入了这个2D世界。这是一个重要的"世界模型"(World Model)的实例。
HPC (High Performance Computing，高性能计算)：使用超级计算机集群处理复杂的计算任务，通常应用于科学计算、气候模拟等高需求场景。

【监制】
杜秀
【后期】
AMEI
【BGM】
Dusk Movers - Alexandra Woodward
City Phases STEMS INSTRUMENTS - John Abbot

【在这里找到我们】
公众号：硅谷101
收听渠道：苹果｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐｜荔枝播客
海外用户：Apple Podcast｜Spotify｜TuneIn｜YouTube｜Amazon Music
联系我们：podcast@sv101.net

Special Guests: John Yue and 陈羽北.

Senaste avsnitt

E179｜DeepSeek技术解析：为何引发英伟达股价下跌？

Senaste avsnitt

E202｜对话肖风：在香港稳定币的沸腾时刻，一些回归常识的冷思考

E201｜OpenAI挑战通用型AI Agent，聊聊Agent的底层架构、AGI转折点与RL人才分布

E200｜投资人视角深聊：AI Agent的核心壁垒与投资逻辑

E199｜悬赏1亿美金逆转人类10年生理年龄，抗衰疗法距离落地还有多远？

E198｜美国药价为何是欧洲的5-10倍？聊聊美国药价之困与制药公司崛起的秘密

E197｜七大模型多模态之争，AI如何改变动漫产业？

E196｜稳定币之战：Circle崛起之路与传统金融入局的新势力角逐

E195｜从工具到伙伴：七位AI Agent深度使用者的思考

E194｜欧美顶流网红都在做美妆？聊聊从流量到品牌的操盘逻辑

E193｜吃益生菌是智商税吗？全面复盘肠道健康迷思

E192｜谷歌的翻身仗与Gemini背后的灵魂人物｜解析2025谷歌 I/O

E191｜小而美的机会来了，聊聊这轮AI Agent进化新范式

E190｜司美格鲁肽的新对手们：制药巨头混战减肥药下半场

E189｜DEI的风暴眼：常春藤、硅谷与被改写的“美国梦”

E188｜靠自学造火箭挑战SpaceX，Rocket Lab的太空版图

E187｜关税战难解美国制造业困境，旧秩序正在崩溃

E186｜美国稳定币发币潮，区块链如何改变传统金融版图？

E185｜无共识的量子竞赛：群雄逐鹿与争议中的微软

E184｜“我爱你，这不是算法”：15个被AI击中瞬间的声音故事

E183｜比特币巨鲸微策略：一个溢价增发的资本游戏

E182｜影子美元与金融新秩序：起底全球人均最赚钱的公司Tether

E181｜聊天的艺术：如何打造高情商的AI机器人？

声音稿件征集｜你的AI时刻

E180｜量子计算的Transformer时刻与科技巨头的路径之争

E179｜DeepSeek技术解析：为何引发英伟达股价下跌？

E178｜智能眼镜大战CES：靠AI不如产品硬

E177｜“没有AI我会难受至极”：与大学生聊聊智能工具的依赖与适应

E176｜SpaceX 的商业版图与太空经济的崛起

E175｜专访导演方励：人类没有未来

E174｜当巨头们失去了创新力，聊聊如何做一双好鞋

E173｜一个对硅谷教育不满的老师，做了一所自己的学校

E172｜大选影响下的硅谷：比特币总统、逆行者与反觉醒文化

E171｜濒临破产的23andMe与基因检测行业的新旧交替

E170｜大模型应用之困与异军突起的“埃森哲们”

E169｜特斯拉Robotaxi发布会的台前幕后：兴奋的现场与失望的华尔街

E168｜全息显示的AR眼镜真的来了，聊聊Meta Connect与日趋成熟的XR生态

E167｜聊聊顶流网红做服装：卡戴珊与她的内衣王国Skims

E166｜聊聊火人节与硅谷精神：挑战规则、反叛权威的双生花

活动预告：我们硅谷线下见

E165｜智能眼镜爆发前夜，与Ray-Ban Meta产品经理聊聊如何打造一款热门AI眼镜

E164｜当电影遇上AI：与好莱坞特效美术聊聊他们和新工具的博弈

E163｜与大疆Pocket首任产品经理聊聊：如何从无到有定义一款硬件产品？

E162｜清华姚班如何培养天才：给最有挑战性的问题和足够的自由度

E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

E160｜重新理解信息茧房：为何科学研究与我们主观感受相反？

E159｜音乐节经济：不划算但停不下来

E158｜走访锈带：美国大选的反直觉认知与不被看见的人

E157｜净利润24万，与充值过亿的爆款制作人聊聊短剧平台到底挣不挣钱？

E156｜自动驾驶领域的GPT时刻来了？聊聊特斯拉V12、FSD入华与RoboTaxi

E155｜马斯克太空梦进度条70%，聊聊星舰的四次发射与SpaceX Mafia

E154｜一己之力拉动全球经济的Taylor Swift：她如何成为音乐界顶流？

E153｜聊聊被过度营销反噬的Sam Altman与OpenAI的深层危机

E152｜对话NVIDIA和五源资本：“具身智能”能带领这波机器人热走多远？

E151｜事故频发、吹哨人离奇死亡，波音怎么了？

E150｜与侯晓迪聊聊自动驾驶与搅局的马斯克

E149｜科技巨头们开始抢电？聊聊AI用电荒和核聚变创业热

E148读书日特辑｜那些改变世界的人，热爱、信仰与坚持的故事（附诺奖采访）

E147｜Suno引爆音乐圈，与音乐人聊聊AI生成音乐与艺术的随机数

E146｜对话李稻葵：Tiktok危机与跳动的博弈

E145 | 对话Meta田渊栋：被Transformer改变的世界与人类AGI的野心

E144｜与徐梧聊聊Vision Pro：十倍于移动互联网的机会爆发？

E143｜亲历者讲述：神秘的长寿乌托邦与疯狂的生物极客运动

E142｜投资人视角下的脑机接口与不可忽视的xAI

E141｜我们用了10款AI工具，最后又回到了版权库

E140｜让盲人重现光明？聊聊Neuralink和视网膜脑机接口

E139｜对话《三体》视觉导演陆贝珂：GenAI改变的影视特效业

E138｜如何用大模型提升学习效率？来自1100小时的深度使用体验

E137｜逐帧分析AI Pin，AI硬件挑战苹果的风口来了

E136｜短剧出海："霸道总裁爱上我"如何风靡全球？

E135｜大模型带火的下一个风口：向量数据库

E134｜OpenAI治理架构，以及非营利组织对抗微软的三大经典战役

E133｜开源打法的秘诀与AI重塑的数据库行业

E132｜诺和诺德 PK 礼来：减肥药的王者之争

E131｜OpenAI动荡始末：两股硅谷势力的角逐与“执剑人”Ilya

E130｜聊聊智能硬件出海的全球版图：大模型、 新爆款与合规陷阱

E129｜判例连出，盘点加密货币的监管思路与年度大案Ripple

E128｜F1的商业生态：明星车手、车队与内燃机最后的辉煌

E127 | 最昂贵的赛车运动如何赚钱？聊聊F1的商业模式

E130｜聊聊智能硬件出海的全球版图：大模型、新爆款与合规陷阱

E107｜AI大爆发：OpenAI极早期历史，以及图像领域的GPT moment｜AIGC特辑