42章经 - RSSPod

2025-08-02 / 00:58:08

活动预告🥳：8 月 16 日，我们会办一场线上活动，嘉宾是 Luma AI 模型产品 Lead 戴高乐、爱诗科技联创谢旭璋、前 OpusClip 增长产品负责人谢君陶，大家记得翻到 shownotes 末尾查看报名信息！本期嘉宾朱亦博可以说是国内最懂 AI Infra 的人之一。从微软、字节 AI Infra 负责人到谷歌、再到阶跃联创，他的职业经历几乎和 AI Infra 的发展并行，如他所说，贾扬清、李沐等人可能是 AI Infra 的开路者，而他则是紧随其后的第二批从业者。在这期播客中，亦博不仅分享了 AI Infra 的底层认知，也讲了很多行业的内幕故事与实战细节。我们从最基础的 AI Infra 定义聊起，解答了其在模型表现中的作用、重要性，也揭示了“优化指标”的意义与评判标准，并讨论了行业现状和未来发展等等内容。听完这期，你可能会意识到：在大模型时代，AI Infra 不只是「降本」的后台支持，也是决定一家 AI 公司能走多远的核心战斗力。 BTW：阶跃最近刚刚开源了推理效率更高的基模 Step 3（github.com），亦博自己的团队也在招人中，感兴趣的可以联系邮箱：recruiting@step.ai 【人类博物馆】导游：曲凯，42 章经创始人 39 号珍藏：朱亦博，阶跃星辰联合创始人，前字节 AI Infra 负责人，也曾在微软、Google 任职 1:07 AI Infra 的定义 2:49 贾扬清、李沐是 AI Infra 的第一批人，我属于第二批 4:13 为什么说 Infra 迎来了一个新的 Google 级别的机会？ 6:21 移动互联网 vs 大模型时代：两代 Infra 有什么异同？ 7:38 算法人可能「只有 2 年的保质期」，Infra 更吃经验 8:40 怎么衡量 AI Infra 的好坏？几个关键指标 10:09 该不该、该怎么投入 Infra？一笔很好量化的 ROI 账 11:20 面对云厂商和模型公司的挤压，第三方公司的突破口是什么？ 14:17 对 Infra 人的一句忠告：要么深入模型、要么深入硬件 16:15 AI Infra 对模型效果到底有多大的影响？ 17:45 DeepSeek 能冲出来，一大原因是选对了优化目标 20:04 阶跃现在最重视的优化目标是什么？ 22:06 Infra、算法、数据团队之间该怎么配合？有关组织架构的心得体会 28:41 做 AI Infra 最大的阻碍是什么？ 30:16 模型范式不会那么快革新，但多模态可能是一个突破口 32:29 简评几家硅谷当红 AI Infra 公司 34:15 第三方 AI Infra 的创业机会在哪里？ 36:35 我们想提升国产卡的竞争力，哪怕只有一点点 39:28 介绍一下阶跃新发布的视觉推理模型 46:30 DeepSeek 做得好，就是因为梁文锋懂 Infra？ 47:54 一些业内真实的踩坑案例 55:13 给 Infra 从业者的一些建议 55:43 《The Bitter Lesson》的含金量还在上升【活动预告🥳】 8 月 16 日，我们会办一场线上活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-07-19 / 00:52:54

并购的本质 | 对谈云磬投资创始人立阳

最近，AI 创投圈接连出现了两起引人关注的收并购事件：智元机器人买入上市公司控股权、Windsurf 宣布被收购。收并购，似乎正越来越频繁地出现在创业者的视野中。相信大家对收并购这个词并不陌生，但未必了解其背后的资本逻辑，我们也一直对并购的运作方式有很多好奇之处。因此，本期节目我们请到了一位有十多年经验的资深并购投资人来一起聊聊收并购这件事。本期节目中我们聊到了智元近期的资本动作、并购基金与 VC/PE 的核心差异、一名优秀的并购投资人需要具备哪些关键能力，以及一桩复杂交易如何真正落地等。节目的最后，我们也请立阳从他的视角，给 AI 创业者分享了一些关于收并购的实用建议。【人类博物馆】导游：曲凯，42 章经创始人 38 号珍藏：张立阳，云磬投资创始人，有十五年的并购经验。此前，他曾先后任麦肯锡公司的战略分析师、中信资本的执行董事，及 TPG 亚洲基金的董事总经理。【时光机】 1:27 当我们说并购的时候，到底在说什么？ 6:54 为什么很多一级市场的人开始做二级市场？ 7:59 智元到底是不是在「借壳」？ 10:11 做并购和做 VC/PE 的核心区别是什么？ 12:14 并购是一件概率高、赔率低的事情？ 15:04 并购投资人就像工程师，要通过财务模型拧紧每一颗螺丝 17:55 为什么很多并购基金喜欢把上市公司私有化？ 19:27 并购的最大价值：通过改变生产关系解放生产力 20:59 并购通常都会管理层大换血吗？ 28:25 找项目的两个流派：行业覆盖 V.S. 抓结构性机会 29:56 做 VC 是投梦想，做并购是盘生意 32:12 怎么协调各方复杂的利益关系？ 36:13 一个案例：一场极限施压的伦敦闪电战 37:58 在顶尖 MBA 项目中学到的谈判技巧 44:51 做并购最关键的两件事 45:53 追 Alpha 就像气宗，追 Beta 则像剑宗 48:00 未来，并购在中国可能会怎么发展？ 49:19 给 AI 创业者的几点收并购建议【Reference】《门口的野蛮人》单伟建《金钱博弈》（Money Games：The Inside Story of How American Dealmakers Saved Korea's Most Iconic Bank）【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-06-28 / 00:33:18

人生就是一场大 Sales，如何做一个更好的 BD？ | 对谈某科技家办戴安琪

本期节目录制于一次内部分享活动。因为我们每天都在找人、聊人，于是请来了在 BD 方面颇有经验的 Angie，分享她的一些方法和心得。坦白讲，起初我们有点犹豫到底要不要发布这期播客，因为担心内容听起来比较“功利”，但最后还是决定放出来——因为只要你需要与人打交道，无论是找合作方、组建团队，还是建立一个更高效的社交网络，这些方法都非常实用。在这次分享中，Angie 提供了一整套 BD 框架：从如何确认线索、获取转介绍、建联，到如何增信、促成转化和实现长期经营，她一一拆解了每个关键环节背后的策略与思路，我也在一些问题上有所补充。其实，所有行业最后的本质都是 BD，世界本身也是一场大的 Sales。当我们掌握了 BD 的核心方法，也就拥有了与人建立连接、达成合作、共同前行的能力。当然，技巧只是起点。希望我们都可以在日常实践中不断积累势能，慢慢从一个自下而上的链接者，变成一个拥有影响力的构建者。【人类博物馆】导游：曲凯，42 章经创始人 37 号珍藏：戴安琪，某科技家办副总裁，前 36 氪出海创始团队，科技&跨境出海 super node Part 1 线索确认和转介绍 00:49 明确客户画像和渠道画像，是一切的起点 1:04 目标客户可以从哪找？ 5:21 思考题：你能脱口说出自己最牛的 1-3 点吗？ 5:55 BD 分两种：① 专业型 ② 人格魅力型 6:47 要善用平台的杠杆、精准提炼你的机构价值 8:15 怎么筛选出一个靠谱的转介绍人？ Part 2 怎么成功建联？ 9:30 「你是不是一个 likeable person」这件事很重要 11:19 找人不仅靠努力和运气，也需要运营 sense 11:54 把废话说好是一项非常牛的技能 12:41 沟通中最消极的反应是不说话，任何其他反应都能给你带来机会 13:58 想在线下约到重要客户？装熟 + 积极主动 + 坚持不要脸 15:24 怎么才能把废话说好？ 17:46 对于有好奇心、爱学的人来说，任何事情都是素材和课堂 18:55 一个让对方舒服的聊天框架：5 分钟闲天 + 45 分钟对方关心的事 + 10 分钟自己的需求 19:31 关于聊天的节奏感 Part 3 增信 20:26 任何细节都可以为你增信，包括你的微信头像 21:04 真诚是必杀技，不要在拿过更大结果的人面前耍小聪明 23:24 比较厉害的人都是理性判断、感性决策 24:34 做 BD 也需要动线设计，要在关键节点释放情绪价值 Part 4 转化 25:29 成功转化的核心：需求匹配 + 关系到位 27:46 把长期主义纳入每一次 BD 的微决策 29:39 只有当你知道自己想要什么时，别人才知道该怎么帮你 30:22 世界本身就是一场巨大的 Sales 【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-06-14 / 00:54:35

从 E2B 到 Browserbase，Agent Infra 新热点中有哪些大机会？ | 对谈 Grasp 创始人雷磊

活动预告🥳：6 月 21 日，我们会请到雷磊和 Gus (Memobase & nano-graphrag 作者，solo 项目 GitHub 获 5000+ Star) 办一场线下活动，大家记得翻到 shownotes 末尾查看报名信息！ Agent 赛道自今年年初被 Manus 引爆以来，热度持续了好几个月。有非常多各种方向和概念的 Agent 项目已经拿到融资，而很多人也已经开始思考：下一波机会，会出现在哪里？我们看到的可能性之一，就是 Agent Infra。原因在于，如果未来真的会有万亿个 Agent，它们将不再只是「工具本身」，而会反过来成为无数软件的「终端用户」。而由于 Agent 和人类的行动模式存在本质区别，我们很可能需要重新设计整个 AI-Native 的软件体系，从代码环境、浏览器，到各种工具，全部为 Agent 重写一遍。于是本期节目，我们请来了 Grasp（一款给 Agent 用的浏览器）创始人雷磊，一起聊聊他对 Agent Infra 的观察与思考。我们讨论了「给 Agent 做产品」与「给人做产品」在底层逻辑上的差异、Agent Infra 的两大明星项目 E2B 和 Browserbase，以及这个领域未来可能出现的创业机会等等。 Grasp 现已开放 waiting list 申请：https://getgrasp.ai，即将内测。【人类博物馆】导游：曲凯，42 章经创始人 36 号珍藏：雷磊，Grasp、AirCode 创始人，连续创业者，前字节开发者平台轻服务产品负责人，超过十年开发者领域经验【时光机】 1:03 Agent 热潮之后，下一波机会可能是 Agent Infra 3:55 未来应该是「人为 Agent 服务」，而不是「Agent 为人服务」？ 6:17 人与 Agent 的核心区别 6:22 ① 工作范式：人是单线程，而 AI 是多线程 7:23 ② 责任与安全边界：人可以对自己的行为负责，但 AI… 10:49 Agent Infra 产品最关键的是什么？ 13:03 被 Manus 带火的 E2B 到底是个啥？ 15:02 虚拟机、云、沙盒、E2B 的关系是什么？ 15:54 Agent 产品一定是在云端运行 18:35 云厂商就像「地产商」，而 E2B 类产品是「装修商」 21:02 什么团队适合做 E2B 这样的产品？ 26:49 Agent Infra 产品 = 给 Agent 用的 SaaS 28:32 海外当红的 Browserbase 又是做啥的？ 31:48 给 AI 用的浏览器 V.S. 给人用的浏览器有哪些区别？ 35:55 Agent Browser 的三层架构：Runtime + Agentic + Knowledge 42:40 为什么说今天的 Browser Use 很像 23 年的 AI Coding？ 44:35 二者都还有上千亿美金的市场增长空间 47:46 Agent Infra 还有哪些值得重做一遍的机会？ 49:04 一个迷思：有没有可能 AI 根本就不需要人类的反馈？【活动预告🥳】 6 月 21 日，我们会办一场线下活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-06-02 / 00:55:22

世界加速分化下，我们的机会在哪里？ | 对谈绿洲资本合伙人张津剑

在去年那期播放量超 10w 的节目《这个世界变难了，我们该如何应对？》中，津剑从信号学的角度拆解了这两年世界变化的本质，给很多人带来了一个全新的思考万事万物的视角。而针对世界的新变化，津剑也在一年后为我们带来了他升级后的思考。这期节目的前半小时，你会听到津剑在我们线下活动中的个人分享。他从「频率与频谱」的角度出发，解释了这个世界为什么在加速分化？注意力机制为什么人类最重要的特质之一？为什么说 Agent 其实是一场感知革命？人类在 AI 时代的核心价值又是什么？节目的后半段，则是我和津剑的双人对谈。我们讨论了一些更具体的问题，比如怎么判断一个方向值不值得坚持？未来 5 年 AI 可能会发展成什么样等等。希望这期听完之后，我们都能更好地重建自己的注意力系统。 After all. Attention Is All We Need. 绿洲也在制作自己的播客节目《信号与噪声》(链接：www.xiaoyuzhoufm.com)，诉说更多关于生命力的故事，欢迎大家订阅关注！【人类博物馆】导游：曲凯，42 章经创始人 1 号珍藏：张津剑，绿洲资本合伙人【时光机】 Part 1 单人演讲《投资中的频率与频谱》 1:15 2025 年，世界在加速分化 1:20 分化的背后是注意力的失控 2:43 注意力是大脑进化出的主动滤波器 6:20 顶级企业家有一个共同特点——专注 9:12 拉尔森效应与世界的啸叫 11:33 这个时代的机会在变多，而不是变少 11:59 如何重建注意力机制？ 15:26 作为一个多模态大模型，人类能感知到的世界是真实世界的 1/10^9 21:48 Agent 是一场感知革命，AI 能处理的模态和频谱理论上是无限的 25:27 从以「人」为中心组织工作，到以「AI」为中心组织工作 28:49 Wishful thinking 是一种懒惰 30:03 人类因为自身的有限性而进化出了审美，这也是 AI 时代人最核心的价值 Part 2 双人对谈《人的有限与无限》 33:58 怎么找到真正值得注意的事，并坚持下去？ 40:17 绝症面前，人会改变自己，还是接纳自己？ 42:39 分享两个提高决策力的方法 43:48 区块链与 AR&VR 被低估了 47:06 未来 5 年，人和 AI 之间的关系可能会发展成什么样？ 49:01 工业革命：体力→智力，AI 时代：智力→心力 50:53 未来的智能会像今天的电一样 51:54 什么是新时代的「家电三件套」？ 53:10 分化世界下，普通人还有机会吗？【Reference】张津剑 @42 章经系列回顾播客世界好像变难了，我们该如何应对？ 2024.5.26 投 AI 最猛的人 2023.7.30 文章投资中的节奏与结构 2023.6.18 投资中的周期与载波 2021.3.14 投资决策中的信噪比 2020.2.23 投资中的信号与噪声 2018.12.2 （谢谢到场的每一位朋友！）【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-05-17 / 00:53:56

关于 AI、开源、商业化与全球化的经验、教训和方法论 | 对谈 PingCAP CTO 东旭

活动预告🥳：5 月 31 日，我们会请到东旭办一场线上活动，大家记得翻到 shownotes 末尾查看报名信息！ PingCAP 在前些年最被大家熟知的可能就是其非常高的估值，经常被 challenge 的则是其商业化的收入。而这两年很多人不知道的是 PingCAP 的国际化业务发展得异常好，且已经有了非常高的海外年收入。 23 年我曾经请云启资本的陈昱分享过他投资 PingCAP 等知名公司背后的逻辑。在那期播客中，陈昱说他投资 PingCAP 的重要原因之一是发现他们团队有野心（选择了分布式数据库这个难度极高的方向）、且有实现野心的潜力（三个联创都是技术背景，代码写得很扎实）。两年过去，很开心今天终于能和 PingCAP 的联合创始人兼 CTO 黄东旭面对面聊天，听他亲口讲述这家估值 30 亿美金的数据库创业公司从 0 到 1 的实践和思考。在这期播客中，东旭坦诚分享了他们踩过的非常多的坑。我们聊到了 PingCAP 在发展过程中的关键决策、开源项目的运作逻辑与商业化策略，以及中国团队在海外市场的落地经验和商业化探索过程。此外，他也从他的视角聊到了很多关于 AI 的观察和思考。和他聊的时候，还意外得知原来他是一个弹吉他和贝斯、玩合成器的音乐爱好者，这个爱好，也是他创业十年来保持身心轻盈的重要原因之一；）【人类博物馆】导游：曲凯，42 章经创始人 35 号珍藏：PingCAP 联合创始人、CTO，PingCAP 最新公开估值已达 30 亿美元【时光机】 Part1 PingCAP 从 0 到 1 的发展历程 1:21 PingCAP 到底是做什么的？—— 一个装数据的魔法杯子 6:55 PingCAP 十年来最关键的四个决策 7:10 ① 开源 7:30 ② 选择了关系型数据库这个难度最大、但期望最高的方向 8:37 ③ 做全球化 9:09 ④ 转型云服务 9:52 为什么 15 年还能长出一个数据库巨头？ 12:58 为什么在商业化没做起来时，公司就能有 30 亿美金的估值？ 18:47 商业化的摸索过程 Part2 关于国际化的经验和思考 24:32 一个真·国际化的公司应该具备什么样的心态？ 27:51 怎么判断自己的公司是不是真的做到了国际化？ 32:33 在国际化的过程中，我们可踩过太多坑了… 34:03 先做美国市场是一个事半功倍的选择 34:49 这波 AI 创业者中我最看好 Day 1 就搬去美国的那一批 36:51 想融入当地环境？先招个本地销售，然后跟着 ta 一起跑客户 40:34 出海没有捷径，我过去十年尝试的所有花活基本上都失败了 43:57 出海华人创业者，第一容易高估语言障碍，第二容易高估商业化难度 45:23 一些关于 AI 的观察和思考 45:53 营销被大大低估了！不存在什么「酒香不怕巷子深」 46:42 AI 还缺一个通用的 sharing memory layer 49:26 我个人很看好企业服务端的机会【Reference】 Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent｜对谈 Sheet0 创始人王文锋揭秘 Minimax、Zilliz、PingCAP 背后的投资逻辑 | 对谈云启合伙人陈昱【活动预告🥳】 5 月 31 日，我们会办一场线上活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-05-05 / 00:41:12

AI 下半场：聊透 Benchmark 与 Evaluation | 对谈前 Kimi 产品经理丁丁

活动预告🥳：5 月 24 日，我们会请到丁丁和 Fellou 创始人谢扬办一场线上活动，大家记得翻到 shownotes 末尾查看报名信息！像 RL 这个概念一样，Benchmark 和 Evaluation 也是做 AI 的人经常挂在嘴边的词，但到底该怎么理解这个概念，该如何正确的设定这些问题和数值呢？正巧前不久 OpenAI 研究员姚顺雨的那篇《AI 即将进入下半场》特别火，他核心讲的就是「我们当下已经进入了 AI 的第二阶段——从解决问题转向定义问题，评估的意义会超过训练本身。而这其中，评估最关键的不是设置更难的基准测试，而是要在实际落地的场景中重新设计一套实用的评估标准」。所以这期我们请到了前 Kimi 产品经理丁丁，从她在大模型公司一年多的实践经验出发，请她分享些对于 Benchmark 和 Evaluation 的思考，相信大多数人听完这期都会对这些概念有更深的理解，也可以开始自己设定一些评估问题和标准了。 P.S. 丁丁之前曾在微信做过 5 年的搜索产品，也在美团做过策略产品，所以在节目最后她也分享了一些从古典产品转型 AI 产品经理的心得。【人类博物馆】导游：曲凯，42 章经创始人 34 号珍藏：丁丁，前微信、美团、Moonshot 产品（负责 Kimi App）【时光机】 1:27 进入 AI 下半场，「重新定义 Benchmark」比「刷榜提分」更关键 3:23 回顾 AI 上半场，国内大模型公司的发展重心历经了哪些变化？ 5:51 一味追求 DAU 是一种偷懒的经验主义 7:07 数据固然重要，但更多的用户数据 ≠ 更好的模型智能 9:28 如果你是梁文锋，你要不要承接这波泼天的用户？ 9:59 Evaluation 和 Benchmark 是拉开模型差距的一大关键 14:40 对于没有标准答案的问题，该怎么制定 Benchmark？ 17:55 怎么衡量 Benchmark 的好坏？ 22:14 创业公司的 Benchmark 有多少道题比较合理？ 22:38 能通过高频的用户 Prompt 反推出一套 Benchmark 吗？ 24:23 让模型「突出长板」好，还是「全面均衡」好？ 25:42 以 C.AI 类产品为例，示范一下该怎么设计 Benchmark 29:28 Benchmark 是团队的核心机密，算法同学都不应该告诉 30:07 AI 产品经理和古典产品经理有什么异同？ 31:49 怎么更好地理解模型边界？ 33:38 未来每个人都要具备全栈能力 35:38 做微信产品积累下来的 knowhow 39:52 分享一些招 AI 产品经理的标准【Reference】 OpenAI Agent Researcher 姚顺雨的最新博客内容，探讨了 AI 发展的「下半场」：ysymyth.github.io 一个顶级 AI 产品经理的自我修养 | 对谈光年之外产品负责人 Hidecloud 【活动预告🥳】 5 月 24 日，我们会办一场线上活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-04-19 / 00:52:38

Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent｜对谈 Sheet0 创始人王文锋

活动预告🥳：4 月 26 日，我们会请到 sheet0.com 创始人文锋做一场线下活动，大家记得翻到 shownotes 末尾查看报名信息！关于 Agent 这个话题，我自己有一些核心在思考的问题，相信这些也是很多人同样会有疑问的地方，这期播客中我们就这些问题展开了讨论，并基本得到了一些答案： 1）怎么定义 Agent，Agent 最重要的是什么 2）今天的 Agent 和两年前的 Agent 的区别是什么 3）如何简单快速理解 Function Call，Coding Agent，MCP，A2A，Computer Use，Browser Use 等概念 4）不同方式的区别是什么，有什么优劣之分吗 5）怎么看通用 Agent 和垂直 Agent 的区别，终局是什么 6）AI Coding 和 Agent 最终会是一件事吗，或者二者会有什么关联 7）Workflow 和 Agent 的区别和终局 8）RL 这件事在 Agent 里的重要程度是什么，一家公司（尤其是做 Agent 的创业公司）到底该如何使用 RL 9）大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么，最终市场形态会怎样 10）如何快速判断一家 Agent 公司做得好不好另外，在整段讨论中，本期嘉宾文锋基于长时间对 Agent 的研究和实操，还提出了很多理解和分析 Agent 的框架和关键要素，以及在接近结尾部分留下了让我非常有启发的一句话：AI Coding 是大模型的灵巧手。【人类博物馆】导游：曲凯，42 章经创始人 33 号珍藏：王文锋，Agent builder，sheet0.com Founder & CEO，连续创业者，有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请，即将内测。【时光机】 00:47 Agent 三要素：LLM、Context、Tool Use 1:17 这波 Agent 和过去两年的区别是什么？ 2:30 怎么理解 Agent 中的 Context？ 4:21 快速理解 Tool Use 的不同方案 4:40 代码调用支线：Function Call、MCP、A2A 之间的区别是什么？ 6:35 模拟人类支线：浏览器是大模型能调用的最重要的工具 7:07 两条支线各有优缺点，也可以混合起来 10:27 Manus、Devin、Genspark 各用的什么方案？ 12:25 Browser Use 的核心价值是给用户提供「安全感」 14:19 AI Coding 和 Agent 最终会殊途同归吗？ 16:15 Agent 的终局会走向通用还是垂直？ 17:17 脱离了 RL，Agent 就不成立了 19:15 所以 Agent 创业公司该如何使用 RL？ 22:54 一个非共识理解：聊天框 + 场景推荐 UI 界面就是最好的交互形态 31:54 Sheet0 是一个怎样的 Agent 产品？ 34:15 怎么把任务执行的准确率做到了 100%？ 35:39 Workflow 会被 Agent 颠覆掉吗？ 36:49 不同 Agent 的核心区别是什么？ 39:05 AI Coding 是大模型的「灵巧手」 41:41 Agent 有两大「信任」命题 44:22 分享一个预测 Agent 未来发展的思考框架 47:33 如何快速判断一家 Agent 公司做得好不好？【Reference】文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning：An Introduction》【活动预告🥳】 4 月 26 日，我们会请到文锋做一场线下活动，感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-04-05 / 01:12:49

一堂「强化学习」大师课｜对谈清华叉院助理教授吴翼

当 AI 预训练的 scaling law 开始放缓，强化学习 (RL) 接过接力棒，拉出了一条漂亮的第二曲线。在当下的 Agent 热里，有 RL 能力的团队，也是最被看好和押注的。但很多人对 RL 都没有一个足够清晰的理解，包括我自己。所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼，来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等（聊完感觉像上了一堂免费大师课）。而且聊着聊着，我们发现，人生就是一个 RL 的过程，区别是 RL 有明确的奖励函数，但是人生没有。可能如吴翼教授所说，我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互，才能找到自己的奖励函数，优化自己的人生曲线。最后，吴翼教授的团队最近开源了一个 RL 框架 AReaL-boba，在 SOTA 7B 上跑出了 AIME24 61.9 的分数，也欢迎大家去 GitHub 关注。【人类博物馆】导游：曲凯，42 章经创始人 32 号珍藏：吴翼，清华大学交叉信息研究院助理教授，前 OpenAI 研究员。【时光机】 1:51 到底什么是 RL？ 4:25 人生就是一个强化学习的过程 6:22 RL 和 LLM 是怎么结合起来的？ 7:01 强强联手第一步：InstructGPT，实现指令遵从 10:07 过程中衍生出了 RLHF 11:41「慢思考」的需求催生了 RL 的应用 16:10 为什么说 Anthropic RL 做得特别好？ 21:17 行业对 RL+LLM 的最优路径形成共识了吗？ 25:11 RL 起来之后，对 Agent 的影响是什么？ 32:11 Intelligence = LLM (理解) × RL (决策)，二者缺一不可 34:14 Scaling law 的未来 34:33 Pretraining 的两个发展方向 36:43 RL 还处于早期，进入深水区后可能会走向分化 40:02 大模型团队的组织架构要如何设计？ 43:21 一个反常识：对 AI 来说，理解比生成更难，token 消耗更大 47:38 现在做 Agent 一定需要一个懂 RL 的人吗？ 49:32 为什么 RL 人才这么稀缺？ 56:10 RL 目前三大分支：泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI) 58:55 框架对 RL 意味着什么？ 1:02:51 RL 在海内外进展还有明显差距 1:04:42 想做好 RL，基建≫数据＞算法 1:06:05 研究 RL 收获的一些人生启发【Reference】吴翼的 PhD 毕业论文：On Building Generalizable Learning Agents 吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文： Value Iteration Network 吴翼提到的他非常喜欢的有关 Diversity-Driven RL 的两篇论文：Iteratively Learn Diverse Strategies with State Distance Information、Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization 吴翼团队和蚂蚁研究院开源的强化学习训练框架：AReaL-boba 【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情

2025-03-22 / 00:56:18

世界怎么就「东升西落」了？聊聊二级市场与 DeepSeek+Manus 的热潮｜对谈莫傑麟

我又来美国了。这次来，我发现市场真的变化太快，这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟，和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。在这期播客里，我们推演了「东升西落」的演绎过程和底层逻辑，谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受，也聊了宏观的市场环境和股市的未来。最近两年很多人都在说，这波 AI 中的最赚钱的方式是炒股。但真的是这样吗？二级市场真的才是大家最终的归宿吗？【人类博物馆】导游：曲凯，42 章经创始人九号珍藏：莫傑麟，家族办公室资深从业者【时光机】 Part1 「东升西落」的叙事 00:30 为什么二级市场突然流行「东升西落」的叙事？ 1:00 推演一下演绎过程和底层逻辑 5:19 之前大家过于低估国内 AI 了 6:47 中美对 AI 的叙事重点完全不同 7:27 简评 DeepSeek 9:48 简评 Manus 10:15 Manus 是最典型的中国式 AI 产品 11:58 Manus 爆火背后的两个核心原因 14:35 为什么后来风评急转直下？ 16:01 未来的 AI 产品可能要先在海外宣发，再杀回国内 Part2 二级市场的宏观环境 22:04 二级市场 = 预期 + 趋势 23:12 关于预期——大家对中国的预期是什么？ 24:39 为什么阿里加大对 AI 的 Capex 投入后，股价大涨？ 26:17 腾讯是 DeepSeek 这波的最大受益者 31:11 25 年的中国在重演 23-24 年的美国 33:48 芯片「卡脖子」还会是问题吗？ 35:42 关于趋势 35:52 暗线 (宏观环境)：稳中向好 37:30 明线 (产业趋势)：AI+专精特新+消费多点开花 Part3 股市的未来 38:44 今年 A 股会不会继续涨，美股会不会继续跌？ 41:13 二级市场在变得越来越卷，共识的达成和演绎速度越来越快 43:57 这波 AI 最赚钱的方式真的是炒股吗？ 46:44「大起大落的高频波动」可能是未来股市的常态 48:14「做时间的朋友」还行得通吗？ 49:54 分享一些 25 年的个人观察 50:18 AI 领域我会重点关注三个问题 52:53 很多非 AI 公司也很值得研究 54:56 二级市场是所有人的最终归宿吗？【Reference】为什么我们开始乐观？关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros

查看详情