42 章经
你好,我是曲凯,42 章经的创始人。 小的时候我不太舍得花钱,记得当年一毛钱一袋的牛肉干真的很好吃,但如果偶尔遇到一个很有趣的人,我会欣然花几十、上百块请他吃个饭,还觉得自己赚到了。 后来长大了一些,开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人,然后在一个夏日的午后,把他的发言、转载和收藏全都看了一遍,并觉得心有戚戚焉。 再后来工作和创业以后,每天就是聊各种各样的投资人、创业者。 如果能聊到一个优秀的人,真的会有一种如沐春风的感觉,并真心觉得很幸福。 而同行们见面经常会聊到的问题也是:最近有没有遇到什么有意思的人? 所以,这个播客就是要努力把这些人带到你的身边。 我们只专注和有趣、有独到认知、又愿意坦诚分享的聪明人聊天。 希望你听完每一期都能回到小时候,回到那个因为认识了有趣的人、收获了新知,而感到单纯美好幸福的时刻。 如果听完以后,你还能暗自感慨一句, “我也好想认识这个人啊。” 或者, “哇靠,有被启发到。” 那这个播客也就值了。
-
活动预告🥳:5 月 24 日,我们会请到丁丁和 Fellou 创始人谢扬办一场线上活动,大家记得翻到 shownotes 末尾查看报名信息! 像 RL 这个概念一样,Benchmark 和 Evaluation 也是做 AI 的人经常挂在嘴边的词,但到底该怎么理解这个概念,该如何正确的设定这些问题和数值呢? 正巧前不久 OpenAI 研究员姚顺雨的那篇《AI 即将进入下半场》特别火,他核心讲的就是「我们当下已经进入了 AI 的第二阶段——从解决问题转向定义问题,评估的意义会超过训练本身。而这其中,评估最关键的不是设置更难的基准测试,而是要在实际落地的场景中重新设计一套实用的评估标准」。 所以这期我们请到了前 Kimi 产品经理丁丁,从她在大模型公司一年多的实践经验出发,请她分享些对于 Benchmark 和 Evaluation 的思考,相信大多数人听完这期都会对这些概念有更深的理解,也可以开始自己设定一些评估问题和标准了。 P.S. 丁丁之前曾在微信做过 5 年的搜索产品,也在美团做过策略产品,所以在节目最后她也分享了一些从古典产品转型 AI 产品经理的心得。 【人类博物馆】 导游:曲凯,42 章经创始人 34 号珍藏:丁丁,前微信、美团、Moonshot 产品(负责 Kimi App) 【时光机】 1:27 进入 AI 下半场,「重新定义 Benchmark」比「刷榜提分」更关键 3:23 回顾 AI 上半场,国内大模型公司的发展重心历经了哪些变化? 5:51 一味追求 DAU 是一种偷懒的经验主义 7:07 数据固然重要,但更多的用户数据 ≠ 更好的模型智能 9:28 如果你是梁文锋,你要不要承接这波泼天的用户? 9:59 Evaluation 和 Benchmark 是拉开模型差距的一大关键 14:40 对于没有标准答案的问题,该怎么制定 Benchmark? 17:55 怎么衡量 Benchmark 的好坏? 22:14 创业公司的 Benchmark 有多少道题比较合理? 22:38 能通过高频的用户 Prompt 反推出一套 Benchmark 吗? 24:23 让模型「突出长板」好,还是「全面均衡」好? 25:42 以 C.AI 类产品为例,示范一下该怎么设计 Benchmark 29:28 Benchmark 是团队的核心机密,算法同学都不应该告诉 30:07 AI 产品经理和古典产品经理有什么异同? 31:49 怎么更好地理解模型边界? 33:38 未来每个人都要具备全栈能力 35:38 做微信产品积累下来的 knowhow 39:52 分享一些招 AI 产品经理的标准 【Reference】 OpenAI Agent Researcher 姚顺雨的最新博客内容,探讨了 AI 发展的「下半场」:ysymyth.github.io 一个顶级 AI 产品经理的自我修养 | 对谈光年之外产品负责人 Hidecloud 【活动预告🥳】 5 月 24 日,我们会办一场线上活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息! 关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案: 1)怎么定义 Agent,Agent 最重要的是什么 2)今天的 Agent 和两年前的 Agent 的区别是什么 3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念 4)不同方式的区别是什么,有什么优劣之分吗 5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么 6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联 7)Workflow 和 Agent 的区别和终局 8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL 9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样 10)如何快速判断一家 Agent 公司做得好不好 另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。 【人类博物馆】 导游:曲凯,42 章经创始人 33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。 【时光机】 00:47 Agent 三要素:LLM、Context、Tool Use 1:17 这波 Agent 和过去两年的区别是什么? 2:30 怎么理解 Agent 中的 Context? 4:21 快速理解 Tool Use 的不同方案 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么? 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具 7:07 两条支线各有优缺点,也可以混合起来 10:27 Manus、Devin、Genspark 各用的什么方案? 12:25 Browser Use 的核心价值是给用户提供「安全感」 14:19 AI Coding 和 Agent 最终会殊途同归吗? 16:15 Agent 的终局会走向通用还是垂直? 17:17 脱离了 RL,Agent 就不成立了 19:15 所以 Agent 创业公司该如何使用 RL? 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态 31:54 Sheet0 是一个怎样的 Agent 产品? 34:15 怎么把任务执行的准确率做到了 100%? 35:39 Workflow 会被 Agent 颠覆掉吗? 36:49 不同 Agent 的核心区别是什么? 39:05 AI Coding 是大模型的「灵巧手」 41:41 Agent 有两大「信任」命题 44:22 分享一个预测 Agent 未来发展的思考框架 47:33 如何快速判断一家 Agent 公司做得好不好? 【Reference】 文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》 【活动预告🥳】 4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
当 AI 预训练的 scaling law 开始放缓,强化学习 (RL) 接过接力棒,拉出了一条漂亮的第二曲线。 在当下的 Agent 热里,有 RL 能力的团队,也是最被看好和押注的。 但很多人对 RL 都没有一个足够清晰的理解,包括我自己。 所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼,来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等(聊完感觉像上了一堂免费大师课)。 而且聊着聊着,我们发现,人生就是一个 RL 的过程,区别是 RL 有明确的奖励函数,但是人生没有。可能如吴翼教授所说,我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互,才能找到自己的奖励函数,优化自己的人生曲线。 最后,吴翼教授的团队最近开源了一个 RL 框架 AReaL-boba,在 SOTA 7B 上跑出了 AIME24 61.9 的分数,也欢迎大家去 GitHub 关注。 【人类博物馆】 导游:曲凯,42 章经创始人 32 号珍藏:吴翼,清华大学交叉信息研究院助理教授,前 OpenAI 研究员。 【时光机】 1:51 到底什么是 RL? 4:25 人生就是一个强化学习的过程 6:22 RL 和 LLM 是怎么结合起来的? 7:01 强强联手第一步:InstructGPT,实现指令遵从 10:07 过程中衍生出了 RLHF 11:41「慢思考」的需求催生了 RL 的应用 16:10 为什么说 Anthropic RL 做得特别好? 21:17 行业对 RL+LLM 的最优路径形成共识了吗? 25:11 RL 起来之后,对 Agent 的影响是什么? 32:11 Intelligence = LLM (理解) × RL (决策),二者缺一不可 34:14 Scaling law 的未来 34:33 Pretraining 的两个发展方向 36:43 RL 还处于早期,进入深水区后可能会走向分化 40:02 大模型团队的组织架构要如何设计? 43:21 一个反常识:对 AI 来说,理解比生成更难,token 消耗更大 47:38 现在做 Agent 一定需要一个懂 RL 的人吗? 49:32 为什么 RL 人才这么稀缺? 56:10 RL 目前三大分支:泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI) 58:55 框架对 RL 意味着什么? 1:02:51 RL 在海内外进展还有明显差距 1:04:42 想做好 RL,基建≫数据>算法 1:06:05 研究 RL 收获的一些人生启发 【Reference】 吴翼的 PhD 毕业论文:On Building Generalizable Learning Agents 吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文: Value Iteration Network 吴翼提到的他非常喜欢的有关 Diversity-Driven RL 的两篇论文:Iteratively Learn Diverse Strategies with State Distance Information、Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization 吴翼团队和蚂蚁研究院开源的强化学习训练框架:AReaL-boba 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
我又来美国了。 这次来,我发现市场真的变化太快,这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟,和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。 在这期播客里,我们推演了「东升西落」的演绎过程和底层逻辑,谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受,也聊了宏观的市场环境和股市的未来。 最近两年很多人都在说,这波 AI 中的最赚钱的方式是炒股。 但真的是这样吗? 二级市场真的才是大家最终的归宿吗? 【人类博物馆】 导游:曲凯,42 章经创始人 九号珍藏:莫傑麟,家族办公室资深从业者 【时光机】 Part1 「东升西落」的叙事 00:30 为什么二级市场突然流行「东升西落」的叙事? 1:00 推演一下演绎过程和底层逻辑 5:19 之前大家过于低估国内 AI 了 6:47 中美对 AI 的叙事重点完全不同 7:27 简评 DeepSeek 9:48 简评 Manus 10:15 Manus 是最典型的中国式 AI 产品 11:58 Manus 爆火背后的两个核心原因 14:35 为什么后来风评急转直下? 16:01 未来的 AI 产品可能要先在海外宣发,再杀回国内 Part2 二级市场的宏观环境 22:04 二级市场 = 预期 + 趋势 23:12 关于预期——大家对中国的预期是什么? 24:39 为什么阿里加大对 AI 的 Capex 投入后,股价大涨? 26:17 腾讯是 DeepSeek 这波的最大受益者 31:11 25 年的中国在重演 23-24 年的美国 33:48 芯片「卡脖子」还会是问题吗? 35:42 关于趋势 35:52 暗线 (宏观环境):稳中向好 37:30 明线 (产业趋势):AI+专精特新+消费多点开花 Part3 股市的未来 38:44 今年 A 股会不会继续涨,美股会不会继续跌? 41:13 二级市场在变得越来越卷,共识的达成和演绎速度越来越快 43:57 这波 AI 最赚钱的方式真的是炒股吗? 46:44「大起大落的高频波动」可能是未来股市的常态 48:14「做时间的朋友」还行得通吗? 49:54 分享一些 25 年的个人观察 50:18 AI 领域我会重点关注三个问题 52:53 很多非 AI 公司也很值得研究 54:56 二级市场是所有人的最终归宿吗? 【Reference】 为什么我们开始乐观?关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
如果有人问你,给你三个月的时间,你能把目前手上负责的业务数据翻十倍吗? 相信大多数人都会觉得这是痴人说梦,但这件事 ACE Studio 做到了。 而他们做到的原因不是他们本来就能,而是有人让他们相信了这件事。 这就是我们今天要讲的故事,这就是信念感这三个字的力量。 去年 5 月份我们做过一期 PMF 主题的节目,ACE Studio 的创始人 Joe 聊了很多他们的产品是如何在美国市场找到 PMF 的。当时他们刚刚开启付费半年,就已经做到了很不错的月收入。这次我们又把他请来,是因为才刚过去了大半年,他们的收入竟然就增长了 10 倍,已经成功跻身千万美金 ARR 第一梯队。 能做到这点,是因为他们去了硅谷一家很有名的孵化器 HF0,并在那边搞了 3 个月的封闭式开发。这期播客中,Joe 就毫无保留地分享了 HF0 到底是怎么奏效的、他们在 HF0 的实际体验与收获,和实现 10 倍增长的具体经验(比如他们是怎么一招就让公司一夜之间收入翻倍的?)。 如果你对 Joe 的参加孵化器的经验,或者对去美国参加类似的组织感兴趣,可以添加我的微信 qukai42,42 章经今年也会组织更多中美连接的活动和事情,欢迎你用各种方式加入进来。 【人类博物馆】 导游:曲凯,42 章经创始人 20 号珍藏:Joe,ACE Studio 创始人。ACE Studio 是一款面向专业音乐制作人和创作者的 AI 音乐工作站,致力于用 AI 重新定义音乐创作,自 2023 年 10 月上线以来发展迅猛,月收入已达 80 万美金。 【时光机】 Part1 HF0 为什么有效 01:23 先回顾下入选这家美国知名孵化器的过程 03:48 英语不好会是阻力吗? 05:34 3000 进 10 的概率下,HF0 为什么选中了你们? 07:19 HF0 和其它孵化器不太一样 08:46 HF0 没教我们怎么做业务,这事也不该别人来教 10:35 最关键的第一步:HF0 给我们注入了「一定能猛涨」的信念感 12:23 这种信念感很难自我激发 14:23 开营后,HF0 营造了一个专注于增长的氛围 16:25 最大的压力和最深的恐惧就是「别丢脸」… 17:44 这种氛围本质上改变了我想问题的方式 19:17 也让我们涌起了「别让大家觉得华人不行」的责任感 21:38 一直 build「憋大招」可能并不成立 22:40 从 HF0 出来后,还能保持在其中的状态吗? 23:55 我们马上要复刻 HF0 的体验 Part2 3 个月涨 10 倍的具体实践 26:50 五周过去都没怎么增长的时候,信念感崩塌了吗? 27:43 绝境逢生的戏剧化转折:我们试了一招,第二天日收入直接 double 28:51 Quora 创始人教会了我们一种思考方法 30:00 之前没想到这么干,是因为我们没悟到一件事 31:18 要问这招是啥?——答案乍一听可能有点搞笑哈 31:29 但搞笑背后是一种硅谷的方法论 32:57 在硅谷的几个经历也启发了我们 33:53 后面我们还试了很多招数,最终达成了 10 倍的增长 34:01 我们在价格模型上做了很多文章 34:24 Blake Anderson(千万美金 ARR 产品 Cal AI 的创始人)让我意识到,我们之前联系 influencer 的方式都不对 36:33 我们把付费广告的 ROI 提高到了 2 倍 36:59 产品功能升级和老用户也没落下 37:30 但前六周的苦工是省不掉的 Part3 一些观察 39:02 美国投资人的工作方式和提的问题有什么不同? 40:31 美国机构真的很不喜欢中国团队吗? 42:51 肉身到硅谷去很重要 43:12 我越来越坚信,AI 产品化大有可为 44:44 Perplexity 的 pitch deck 上有两句话,合起来看很妙 45:13 我的壁垒就是我的「人日」 46:47 硅谷的做事风格越来越回归本质了 【Reference】 ACE Studio 产品界面 关于 HF0:HF0 是由 Dave Fontenot(世界上最大的黑客松 MHacks 创始人)、Evan Stites- Clayton 和 Emily Liu 共同创立的常驻创业孵化器,有着严苛的筛选标准,由包括 Marc Andreessen、Chris Dixon 在内的多位知名投资者支持,创办第一年就孵化出了 3 家独角兽公司,也孵化过包括 ComfyUI、Story.com 等在内的多家优秀的 AI 公司。 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
Binson literally 进了 ICU,一场严重的车祸让他对这个世界和创业这件事有了不同的认识。 这期播客中我们先聊了他的这场车祸,和他是如何度过在 ICU 的六个日夜的,相信这种经历是绝大多数人没有机会尝试甚至是听说的,而 Binson 恢复了四个月后已经可以比较正常地坐在我的对面回顾这段经历,他讲了在这个过程中他心态的一些变化,以及在事故之后他是如何改变他对待人生和经营公司的方式的。 Binson 在此之前是知名的大厂高管,他从百度副总监、360 助理总裁,一路做到了 bilibili 副总裁,所以我们也聊了他打工和换工作的很多经验,以及就是他为什么创业,现在又是如何看待 AI 和自己的心影随形(逗逗游戏伙伴)这个公司和产品的。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42 章经创始人 31 号珍藏:Binson,心影随形 CEO。心影随形成立至今已获得多轮融资。逗逗游戏伙伴是其推出的一款陪用户玩游戏的 AI 桌宠软件,已有 600 万的用户规模。此前,Binson 曾先后担任百度副总监、360 助理总裁、bilibili 副总裁等职位。 【时光机】 Part1 车祸后的感悟 1:52 我是怎么差点挂了的? 2:19 死里逃生的过程 7:56 更痛苦的是躺进 ICU 后的精神煎熬 12:01 我们活着的意义到底是啥? 13:58 这件事教会了我「停下来」和「放手」的重要性 17:35 我创业的心态和行动有些具体的变化 Part2 大厂打工 V.S. 创业的体悟 22:38 如果真的只为了赚钱,不要创业 23:04 复盘三段大厂经历 23:20 我应该更早离开百度 25:09 为什么不应该为了两三倍工资而跳槽? 27:15 为什么 20 年我选择去 B 站,而不是字节、快手、拼多多或者小红书? 29:43 原本没想去 360,但周鸿祎给了我一个新的视角 35:12 作为一个如此有创业精神的人,为什么没有更早出来? 37:33 创业首先要摒弃大厂思维 42:46 创业总是焦虑?多半是因为事先思考得不够充分 44:42 不要回避大厂竞争的问题 45:25 创业最难的是招人和统一大家的思路 46:22 成长最快的是工作两三年的 47:31「有爱」可以后天培养吗? 47:57 一个残酷的现实是,大厂已经不育人了 49:13 分享一个有效训练决策能力的方法 Part3 聊聊 AI 51:12 桌宠形态产品的留存高是一个值得炫耀的事么? 52:06 为什么逗逗游戏伙伴很难被 copy? 53:46 一些 AI 观察 54:10 今年会陆续有一批 AI 公司被淘汰 55:08 LLM 的进展超出预期,多模态则不及预期 55:53 Chatbot 这种模式可能就不对 56:17 我们不看对话轮数、不看留存、不看时长 58:49 一个值得思考的未来方向 【Reference】 Binson 交通事故的完整经历和更多感悟,可以看他之前写的公众号 mp.weixin.qq.com 逗逗游戏伙伴桌宠形态的示意图: 逗逗游戏伙伴陪玩《黑神话:悟空》的示意视频 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescalero
-
新年正式第一期,来点新东西。 大家都说 Agent 热,那 Agent 到底是啥、到底为啥热、到底咋做、到底长啥样? 大家都说 RL 是新方向,那 RL 到底是啥,和 LLM 的关系是什么,又能怎么和 Agent 结合? 这期我们就请到了在 Meta 工作了七年的应用强化学习组负责人朱哲清 Bill,讲一讲他是怎么用一种很新的技术路线来做一种很新的 Agent,并且在电商等领域是如何落地的。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42 章经创始人 30 号珍藏:朱哲清 Bill,Pokee AI 创始人兼 CEO,此前 7 年在 Meta AI 做应用强化学习组负责人,并攻读了斯坦福大学强化学习专业博士学位 【时光机】 Part1 强化学习 3:06 我们思考方式已经全面 RL 化 —— from OpenAI 研究员 4:36 Transformer 和 RL 到底是什么关系?又要如何结合? 10:15 RL 解答的是平行宇宙问题 12:35 RL+LLM,就是公认最好的技术路线吗? 14:02 RL 的算法原理类似于「多巴胺刺激」 14:42 在无法清晰定义 Reward 的场景下,RL 还好用吗? 15:12 RL 最强的三个能力 Part2 给 Agent 用上强化学习 18:42 为什么直接用 LLM 做不出规划型 Agent? 20:17 一个有效的 Agent 架构:RL 做核心,LLM 做翻译 23:35 我们做出了一个电商领域的通用型 Agent 24:39 体验相当于一个资深的网站负责人 26:05 原理是让 Agent 通过 self-play 学会使用上千个底层 API 29:43 Agent 当前市场格局: 29:52 Coding Agent 是皇冠上的明珠 30:26 Vertical Agent 遍地开花,但准确性仍是大难题 30:46 通用型 Agent 尚不存在,但 RL 或可迎战 31:17 万物皆可 call API 34:07 一个具体的应用示例:Agent 是怎么帮商家省钱提效的? 39:08 训练成本和推理成本都低得令人发指... 40:33 先定一个小目标:做各行各业的 API 杀手 42:57 对 25 年硅谷 AI 市场的观察和预判 43:11 垂类 Agent 是绝对的热点赛道,融资并不困难 45:29 25 年是 Agent 真正落地的一年 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescalero
-
去年我们做了一期年终总结,叫《24、25 年会是下一代浪潮最关键的两年》,今天我仍然坚定的站在这个结论背后,24 年看似悲观实则蕴藏了很多机会,而 25 年就是爆发的一年。而还没有进场的人,可能 25 年就是最好的机会。 在这期播客中,我帮大家快速理解: 1)23 年 24 年市场发生了什么,核心重点是什么,原因是什么。 2)为什么市场普遍悲观,而我们却极其乐观。 3)当下市场中最流行的 Prosumer 概念是什么,为什么会有这个概念。 4)市场都说 Agent 是重点,我从传统软件到 SaaS 再从 SaaS 到 Agent 解释了这里的机会和做法到底是什么。 5)为什么多模态 2C 产品,反而是我们最看好的机会?这个可能就是 AI Native 的答案。 这期播客一共 30 分钟,23 到 25 年 AI 市场的精华都在其中。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【时光机】 Part1 复盘过去两年的 AI 发展 00:50 市场从盲目乐观走向过度悲观(不过最近有新风向 02:26 24 年 1-9 月,一级市场是过去十年 (大概率也是未来十年) 之最差 04:19 模型侧符合我们 23 年初的 4 个判断 05:17 应用侧不及预期,但也有人赚到钱 06:35 为什么我们开始乐观? 06:48 ① 9 月后,融资市场明显复苏 07:05 ② 多模态的能力在持续加强 09:04 ③ 大多数人忽略的一点是,AI 创始人的画像发生了明显变化 10:07 无论外部因素如何,最终起决定性作用的是资产价值本身 Part2 展望 2025 10:41 市场大环境会进一步变好,但会越来越两极分化 11:59 当下最好的选择不是创业,而是先加入一家 AI 公司积累经验 12:30 市场关键词演变:23 年「大模型」,24 年「具身智能」,25 年「应用落地 13:06 目前最具共识的是 Prosumer 赛道,可能会率先跑出千万美金 ARR 15:03 此外我们最看好 Agent 和多模态 Part3 详谈 Agent 和多模态 15:30 Agent 会是 SaaS 的十倍? 16:02 Agent 更可能是新公司的机会,而不是现有 SaaS 公司的机会 22:57 Perplexity 未来其实是一家 Agent 公司 26:25 AI Native 的答案是什么? 30:28 早入场的人、乐观的人,往往都获得了回报 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
这期是我自己一直感兴趣的话题。 我一直觉得像德扑、狼人杀这样的游戏设置非常有意思,里面的各种理性策略、感性判断和说服人的能力,都能体现在现实世界的角角落落。相信绝大多数人都大抵接触过这些游戏,哪怕不是相关领域的专家,所以我们这次就请来了一位德扑世界冠军来一起讨论他视角下的德扑,以及其中很多“技巧”对这个世界的映射。 在整个聊天过程中,嘉宾说了无数次的“绝对理性”,也谈论了在游戏中是如何对“人”进行判断(比如行为基准线的概念),另外在结尾部分,他还说了一句点破社会经济运转规律的话,即“通胀是人生的大小盲”。 这期很多内容比较偏向于德扑本身,希望大家听完能够从中收获些对现实世界中博弈、决策和投资等的参照,也祝所有人都能跑赢通胀。 【人类博物馆】 导游:曲凯,42 章经创始人 29 号珍藏:Ricky Mao,毕业于复旦、 MIT,前投资人、企业 CFO,现是全球 Global Poker Index 排名 200 左右、中国前 10 的扑克选手。曾获 WSOP(世界扑克系列赛,代表着竞技扑克的最高水平)金手链、两次 APT(亚洲扑克巡回赛)冠军。 【时光机】 Part 1 一个顶级牌手的核心素养 4:15 要素一:绝对理性 5:53 but how? 8:34 那还能 all in 吗? 10:26 要素二:识人 11:34 核心是知道基准线在哪里,然后分析每个人动作上的偏移 12:07 线下接触一个人,可以先通过外在形象给 ta 建模(日常生活不鼓励这么做哈 - 示例:金表大哥 v.s. 沙滩白男的行事风格模型 - 所以要怎么又快又准地给人建模? 14:55 见不到面时,能通过什么信息来判断对方是什么样的人? 15:28 国人更喜欢刺激、赌性更强 19:47 大家最常犯的错误是什么? 21:16 行业 top,最后真正拼的是什么? 22:29 要素三:掌握概率 Part 2 心态篇 23:41 为什么说「一场比赛毁一个冠军」? 26:51 是人都会经历大的下风期 27:53 拿到金手链的精彩故事 28:20 我曾经想过:如果拿到金手链,我愿意第二天去死 29:04 肾上腺素飙升…反败为胜前的尖峰十小时 Part 3 策略篇 31:03 大部分人对 Bluff 的认知都不对 35:26 更激进的打法,能引向更好的结果吗? 36:00 怎么打满价值? 40:02 位置这件事,到底有多重要? Part 4 人生思考 41:01 绝对理性和保持感性并不矛盾 42:28 「再坚持一下」可能是一种有毒的心态 43:36 通胀是人生的大小盲,环境不好的时候你完全可以空仓 48:03 顶尖高手的风格都是万法归宗 【Notes】 Tom Dwan:一位著名的德州扑克选手,以其非常激进和高风险的打法著称。节目中还提到了几位顶尖高手,包括 Eric Seidel、Phil Ivey、Daniel Negreanu、Dan Cates (Jungleman)、Adrian Mateos、Steven Chidwick。 GTO(博弈论最优):GTO 策略是一种防守性策略,目的是让你不容易被对手剥削。在 GTO 策略下,玩家通过混合不同的行动(例如:下注、加注、弃牌等)来保持平衡,使得对手即使知道你的策略,也无法从中找到漏洞。 大小盲:德扑中使用的强制性下注结构中的两种盲注。小盲注(Small Blind)是由庄家左手边的玩家支付的强制性下注金额,通常为最小的注额。大盲注(Big Blind):是由小盲注左边的玩家支付的强制性下注金额,通常是小盲注的两倍。这些盲注的设置目的在于推动游戏进行,确保每一局牌都有一定的筹码池。游戏中的其他玩家可以选择跟注、加注或者弃牌,而支付盲注的玩家则已经支付了入池的初始金额。 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
-
活动预告🥳:12 月 7 日,我们会请到 Ted 做一场线上活动,大家记得翻到 shownotes 末尾查看报名信息! 在我 9 月份的硅谷行程里,我见过的印象最深、让我最有收获的人之一就是 Ted。 那个时候他正要离开 Character.ai,作为第四十多号加入的员工,他对于 C.AI 的产品、模型、训练等等的熟悉程度都非常高,这次很开心能把他请来,跟大家一起分享下美国最著名的 AI 公司内部是如何运作的,Post Training 的最佳实践是怎么做的,以及硅谷一众 AI 从业者的现状和认知等。 这期播客的内容基本代表了美国最一线的 AI 从业者的实践和认知,非常有代表性,希望对大家有帮助! 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42 章经创始人 28 号珍藏:Ted,前 C.AI 模型应用算法专家 Part 1 从内部视角看 C.AI 01:06 为什么商业化一直没做起来? 04:40 如果 C.AI 当时往 AGI 赌把大的,或者把产品交给字节系,能改写自己的结局吗? 06:51 我们很认可 Talkie,但不想学 Talkie 09:36 被收购后,你还相信 C.AI 类产品的未来吗? 11:35 有人说「C.AI 不是真正的 AI 陪伴」,那它到底是啥? 12:19 C.AI 为什么做得比别人好? Part 2 我在 C.AI 做 Post Training 的这一年 14:56 工作状态是 996(主动的哈,passion! 17:15 Post Training 的核心是设计高效的迭代路径 18:42 四种迭代路径,都有很多低垂的果实可以摘 21:40 怎么评估和改善「模型变蠢」的问题? 22:54 迭代中一个有趣的 EQ 涌现 24:19 Post Training 到底是怎么个流程? 25:37 介绍 Post Training 三大件:SFT(监督微调) 、RLHF(人类反馈强化学习)、DPO (直接偏好对齐) 32:07 以上天花板极高,RAG 和 Prompt Engineering 我们几乎没做 32:53 帮你拉开和同行差距的 2 道数据思考题: 33:18 你微调用的数据,质量真的不能更高了吗? 36:00 收集来的用户偏好数据,只能是点赞点踩吗? 39:32 大家现在关注的几个技术难题,C.AI 是怎么做的? 39:49 怎么做好评估? 41:10 怎么做好意图识别? 43:22 C.AI 的语音延迟基本是业界做得最好的,是怎么做到的? Part 3 硅谷观察 46:17 一个不被公开的秘密:ChatGPT 内部也是多模型混用? 47:28 硅谷整体还是很乐观,推理侧仍然大有可为 50:45 硅谷现状: 51:01 做产品的想靠多模态赚钱 51:06 搞算法的想复制 o1 51:16 两边都在期待自动交互 Agent 解锁的想象空间 53:48 复盘最近的硅谷求职记 53:54 Post-train 人才极其抢手 54:27 印象最深的是,面 Cursor 的时候,我甚至被允许用 Cursor 现场解题 56:03 最喜欢被问到「你觉得我们的 idea 有多不靠谱?」 56:45 如果我是面试官,我会考察面试者的这项直觉能力 57:28 我很喜欢现在硅谷的氛围!当下可能是华人扬眉吐气的最好时机 【活动预告🥳】 12 月 7 日,我们会请到 Ted 做一场线上活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros