Episodios

  • 上集节目,广密在OpenAI o1问世之前,准确地预言了代号为“Strawberry”(草莓)的项目走向,以及它背后暗示的AGI范式已经转移,强化学习开启了新赛道。

    这集节目录制在o1问世之后,我第一时间和边塞科技创始人、清华叉院信息研究院助理教授,同时也是前OpenAI研究员的吴翼聊了聊。他的研究方向正是强化学习。吴翼从技术视角全方位地解读了o1模型,并且分享了只有内部视角才能看见的真实的OpenAI。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:50 2019年在OpenAI做研究员 03:04 那个年代所有PHD都希望去Google Brain和DeepMind 03:46 OpenAI o1-preview初体验,很意外在用户使用端做这么大规模的推理 07:20 pre-training(预训练)能挖的金矿越来越少,以强化学习为基础的post-training(后训练)是另一个大金矿,使迈向AGI的梯子多了几节 09:00 o1-preview版本是GPT-3时刻,到没到ChatGPT时刻要看正式版本 10:33 o1应该核心关注两个要点和背后的技术原理 13:54 强化学习能否探索出Scaling Law有希望,但很复杂 15:06 强化学习三要素:reward model+搜索和探索+prompt,每一块都很难 16:42 2014年开始,UC Berkeley集体转向,押注强化学习 19:36 RL算法的演进:从DQN(Deep Q-Network)到PPO(Proximal Policy Optimization) 23:45 相信会带来通用能力而不是垂类能力提升 24:47 长文本是实现AGI的第一步,推理能力是第二步 29:57 通过o1-preview能反向复原哪些技术细节? 34:00 reward model不太可能有一个单独的小组闭着眼睛训练,是耦合的 38:30 思维链、安全、幻觉和算力 41:25 为什么这么项目叫“Q*”?后来又叫“草莓”?梗都很有意思 49:49 o1不代表垂直模型,依然相信会出现全能的大统一模型 57:57 关于Scaling Law,2019年OpenAI内部讨论的细节 01:00:26 2019年的OpenAI处于“闭着眼睛挖矿的状态” 01:03:20 OpenAI当年如何做管理:搞大新闻、发博客,KPI是博客关注量 01:10:28 2020年离开OpenAI后悔吗?

    o1发布前的预言单集:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 我们的节目正在推出新系列【从蒸汽机到无人驾驶】,今天是第4集。因为,在我自己学习自动驾驶的过程中觉得,这个行业的知识壁垒很高、信息不对称也很严重。所以邀请孟醒来做一个自动驾驶的深度科普。

    之前的节目介绍过,自动驾驶分成两条线索:1、以特斯拉为代表的辅助驾驶路线;2、以Waymo为代表的全无人驾驶路线。围绕路线之争,这个行业吵了10年。

    在上集,孟醒着重聊了第一条线索:特斯拉FSD进化史。本集,我们的重心则是另一条:低调的Waymo和它的对手们。很有意思的是,孟醒曾带队在凤凰城调研Waymo,还暗中探访了它的“老巢”。

    本集是《张小珺Jùn|商业访谈录》和《技术不无聊》的串台节目。《技术不无聊》是孟醒制作的一档新播客。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    【嘉宾小传】

    孟醒,五源资本合伙人、卡尔动力董事长,曾担任滴滴自动驾驶COO、顺为资本科技组负责人;在顺为期间,孟醒投资了小鹏汽车、Momenta等明星公司;加入顺为前,孟醒曾经作为创始人和CEO创办两家人工智能领域的明星创业公司,分别是美国的Orbeus和中国的知图科技,两家公司都被并购;孟醒还曾在摩根大通投资银行部门任职,负责亚太区科技领域的投资并购以及IPO项目,参与项目金额超过600亿美金。孟醒拥有加州大学伯克利分校应用数学和经济学学士,以及麻省理工大学斯隆商学院MBA学位。

    02:00 Waymo始于2009年,是Google X实验室一个项目 04:32 我访谈Google无人车创始人Sebastian Thrun,结果被人骂了,很惭愧 07:13 DARPA Grand Challenge(美国DARPA出资赞助的无人驾驶赛)被埋没的故事 13:24 Waymo负责人连连换届: 1. Sebastian Thrun(2009-2013):Sebastian Thrun是斯坦福大学教授,也是谷歌自动驾驶汽车项目创始人之一 2. Chris Urmson(2013-2016):Chris Urmson是卡内基梅隆大学机器人专家,参与了多次DARPA自动驾驶挑战赛 3. John Krafcik(2015-2021):John Krafcik是汽车行业资深人士,曾任现代汽车北美公司总裁兼首席执行官 4. Tekedra Mawakana和Dmitri Dolgov(2021-2023):Tekedra Mawakana是Waymo首席运营官,法律和公共政策背景出身;Dmitri Dolgov是Waymo首席技术官,参与自动驾驶技术开发多年 5. Dmitri Dolgov和Saswat Panigrahi(2023年至今): Dmitri Dolgov继续担任CEO之一,Saswat Panigrahi是Waymo首席产品官,负责产品管理和战略规划 18:05 Waymo技术关键变化,对最简洁漂亮的架构端到端抱有理想 21:55 我带队在凤凰城调研Waymo四个月,还暗中探访了Waymo“老巢” 38:30 无人驾驶第二名Cruise(创始人Kyle Vogt),两年、40人团队,10亿美元卖给通用汽车 43:24 一起安全事故,使Cruise从顶峰极速坠落 48:00 为什么Waymo和Cruise同样作为大企业分支,风格差异这么大? 57:40 Uber也曾是无人驾驶一个有竞争力的对手,怎么退出了比赛? 59:17 另外两位竞争对手现况:Zoox、Aurora

    【从蒸汽机到无人驾驶】系列

    和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊

    和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”

    从蒸汽机到无人驾驶3|和孟醒聊特斯拉FSD进化史

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • ¿Faltan episodios?

    Pulsa aquí para actualizar resultados

  • 今天这集是我和广密【全球大模型季报】第4集。这期2024年Q3季报,提前和大家见面。

    我们正进入的9月会是AGI的一个大月,OpenAI造势已久且绝密的项目“草莓(Strawberry)”将在不久后揭开它神秘的面纱。此外,Anthropic也会推出Claude 3.5 Opus,这两个模型将是AGI进程是否顺利的关键风向标。

    这些项目很可能暗示了硅谷AGI范式已经静悄悄地发生剧烈转移。

    本集节目带来了对AGI发展路径的最大猜想——硅谷AGI范式正在发生转移,self-play RL(强化学习)开启了新赛道。大部分人还没意识到,在纯靠语言模型预训练的Scaling Law这个经典物理规律遇到瓶颈后,多家硅谷明星公司已经把它们的资源重心押宝在一条新路径上:self-play RL(自博弈强化学习)。只不过,这个范式转移还未形成共识。Self-play RL到底是什么?它如何有别于传统路径?它能成为继续Scaling Law的一把神奇钥匙吗?

    这集节目是关于self-play RL的一篇高质量科普,也希望为大模型从业者带来方向性的启发。

    除了self-play RL,我们着重探讨了硅谷一级市场的明星赛道(Coding、视频生成、通用机器人),以及OpenAI与科技巨头近况。希望我们【全球大模型季报】能帮大家了解最前沿的AGI动态,并且能持续给大家带来启示。

    本集是《张小珺Jùn|商业访谈录》和《海外独角兽》的串台节目。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    坏的推演猜测,GPT-5不乐观;好的推演猜测,RL开启新赛道

    02:30 语言模型预训练的范式或许遇瓶颈,模型scaling边际效益开始递减

    05:21 为什么不一定能支持模型在GPT-4o基础上大幅跃升?现在处于“真空死亡地带”?

    06:43 我最担心的是,纯靠语言模型的经典Scaling Law /Pre train这个物理规律遇到瓶颈,或者在更大参数比如2-3T以上的情况下开始失效了

    09:37 如果scaling law在模型变大的过程中不work,现在有三条潜在路径:1、多模态尤其是视觉(但还没有证据说能从视觉模态训练涌现智能能力);

    2、10万卡集群(但10万卡集群充分互联的难度比预期难,可能是全人类最难的项目之一);

    3、强化学习self-play RL(这是范式级别的大转变!)

    12:53 如果我是AI公司CEO,我会200%资源all in RL这条路

    13:40 概念解释:Reinforcement Learning,简称RL,中文强化学习(Ilya用一句话概括强化学习:让AI用随机路径去尝试一个新任务,如果效果超出预期,就更新神经网络的权重让AI记得多使用成功的实践,再开始下一次尝试)

    19:05 代码和数学可以变得很强,能不能泛化到更多领域没有证据

    22:39你也可以把语言和预训练比作人类基因组,携带着人类几千年进化的基因,强化学习RL就是人类成长的一生

    24:55 必须很聪明的模型才能有能力做self-play RL的探索

    27:07 Anthropic Claude 3.5是这一波标志性的产品,他们不搞Sora/搜索,主线是RL;业内少数人意识到RL的重要性是最近两个月

    28:35 硅谷明星公司现阶段的资源投入?1-2家公司把RL当作最高优先级

    28:56 2024年9月OpenAI和Anthropic即将要发布的,什么值得期待?

    29:42 AGI范式大转移之下,还会有GPT-6和GPT-7吗?(可能明年会看到很小的模型比今天GPT-4o要聪明非常多,一个期待是实现AGI不一定需要巨量参数的模型)

    30:33 新范式的困境和卡点

    32:52 Character.AI出售给Google预示AGI竞赛上半场结束,下半场开始,创始人Noam从Google进入self-play RL下半场

    34:36 新范式下,还需要那么多GPU吗?很多人关心英伟达股价

    37:06 AGI范式转移只在最核心的researcher中有共识,几百人,还没扩散

    38:55 Claude 3.5 Sonnet显著提升,带动了编程工具Cursor的火爆出圈

    40:08 OpenAI在造势的草莓、Q*,猜测背后都是强化学习RL

    41:55 国内公司应该应该all in 200%跟进RL

    42:44 语言模型和RL是乘级关系

    硅谷AI一级市场的四个明星赛道

    45:12 硅谷的AI赛道:围绕LLM周边有3-4个圈,搜索、代码Coding、视频、机器人

    1、Coding:在硅谷出现了4-5家独角兽(Devin、Augment 、Magic、Poolside,都已经20-30亿美元估值),最近编程工具Cursor出圈

    2、  视频:这个赛道诱人,但格局不稳定、决胜窗口长

    3、通用机器人:想赌具身领域也有个OpenAI,现在是基础科学突破的问题,没看到在机器人领域的“通用泛化能力”出现

    57:00 美国通用机器人的明星项目(Pi、The Bot是业界公认最头部的项目,除此之外融资金额很大、声量也比较高的是Skild AI、Figure AI)

    58:31 国内vs硅谷机器人:硅谷投robot foundation model一个大脑,像Andorid;在国内投整机,OV和小米

    01:01:56 LLM->多模态->具身智能->世界模型,这是AI发展路径

    01:05:54 LLM vs 移动互联网,叙事逻辑是什么?哪些明线与暗线?

    01:07:04 有没有可能,今天不做强化学习的公司未来都跑不出来

    01:08:05 站在现在,重新评论一下中国LLM?“月亮和六便士”

    OpenAI和科技巨头

    01:12:37 OpenAI

    1、有点浪费技术领先的红利,产品没接住

    2、联合创始人Greg Brockman、John Schumann离职

    3、Ilya离开应该是bet on两个路线(多模态/强化学习,大概率是RL)

    01:17:10 Q*和草莓和RL应该是一件事,草莓是代号,RL是方法

    01:18:07 回答红杉美国合伙人 David Cahn发布最新文章《AI’s $600B Question》

    01:20:00 在2024年Q3,AI叙事还有哪些非共识?

    01:22:45 Character.AI之后,哪些AI公司还会被收购?做个预测

    01:23:38 2000年互联网hype破灭后只留下Amazon一家公司,今天AI hype如果破灭了,谁是下一个Amazon?

    01:24:24 AGI第一幕是科技巨头受益,第二幕还没完全展开

    【全球大模型季报】系列

    2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

    2024年Q1:和广密聊AGI大基建时代:24 Q1全球大模型前沿手记

    2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 去年下半年以来,特斯拉V12版本和端到端架构为自动驾驶掀起了一波全新的热潮。这波总是在“5年之后”又“5年之后”屡屡迟到、屡屡爽约的技术革命,到今天,到底发展成什么样了?它距离我们真实的生活还有多远?

    我们的节目正在推出新系列【从蒸汽机到无人驾驶】,今天是第3集。

    我们的前两集节目里,已经推出了与何小鹏和楼天城的访谈,他们分别代表自动驾驶领域最有代表性的两类公司:一个是做L2(辅助驾驶)的汽车公司、一个是做L4(无人驾驶)的技术服务公司。这次,我邀请了在自动驾驶行业很资深且背景多元的一位人士。

    孟醒在过去8年从各个维度深入参与过这个行业。他曾是连续创业者,先后在美国和中国创办了两家人工智能初创公司;他也是投资人,投资过小鹏汽车、Momenta等自动驾驶相关公司;2019年起,他出任滴滴自动驾驶COO。就在最近,孟醒刚刚更换了新身份,再次回到风投行业做一名前沿科技投资人。

    我和孟醒从他亲身试驾特斯拉FSD各个版本的真实感受开始聊起,深入探讨了端到端架构和FSD进化史。不过这集只是开篇,接下来我们还会推出更多的精彩续集。

    本集是《张小珺Jùn|商业访谈录》和《技术不无聊》的串台节目。《技术不无聊》是孟醒制作的一档新播客。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    【嘉宾小传】

    孟醒,五源资本合伙人、卡尔动力董事长,曾担任滴滴自动驾驶COO、顺为资本科技组负责人;在顺为期间,孟醒投资了小鹏汽车、Momenta等明星公司;加入顺为前,孟醒曾经作为创始人和CEO创办两家人工智能领域的明星创业公司,分别是美国的Orbeus和中国的知图科技,两家公司都被并购;孟醒还曾在摩根大通投资银行部门任职,负责亚太区科技领域的投资并购以及IPO项目,参与项目金额超过600亿美金。孟醒拥有加州大学伯克利分校应用数学和经济学学士,以及麻省理工大学斯隆商学院MBA学位。

    01:30 孟醒的学习和创业经历,从幼儿园就开始在中美两边穿梭 08:33 为什么自动驾驶行业和公众之间充斥着信息不对称? 11:17 自动驾驶分两条线:辅助驾驶已经到产品中期,无人驾驶产品还处在Pre-A阶段 18:18 辅助驾驶和自动驾驶各自迈过几道坎?还有哪几道坎要过? 21:18 亲身试驾特斯拉FSD不同版本的感受(从非端到端的最后一个版本V11.3.6到端到端版本V12.3、V12.4,技术提升斜率如何?) 27:37 为什么L4公司看特斯拉FSD像小学生?优化目标和L4公司不一样 29:09 L2直到实现极高驾驶能力之前,应该有最优接管率,不能过高也不能过低 33:12 L2和L4截然不同的产品体系:L2提供更好的人机共驾体验,L4提供成本更低的出行服务能力 33:36 L1-L5的命名体系和它带来的歧义 43:06 特斯拉V12版本和端到端架构为什么重新点燃自动驾驶的热情 52:20 V12更像是辅助驾驶里的GPT-3时刻 54:11 关于特斯拉端到端架构,哪些是已知信息?哪些是黑盒? 56:43 特斯拉自动驾驶的技术演进史(both硬件和软件) 01:02:54 特斯拉是端到端且不用任何规则兜底,国内公司很难做到 01:04:07特斯拉的纯视觉路线vs大部分公司的激光雷达路线 01:11:52 端到端是自动驾驶的终极大杀器吗?分别探讨L2和L4 01:17:32 复刻特斯拉FSD需要多少花销?大致的估算 01:19:18 几乎所有中国的竞争者都在跟进端到端架构

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 我们的节目正在推出新系列【从蒸汽机到无人驾驶】,今天是第2集。

    最近萝卜快跑在武汉引发广泛关注,许多人开始讨论Robotaxi是不是迎来拐点?我邀请了楼天城来聊聊。

    楼天城是清华首届姚班毕业生,因在编程竞赛的优异战绩又被称作“楼教主”。他毕业后进入Google工作,在这里最早接触了无人驾驶,而后又加入百度从事无人车研发。2016年,楼天城与百度前首席架构师彭军,创立无人驾驶公司小马智行(Pony.AI),他出任联合创始人兼CTO。该公司估值达85亿美元,正寻求在纳斯达克或纽交所上市。

    节目中,我们探讨了关于Robotaxi的新闻、无人驾驶的简史、自动驾驶常见的路线之争。楼天城说了一些颇为尖锐的观点:比如,“L2做得越厉害,它离L4越远,反之亦然”,又比如“当自动驾驶超越人类,数据就变成干扰项,并不是越多越好”。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:11 先谈两条新闻:1、萝卜快跑火了,2、Tesla推迟Robotaxi发布时间 04:39 用时间概念来表达“无人驾驶小史”:1小时/10小时/100小时/1000小时/10000小时,自动开不用人接管(跨越每一步中的关键点) 10:10 我主要精力花在“Contest based metric system”(“基于竞赛的度量系统”,旨在根据不同的场景分别评估系统的能力。) 16:45 “端到端”根本变化是,让整个模型的能力加强了,避免模块之间传输信息丢失 17:18 “端到端”只能做到100小时,从100到1000小时是超越资源和能力的 17:50 自动驾驶的路线之争:先有目标不同,才有路线不同 1、激光雷达/纯视觉?“纯视觉只能做好学生,但激光雷达能作弊” 2、车路协同/单车智能?“互相加成,但单车智能是priority” 3、渐进式自动驾驶/跨越式自动驾驶?“一个是足球、一个是篮球” 4、辅助驾驶/自动驾驶?“L2做得越厉害,它离L4越远” 26:57 无人驾驶创业这8年:高潮与低谷,落地得快与慢 35:54 “当你真的超越人类,数据不是越多越好,数据是干扰项” 44:06 关于个人:姚期智先生令我印象深刻的、ACRush、“只有冠军才知道冠军和亚军的差距” 49:10 坚持20年编程竞赛的人告诉你一个竞赛技巧:“Hold cold card”

    【更多信息】

    文字版可参考:《和楼天城聊Robotaxi:“L2越厉害,就离L4越远”》

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 我们的节目正在推出新系列【从蒸汽机到无人驾驶】,记录这段承载人类出行终极梦想的技术浪潮,今天是第1集。

    很多人说大模型会改造自动驾驶,加速拐点的到来,但它究竟是如何发生的?

    本集我邀请了小鹏汽车董事长兼CEO何小鹏。

    过去1年半,作为一名汽车CEO,何小鹏倒是为大模型做了挺多事——他让团队读论文,自己到访美国三趟,试驾特斯拉FSD和Waymo,还拜访了黄仁勋。在他看来,中国需要通用大模型公司,但中国也需要自己能读懂大模型,把大模型放到应用做工程落地的公司。

    站在小鹏汽车创办10年的节点,我也和他探讨了友谊、商战、高峰与滑铁卢。

    他形容,造车就像在“在血海里游泳”。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)友谊与股价 02:11 雷军怎么邀请你、李想和李斌同时出席小米SU7发布会? 03:12 他们说“估计你气晕了,在厕所哭啊”,把我笑坏了 03:25 那场发布会上,李想、何小鹏、李斌、魏建军的座次问题 04:17 我们坐在下面讨论什么?我为什么在笑? 05:50 什么时候发现小鹏汽车的股价跌了?什么心情? 06:05 我对雷军和他第一台车的看法基因与局限 06:27 小鹏汽车做智驾的源头和基因 10:30 我从之前创业做UC浏览器积累的认知 14:14 蔚小理都是从互联网入局造车的创业者,但基因和思考完全不同 15:56 我的反思:如果我有汽车品牌逻辑,我会切得再高一点;如果我更懂汽车体系,我会先从P7入手,再到maybe G7的体系 17:25 论“小鹏汽车”的命名和从投资人到加入小鹏汽车 20:18 UC创业那十年心理上的高点、低点和忐忑大模型改造自动驾驶 21:32 一个现实问题:自动驾驶能帮你卖车吗? 23:33 大模型公司没人挣到钱,它在另一个纬度可以挣到钱的,就是自动驾驶 24:33 自动驾驶做了大模型,还需要有“刹车”加“守门员” 25:28 在ChatGPT问世以后,我做了哪些动作?读论文、到美国、拜访黄仁勋 26:00 大模型不是人的思考逻辑,是machine的思考逻辑或者推理逻辑 27:25 软件从科研到规模使用很快,硬件极其难 29:58 大模型怎么在车上落地?按照它的逻辑重写我们的数据流逻辑,增加数据的收集,做预训练,最开始写出来的东西完全不能用,需要巨大的训练量 32:58 你和车企CEO、李想、李斌、雷军会聊大模型吗? 33:20 中国需要通用大模型公司,但中国也需要自己能读懂大模型,把大模型放到应用做工程落地的公司——小鹏是其中一家 35:10 怎么看马斯克同时做Tesla和xAI 36:54 吴新宙离职和拜访黄仁勋的启发敌人和护城河 40:32 今天随着华为入局,它的智驾能力也被认为是第一梯队,而它的风格又那么凶悍,你感受到了冲击吗? 41:32 有人说,小鹏要不干脆别卖车了,学华为做智能化提供商 42:45 大模型对于小型公司不利:大AI越强所以越多数据,越多数据所以越多费用,越多费用所以要卖越多车支持这个体系,这是一个网络效应 46:32 复刻特斯拉端到端FSD(完全自动驾驶)要花多少钱、多少时间、哪些基础要素? 47:40 未来多模态的大模型、自动驾驶模型和机器人大脑会统一吗?乱世快出现了 48:59 “兄弟们想害谁,就让他来造车” 51:40 “我只是觉得在血海里面游泳” 53:31 切忌在人的方面“一脚油门、一脚刹车” 55:49 G9事故反思、变革之难 57:00 和总裁王凤英的分工,我们没有汇报关系 01:00:28 不是壮士断腕,是“壮士把头都断了” 01:01:35 淘汰赛、全明星赛,我的目标是第一 01:03:01 合纵连横频发,乱世快出现了 01:05:44 车企发车好比“出牌”,小鹏为什么今年出MONA M03这张牌? 01:10:33 变革中的我:最近发的小脾气,从民主到集权,关注2+3问题01:14:00 何小鹏最近在美国试驾完特斯拉FSD和Waymo之后,新鲜的体验与判断

    【更多信息】

    本集文字版本:腾讯新闻原文 & 作者的收藏夹

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天这集是【全球大模型季报】第3集,我与广密从AI应用端出发,复盘全球大模型这半年的进展。

    AI搜索是大模型在应用端达成的第一个共识。这次,我们详细聊了聊AI搜索企业Perplexity,关于它的创业、数据、竞争与护城河。Perplexity最新一轮估值已达30亿美元。

    此外,我们聊了一些业界关心的重要话题:AI应用为什么还没有大爆发?GPT-5为什么那么慢?大模型的商业模式和壁垒究竟是什么?我们也对美国科技巨头过去半年的状况一一作了点评。

    我们在这集节目增加了一个互动环节,大家可以就播客中提出的问题在评论区留言,也许嘉宾会现身回复哦:)

    本集是《张小珺Jùn|商业访谈录》和《海外独角兽》的串台节目。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)02:16 突然走红的Perplexity 过去1年,应用端比较无聊,Perplexity是唯一跑出来的(2000多万月活用户,2000多万美元ARR,年底可能到1亿月活,1亿美元ARR,月度环比增长20%以上) Perplexity的创始人和创立过程,硅谷核心圈都投了 Perplexity的豪华投资人天团、已完成四轮融资与估值爬升过程 (投资人包括:Google SVP Jeff Dean,Meta首席科学家Yann LeCun,OpenAI早期投资人Peter Thiel、OpenAI创始成员Andrej Karpathy、知名Solo GP Elad Gil,GitHub之前的CEO Nat Friedman,Databricks联合创始人Reynold Xin,Hugging Face CEO Clément Delangue,亚马逊创始人Bezos) 为什么硅谷的个人投资者参与这么多? 06:16 信息检索是匹配模型能力最合适的PMF 对于知识工作者有积累创造性任务:组合型创造-探索性创造-变革型创造(信息检索就是组合型创造) Perplexity CEO是先思考产品再思考模型,而不是先做模型再找落地场景 如果Perplexity能向下改模型,Anthropic收购Perplexity,这是很好的组合 11:12 Perplexity最新估值达30亿美元,为什么它值这么多钱? Perplexity这种产品形态和小红书长期是什么关系?都在抢传统搜索的生意 Perplexity A轮融资的时候,我们拿它和头条早期数据做对比,很有意思(留存、用户心智) 英伟达投资了Perplexity,黄仁勋公开说他用做多的一个AI产品是Perplexity Perplexity怎么和Google、OpenAI竞争?错位竞争! 面对Perplexity,Google、百度这类传统搜索公司有哪些应对? 秘塔AI是中国的Perplexity吗?国内一个问题是:内容有割裂性 17:50 Perplexity的护城河是什么?会独立长大还是被并购? “今天的创业公司似乎都在巨头的辐射之下” 18:25 同样是30亿美元估值的月之暗面和Perplexity,本质区别是什么?19:16 无聊的AI应用生态 首先画一张AI创业公司脑图(大模型公司估值显著高于AI应用公司) 21:10 海外版“大模型的资本扑克牌”,很清晰、巨头主导,关注Meta和Apple接下来会怎么落子 红杉美国只投了OpenAI和xAI 22:50 AI原生应用系统性大爆发了吗?没有! 为什么说现在模型能力和产品能力不够? 应用大爆发的关键条件有哪些?(模型能力、调用成本、速度latency) 26:55 未来6-12个月,哪些是高确定性问题?哪些高赔率问题? 大家远远低估了模型变小的速度——过去一年我们卷云端和数据中心的基建,未来一两年会卷端侧基建 模型变小的挑战是什么? Apple和OpenAI合作并不稳固,Apple和Anthropic也谈了一个合作,随时热插拔ChatGPT 接下来最重要的能力跃升是:逻辑推理reasoning+多模态 34:10 一个听众互动(大家可以留言):如果OpenAI GPT-4o给开发者的API成本大幅下降,成本可忽略,哪些应用能爆发? 回顾一下GPT降价幅度,过去一年降低10倍;我好奇OpenAI为什么不更激进降价?摧毁其他人 AI应用型的人才画像是怎样的? 给AI新物种大爆发的时间一个预测? 36:33 过去半年美国AI应用生态有多无聊?(沙滩上建房子)36:58 GPT-5为什么那么慢? OpenAI模型能力跃升停滞了吗?为什么GPT-5出来比较慢? GPT-5预计什么时候来?GPT-5会长什么样? 为什么GPT-4和GPT-5中间插了一个GPT-4o?(为了降成本) 硅谷和中国大模型公司牌桌发生了哪些变化? 拿到“最后一张船票”的马斯克xAI,有什么差异化? 41:47 “OpenAI内部状态就像是从东向西开拓美洲大陆,科学家让火车高速奔跑,infra工程师在火车前面修铁路,铁路铺设和火车齐头并进” 过去半年在大模型上,中美差距是拉大了还是缩小了?45:35 大模型的商业模式和壁垒 大模型是好的商业模式吗?壁垒在哪? Scaling Law之外,会有不一样的路线走向AGI吗? 怎么看通用机器人?怎么看无人驾驶? 通用机器人和无人驾驶,哪个来得更快? 今天通用机器人的目标还没有定义清晰55:25 最后,我们点评了硅谷科技巨头这半年的状态 OpenAI(离职风波对OpenAI有影响吗?) 苹果(AI的feature能不能带来换机潮) Google(模型上不乐观,流量优势明显) 英伟达(从股价角度超出了可分析性) Amazon Meta 微软 特斯拉 61:43 “创业公司和大公司不是颠覆关系,是依赖关系” 63:32 RAG、检索增强是阶段性需求,做得好不好是工程问题 64:18 中美创新生态的差异(创新的温室) 65:23 2024下半年展望:你会把时间和精力重点分配在哪些问题上?

    【全球大模型季报】:

    2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

    2024年Q1:和广密聊AGI大基建时代:24 Q1全球大模型前沿手记

    播客中提到的文章:

    Perplexity CEO:AI 创业公司要先做产品,后做模型

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天的嘉宾是MiniMax天使投资人、云启资本合伙人陈昱。MiniMax是中国6家大模型创业公司中,除月之暗面之外,另一家估值比较高的独角兽企业。这集我们聊了聊MiniMax的创业、融资和团队故事。

    此外,最近很多投资人都去美国参加了GenAI大会,陈昱在现场聊了聊他的观察。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    GenAI大会

    01:00 陈昱的自我介绍

    01:55 聊聊最近在美国举办的“GenAI Summit SF 2024”大会

    03:36 中美博弈下,美国基金怎么看有华人参与的AI项目?美国公司怎么看中国资本?

    10:18 美国的AI创业方向和中国总体差距不大,以软件为主

    11:00 GenAI大会在组织中,出了许多问题

    AI在过去10年的演进

    11:40 过去10年,AI在技术和投资两个层面的演进路径

    13:05 三波AI应用浪潮:计算机视觉(诞生了AI四小龙)、自动驾驶(L4落地的艰难)、大模型

    15:05 我这次再次体验了Waymo

    18:22 2022年底all in大模型以后,也分了若干阶段

    MiniMax的幕后故事

    24:25 作为第一个投资人,投MiniMax背后的故事(和联合创始人贠烨祎是校友)

    29:34 创始人闫俊杰的代号叫“IO”(Input/Output),见过一次后我对他有好感

    31:46 MiniMax是从商汤出来的创业公司,商汤的局限性

    33:57 MiniMax是一把手亲自参与、高度保密的项目

    36:22 MiniMax的技术、应用、产品迭代(数字人-Glow-海螺AI、星野等)

    39:30 原今日头条产品负责人张前川在高瓴的牵线下加入

    40:39 关于闫俊杰、贠烨祎和团队?

    43:38 怎么看巨头引发的大模型降价潮,特别是对创业公司的影响

    《大模型的扑克牌》

    47:12 玩家:巨头是筹码最多的大户,其次是融资领先的创业公司

    49:24 后面几家创业公司的首要课题是融资

    50:15 Club Deal(俱乐部交易)现象为何在大模型浪潮里如此突出?

    51:00 “看看牌”,今天仍然不敢说一定有创业公司的机会

    52:18 一共5轮,我们基本每一轮都在加码

    52:52 6家大模型创业公司今年的入围线

    55:00 巨头推出的大模型产品PK创业公司的产品

    56:56 你能接受MiniMax被巨头并购吗?

    我的新报道:《大模型的扑克牌:独家内幕故事》(本文访谈了20位中国大模型局中的关键创业者、投资人与生态方,记录过去一年最完整的大模型资本内幕。)

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 很多企业家在过去一两年纷纷去英伟达“朝圣”,令他们最为吃惊的是黄仁勋的管理方法论。每一条都很反直觉,反共识——比如,老黄不裁员。

    今天我邀请前龙湖集团CSO、专注战略与组织研究的王亚军,来系统性梳理老黄搭建组织系统。先透露两条让我听完觉得非常激动的观点:

    1、一个组织的沟通结构会决定它的产品架构,英伟达组织就像它的产品一样,是分布式操作系统,“就像一台GPU”;

    2、如果一个企业没有爱,是不会有创新的;恐惧永远是创新的敌人。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    01:34 英伟达的组织系统是少数存在,看起来奇怪

    04:05 老黄管理第一条:60个高管直接向老黄汇报,再往下不是

    07:53 老黄管理第二条:这60个人薪酬一样,精确到1美分的一样

    09:43 老黄管理第三条:我不做1v1的谈话

    11:30 老黄管理第四条:“Let’s reason together”(我们一起推理吧!)

    12:27 Sounds kind of like a GPU.

    14:26 著名的“康威定律”:一个组织的沟通结构会决定它的产品架构

    18:36 学习英伟达管理的常见误区(context, not control)

    28:04 拼凑式管理,以及管理的本质是什么?

    31:17 “分布式决策能力”适用于什么样的企业?

    35:27 老黄管理第五条:不鼓励写文档,鼓励员工给他发邮件(最重要的5件事)

    38:12 老黄管理第六条:不裁员(I torture you to greatness)

    42:48 老黄管理第七条:只做别人做不了的东西,不看市场份额(Market share is for the losers)

    44:37 “战略不是文字,战略是行动”

    45:10 老黄管理第八条:不做计划

    47:47 英伟达的价值观之一是爱与关爱

    48:52 如果一个企业没有爱,是不会有创新的;恐惧是创新的敌人

    54:20 也聊聊黄仁勋这个人:从服务员到CEO;叫醒小狗让他感到内疚

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天的嘉宾是李志飞,前不久他的公司出门问问刚作为“AIGC第一股”在港交所完成上市。(股票代码:2438.HK)他在节目里很坦诚地聊了聊,作为一家AI公司、一家前沿科技公司,在熬过12个年头终于站在交易所敲钟的那一刻,他到底想了些什么。还有那些你不知道的前沿科技创业中的狂妄与痛苦——他称,自己是一个看见过“创业死亡”的人。

    他的故事或许能给今天在大模型浪潮中冲浪的选手,一点启发。

    此外,我们也点评了最近的GPT-4o、Google AI助手和字节模型大降价等一系列AI最新进展。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)02:00 “AIGC第一股”幕后 06:37 为什么“前沿科技”总和“项目制”挂钩? 08:36 熬了12年,敲钟那一刻的真实想法 10:17 “漏斗模型”,大部分前沿科技会消失 12:38 没有路径和节奏规划的vision是耍流氓15:15 点评GPT-4o:多模态、大统一模型 23:20 有声音生成但没有视频生成,Sora不是自回归架构 24:30 我的信仰是,大一统模型应该基于自回归 29:45 OpenAI技术迭代曲线放缓了吗? 31:50 怎么看一天后Google的反击? 41:51 多模态下一步是把具身智能结合进来,推理能力提高,才有Agent 46:46 字节模型大降价早在意料之中,对以API为商业模式的公司不是好事 48:51 模型公司要思考3-5年充分竞争后,还有你的生态位吗? 51:31 我对前沿科技创业很悲观,都是熟悉的套路55:35 我的前沿科技创业12年 55:35 我做错过的战略是?它让我在巨头碾压时没有生态位 60:51 曾鸣说:模型公司在一块浮冰上,保持敏捷,一旦有坚冰纵身一跃跳上去 01:05:51 回望12年创业中的狂妄、无效勤奋和回归 01:11:06 看见了“创业死亡”的时刻,我抑郁了 01:16:21 谷底的时候在做什么?裁员、战略性躺平、算P&L 01:23:12 我写公众号释放我对技术的冲动,不折腾公司了 01:25:16 前沿科技公司融资后可能进入“负循环” 01:27:06 上市那一刻我在想:今天这个结果对得起我12年受的磨难吗?——对不起。

    《大模型下半场,关于Agent的几个疑问》

    《关于 Google Gemini 的八点启示》

    《从机器人模型 RT-2 看多模态、Agent、3D视频生成以及自动驾驶》

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 这集是梦秋的返场。梦秋是清流资本创始合伙人、百度原技术VP。

    过去两年,风险投资在中国的游戏规则骤变,梦秋从各个维度呈现了洗礼之后的新业态与新规则。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    (01:25) - 美元VC重新定位

    (04:37) - 以朱啸虎为代表施行分红策略,但明股实债这种deal也不好做

    (05:47) - VC目前主流策略是蛰伏

    (08:57) - 美元基金击鼓传花式的投资方式被打破

    (09:42) - 看好机器人本体的机会

    (12:51) - 从第一天就不看大模型,投了两家AI企业(深势科技、aiXcoder)

    (15:13) - 越早期的股东想退出越难,没什么bargain power(议价能力)

    (17:06) - 大厂留给创业公司的“傻瓜窗口”没有了

    (18:10) - 大模型的垂直场景

    (23:08) - 过去一年,中国AI创业公司图谱

    (28:15) - 一个事情push到极致都有可能成功,中间地带是最难的

    (32:57) - 新的游戏规则:VC现在不靠非共识而靠共识挣钱;我们不是Venture,我们希望No Venture,不要冒险

    (33:30) - 人民币 VS 美元,看现在学 VS 看未来学

    (35:57) - VC成了更少数人的游戏,谁应该配置VC?

    (38:53) - 这个行业至少缩水了1/3,我为什么不下牌桌?

    (41:28) - 我们就做侏罗纪时代的啮齿类动物——活着——“你都做老鼠了,你还能怎么更差呢?”

    (47:30) - 今年继续谷底爬行

    (49:37) - 通用大模型对无人驾驶公司有多大冲击

    (59:00) - 清流资本是谁?

    (62:05) - 新时代VC的整个逻辑都变了

    (63:50) - 新时代的founder

    (66:40) - 消费洞察

    (70:05) - 投国家鼓励的方向:新能源、新材料、硬科技;消费值得看,但要投挣钱的

    (73:50) - 经济下行的人世百态

    梦秋此前的节目:

    《1. 和投资人梦秋聊聊加州、投资寒潮和林黛玉》

    《21. 投资人视角下的大模型和市场真实水温|和梦秋聊ChatGPT》

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 3月,我们连续从多个角度关注了中国AGI进展,这集让我们把目光投向海外,对刚过去的 2024 Q1全球大模型的赛局做一个场上的复盘和点评。嘉宾是《商业访谈录》的老朋友、拾象CEO广密。

    他提出,我们正处于一场宏大的“AGI大基建”时期。正如上世时期纪90 年代克林顿推出美国信息高速公路建设,这才有了后面的美国互联网泡沫破裂和互联网黄金20年——如果没有基建,就不可能有应用大爆发。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    (01:45) - 盘点2024 Q1

    (03:40) - 开源 & 闭源

    (06:32) - AGI 是马拉松

    (06:45) - 物理硬件成阻碍AGI最大因素

    (08:05) - 失败案例Inflection

    (08:41) - 黄仁勋的主权 AI、T5T、不鼓励996

    (10:34) – 渐进式解锁

    (12:29) - 改变软件生产方式+信息检索的变革

    (16:50) - 能源 + 芯片=产出智能

    (19:46) - 南坡是模型,北坡是产品

    (23:41) - 突然给经济社会加了两道税

    (25:30) - AGI大基建:造价与玩家

    (26:34) - 训练GPT-3.5和GPT-4,消耗多少算力和能源?

    (39:37) - 电+芯片=产出智能

    (40:38) - Scaling Law

    (47:26) - AGI登山路线图和路标

    (57:40) - OpenAI

    (01:04:02) – 集团军作战,如何结盟?

    (01:05:12) – Apple、英伟达、阿里

    (01:07:20) – Killer App、硅谷投资三大件

    (01:09:25) – 自动驾驶和机器人

    (01:15:47) – 我们作为碳基智能,为什么在追求硅基智能上这么热衷?

    (01:17:00) – Sam、黄仁勋、马斯克

    广密的上一集:《54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观》

    【更多信息】

    本集文字版本:腾讯新闻原文 & 作者的收藏夹

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 2009年,中国资金开启了一段到海外买买买的波澜豪情的大时代。

    联想并购IBM的PC业务、吉利并购沃尔沃汽车,这两起在当时并不被看好的蛇吞象案例,昭示了整个时代的先驱和开端。

    不止如此。2016年,中化集团更是以430亿美元的天价,收购了农产品行业有“皇冠上明珠”之称的瑞士先正达集团。此次收购标志了这个疯狂时代已经涌向最高潮,也是尾声。

    本集我邀请亲历该时期全程、彼时正在中化集团做投资并购和资本运营的王威先生,聊聊这个时代的起承转合。随着全球化低头,中国式出海将去往何方?

    最新消息是,先正达已撤回主板首发上市的申请。这集播客我们的录制时间是去年夏天,我们的商业口述不涉及对最新新闻的评述,也不构成任何投资建议。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    【嘉宾小记】

    王威,职业生涯起步于四大;2009-2017年先后在中化集团负责投资并购和资本运营,参与并主导多起大型海外投资并购案,完整经历了中国资金到海外收并购热情高涨的大时代;而后出任A股上市公司梅花生物CFO;现在是某世界500强企业副总裁和董事会秘书。

    02:06 自我介绍 03:01 同时在央企/民企/外企/混合所有制企业待过,几种企业文化差 06:01 “我们都是围着老板转的”和拎包文化 10:56 界定企业并购与VC、PE的区别 15:06 买买买大时代揭开帷幕的标志性事件 18:02 为什么国家倡导的是跨国并购而不是出海做业务 20:04 欧美国家并购结果惨烈,东亚儒家思潮对被并购企业较和善 20:45 联想鲸吞IBM PC业务和吉利并购沃尔沃汽车是标杆案例 22:00 这两起并购的四个共同点,其中之一是交易时都不被看好 31:40 欧美企业并购完立马裁员、干掉管理层,中国企业恰恰相反 32:48 将并购类比成从谈恋爱到结婚再到过日子 37:50 “没有不好的交易,只有不好的价格” 39:00 中国买买买大时代出现的底层动因(日本90年代是参照系) 42:38 在时代的窗口期,进入中化集团做投资并购 43:24 先正达从被誉为“皇冠上的明珠”、不可触碰,到中国企业染指 50:26 海外企业对中国买家的态度变化 51:11 亲身参与430亿美元中国有史以来海外最大并购案 52:13 并购四阶段:战略-筛选目标-执行-整合 01:09:15 旷日持久的谈判、以年为计的整合 01:12:40 大时代的高潮与落幕 01:17:10 其他收并购代表案例,成与败 01:22:45 海外收并购热情高涨,为什么反观国内收并购文化贫瘠? 01:26:48 几个词形容这个特定的大时代 01:29:15 海外并购中好玩的:两套体系、白衣骑士、大忽悠 01:39:00 最后的建议

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 很多听众在后台留言,希望我们的播客也放出对金沙江主管合伙人朱啸虎的访谈,他在对于大模型的观点讲了一个中国现实主义的 AIGC 故事。那么今天你们要的 Allen Zhu 终于来了。

    访谈一共有两次,播客收录的是其中一次访谈。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:31 说实话,卷出200多个大模型有什么意义呢? 03:00 马上能变现!马上能变现! 08:02 AIGC PMF,你十个人找不到,投一百个人同样找不到 08:37 我都不愿意去聊,你知道吗?这没有意义——这些公司,要场景没场景,要数据没数据,你说它有什么价值?而且一上来估值这么贵 12:35 王慧文,我这么熟,我都不愿意去找他和他谈这个事 14:45 技术的人,都是不相信我比别人差的,你说这个怎么合并? 16:42 我跟王小川说过,如果没有反垄断,我愿意投王小川的 19:23 那个时候,大家就FOMO情绪比较高涨的时候 25:12 美国公司就:卧槽你们怎么做出来的?感觉很惊讶 31:40 短期内肯定做to B,起来快,to C要见到iPhone 3时刻 37:42 我跟张旭豪谈了三次:33这个数字对我不好,37是我的幸运数字 41:48 哎……就是……说实话一鸣确实很难判断 47:15 别烧钱,别烧钱,听我们话的都还可以

    《2024 AI 三部曲》合集:

    《对话月之暗面杨植麟:向延绵而未知的雪山前进》

    《朱啸虎讲了一个中国现实主义AIGC故事》

    《王小川想提出中国AGI第三种可能性》

    【更多信息】

    本集文字版本:腾讯新闻原文 & 作者的收藏夹

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天的嘉宾是百川智能创始人兼CEO王小川。

    大家可能注意到,我在3月写了三篇关于中国AI的报道,合称《2024 AI 三部曲》。在前两篇发布后,以杨植麟为代表的理想主义“技术信仰派”和以朱啸虎为代表的现实主义“市场信仰派”,双方观点引发广泛关注。而且,朱啸虎在报道中三次点名王小川和百川智能。

    几天以后,王小川接受了访谈。他试图阐释在技术和市场、理想和现实之外,中国AGI还有第三种可能性。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    02:00 对《朱啸虎讲了一个中国现实主义AIGC故事》的读后感

    04:15 我代表中国AGI的第三种声音:“理想上慢一步,落地上快三步”

    07:52 朱啸虎谈应用、应用,杨植麟谈技术、技术,我要谈的是TPF(Technology-Problem Fit,技术与行业现存问题相契合)

    10:01 我认为AGI的应用是在造人,是一种类人的新物种

    11:02 从2023年4月再创业百川智能的前因与思考(我想对生命做建模)

    19:00 我有洁癖,不想在淘宝买账号,要用自己的账号和IP去访问ChatGPT

    26:40 怎么看朱啸虎说:“你说这些创业公司有啥优势,有啥条件去做大模型?百川发布了给游戏的NPC,你有啥数据去训练游戏的NPC。大厂有大把、大把数据。我让一个公司去体验了一下,没看出任何区别。”

    27:56 我想构建的三座模型大楼、三个世界(娱乐、医疗、创造)

    32:21 我和朱啸虎在深创投活动上的见面聊天,他挺真实的

    35:13 发完第一版模型后去了一趟美国,提升了语言体系

    38:56 你怎么看之前外界总把你和王慧文(光年之外创始人)放在一起比较?

    43:19 过去一年多少次遇到过朱啸虎这样的投资人,他们可能拍着你的肩说,不是我跟你的关系不好,但是我就是不能投你?

    44:05 要投入成本追赶GPT-4吗?医生是一个“顶天立地”的场景

    46:53 百川智能的团队建设(240人+,为什么搜狗在浏览器、搜索不是第一,在大模型能干到第一?)

    47:49 蔚来创始人兼CEO李斌四五年前就预言,苹果造不出来车

    51:40 百川为什么既做to C又做to B?什么to B是做的、什么是不做的?

    53:05 什么是百川能做OpenAI不能做的?什么是百川能做的国内巨头不能做的?

    56:12 搜狗的经验对大模型创业的帮助、和它的不同,搜索是包袱吗?

    58:18 曾经在百度的阴影下、搜狗的绝境中如何突围(我们2011年遗憾错过了推荐)

    01:00:55 被边缘化的经历与对个人的影响

    01:03:18 低估技术和仰望技术都是不好的状态

    01:04:15 对2024年、2025年的预期:技术和瓶颈

    01:06:15 集中回应朱啸虎的n条质疑

    01:16:16 技术同事想做Sora,被我摁死在这了

    01:19:56 今年过完年,我放下了焦虑、摆脱了一味跟随GPT的惯性

    《2024 AI 三部曲》合集:

    《对话月之暗面杨植麟:向延绵而未知的雪山前进》

    《朱啸虎讲了一个中国现实主义AIGC故事》

    《王小川想提出中国AGI第三种可能性》

    【更多信息】

    本集文字版本:腾讯新闻原文 & 作者的收藏夹

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天的嘉宾是真格基金的戴雨森和季逸超。我们从开年AI届两件大事开始聊起:OpenAI发布Sora和Google推出开源模型Gemma。作为投资人和创业者,他们尽最大可能收集了各方的声音,试图搞清楚Sora在人才、算力和数据等各方面究竟是如何实现的。那么,这一期也是关于Sora的一幅信息拼图。同时,雨森是月之暗面和之前光年之外的天使投资人,所以我们也聊了聊国内的大模型生态及进展。

    关于中美大模型,在过去几个月里,我访谈了杨植麟、李广密、朱啸虎,你会发现我们对每一个人提出一些相似的问题,但从中得出了很多截然不同的答案。这正是大模型今天发展中有意思的地方,我接下来会持续关注通用人工智能,欢迎订阅我。如果大家有更多想要讨论的话题,可以在评论区告诉我。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

    03:25 从开年两件大事聊起:OpenAI发布Sora和Google推出开源模型Gemma

    08:03 我们试图通过找很多人聊拼凑一幅信息拼图

    08:25 Sora背后的人:Tim和Bill是伯克利师兄弟,Bill在Meta是谢赛宁的实习生,通用人工智能行业有很多渊源和师承

    12:24 为什么OpenAI能让一个95后Bill去担纲做这个事?体现出年轻组织的活力

    13:02 作为天使投资人如何绘制AI方向的人才地图?(北美AI四大名校)

    16:35 关注近期AI届一些人才流动:谢赛宁、何恺明回到学术界;OpenAI创始成员之一Andrej Karpathy离开OpenAI;蒋路从Google去了TikTok

    23:45 采样了很多人的观点以后,关于如何实现Sora,我们目前了解到的信息(模型规模/数据/实现路径)

    28:54 资金规模、算力规模等绝对数量级都不是遥不可及,所有头部大模型公司和大厂都能做,但1年赶上Sora也过于乐观

    34:37 Sora发布对当前大模型战局的影响(“把战争推到一个新的高度”)

    37:06 我们距离“世界模拟器”的真实距离

    46:22 AGI一大瓶颈:大一统模型尚且没有找到可行路径

    56:19 泡沫不可怕,泡沫会带来基建,为未来的应用打下基础,99%的公司死去、留下1%公司

    58:24 关于投资的思考:为什么投资月之暗面和光年之外?

    01:03:36 记得有一次和杨植麟吃饭,他说不希望以后大家提到他觉得是一个技术大牛,他希望是一个做出了很好产品的企业家

    01:06:05 大模型公司的出路问题

    01:14:27 AI应用出现的时间点可能比移动互联网要慢,因为它需要模型到达一定能力程度,才能从没用涌现成有用,但是当它一旦变得有用,扩散速度可能远快于移动互联网应用

    01:20:41 每一次OpenAI升级会带来VC投资的结构性调整吗?

    01:25:29 Google推出了开源模型,对于整个市场会有什么样的影响?

    01:28:06 AI越来越强悍,给人类一点建议吧

    01:31:43 雨森,你为什么喜欢发即刻?

    01:34:53 对于Sora至今不了解但是很想了解的地方

    【更多信息】

    联络我们:微博@张小珺-Benita,小红书@张小珺jùn

    更多信息欢迎关注公众号:张小珺

  • 今天的嘉宾是大模型公司月之暗面的创始人兼CEO杨植麟。

    杨植麟是去年成立的这批国产大模型公司创始人中,最年轻的一位,也是学术、工作履历和通用AI有最直接相关的一位。他毕业于清华和CMU,总计论文引用次数超过22000次。在人人喊PMF(产品/市场契合)、人人喊商业化的中国AI生态里,这位AI研究员出身的创始人倒不那么着急。

    国产大模型中,月之暗面是最坚定做to C、且只做to C的一家公司(于去年10月推出了智能助手Kimi),也是目前估值最高的一家中国大模型独角兽(投后估值超过25亿美元)。就在他们第三笔融资进行的过程中,我和杨植麟聊了聊他过去一年创业故事。

    这期节目由两次访谈组成。我们主要的访谈是在2024年1月完成,不过过年期间,OpenAI重磅发布Sora,所以我们又在2月补充了一次访谈。由于杨植麟有大模型创业者和AI科学家的两重身份,所以节目中包含了许多他对于AGI技术演进的关键技术判断。

    我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:51 站在巨大技术变革的开端:前面是延绵而未知的雪山 03:35 11年本科、17年收敛到大语言模型、和图灵得主合作论文:杨植麟的学术之路 06:36 为什么AGI需要新组织?为什么科研机构、巨头的AI lab无法产生伟大系统? 10:24 全球化+AGI+很大用户量的产品,最终可能是AGI的必要条件 11:07 我们不想做“中国的OpenAI”,但应该学习OpenAI的技术理想主义 13:15 我在Google学习到的最重要一课:从无限的雕花中把自己释放出来 16:25 作为博士怎么与图灵奖得主合作?和学术大佬合作与和资本大佬合作,哪个更难? 19:37 创业这一年时间轴:ChatGPT激活资本、人才变量,我在硅谷做了一笔精确计算 22:28 Timing很重要,第一笔融资的窗口很短,只有一个月 27:54 怎么搭建AGI团队?现在有80人 30:21 卡的问题有很多back and forth,接下来一两年不会成为很大瓶颈 32:13 为什么月之暗面做to C且只做to C?(long context与Kimi智能助手背后的技术产品思考) 37:39 你认可说“国产大模型公司去年追赶GPT-3.5,今年追赶GPT-4,没有本质差异”这种说法吗?——这句话是对的,但也是片面的 39:17 追赶GPT-4是国产大模型的必经之路,但也要做非共识的新维度 40:53 不认同2023年下半年大模型市场转冷的判断,我们下半年确实也完成了融资 42:57 登月第一步是长文本,第二步呢?接下来会有两个最重大的技术milestone 44:21 只有一个颠覆性的东西,才配得上AGI这三个字,否则我们今天说的都没意义 45:34 我对PMF、落地场景和应用的看法(“应用”不是个准确的词,听起来更像目的——应该既是手段、也是目的) 46:54 User的scaling和Model的scaling这两件事应该同时做,降维打击发生过太多次 48:54 为什么开源追不上闭源?现在开源的方式和以前不一样了,它本身还是中心化 49:48 AI不是这一两年找到什么PMF,而是未来十年二十年能做什么改变世界 51:48 怎么对抗国内的焦虑情绪?大模型创业中的长短期平衡——如果没有长期,你会错过整个时代 57:41 回顾2023年的曲折、变量和预料之外 60:30 怎么看几个市场上的几个观点(包括Yann LeCun、Geoffrey Hinton、陆奇) 62:25 现在的大模型公司配比:一半实验室,一半商业公司 64:20 怎么看大模型创业公司和巨头的关系68:05 以上是对杨植麟的第一次访谈,接下来是过完年后的第二次。这次我们重点聊了OpenAI重磅发布Sora的技术观点和对2024年的全球大模型产业预测 68:24 Sora有多少在你的意料之中,多少在你的意料之外? 69:17 Sora解决掉的技术问题:能在一个比较长的时间窗口保持生成的一致性 69:40 Sora对于全球产业格局意义是什么?2024年大模型会有哪些新叙事? 71:57 视频生成之前的关键技术瓶颈,更unified architecture(统一的架构)仍然没有被解决 73:04 解读OpenAI关于Sora报告:《Video generation models as world simulators》 74:30 怎么看Yann LeCun对生成式AI的新观点(“通过生成像素对世界进行建模是一种浪费,并且注定会失败”) 77:45 Sora是视频生成的GPT-3.5时刻 78:37 为什么不同模态放在同一个模型里那么难?Sora + GPT会出现什么? 80:40 两个世界差得越来越远了吗? 83:41 2024年的全球大模型产业预测

    【更多信息】

    本集文字版本:腾讯新闻原文 & 作者的收藏夹

    联络我们:微博@张小珺-Benita

    更多信息欢迎关注公众号:张小珺

  • 趁着吴晓波老师出版《茅台传》,和他聊了聊中国企业家近百年小史。

    他曾在将中国企业家群体描述为是“一个下落不明的阶层”,“被长期漠视甚至妖魔化的阶层”。随着改革开放,这个群体从被遮蔽的历史中转折,跨越农民、城市边缘人士、知识分子下海的一波又一波浪潮,直到PC和移动互联网两波巨浪,把中国企业家推至世界舞台中央。如今,中国企业家来到改革开放以后第六代。

    这集节目,我们梳理了中国过去五波商业浪潮、推动者及其特征,吴老师也聊到他对当下这波创业者的观察。他称,第六波“是最奇怪的一波”。

    我们似乎一脚迈入保守年代。如果果真像他所说,未来可能没有大生意,我们的商业文明如何延续?年轻人又该怎么过好一生?这波年轻人恰好是吴晓波的女儿及其同代人的命运,他心有戚戚。

    03:09 说真的,我已经算不清楚我见过多少企业家了 04:38 茅台是中国企业史一家特殊的公司,季克良(原董事长)是“匠人型企业家” 10:08 未来中国创业者就是两条路,如果能结合在一起,你就牛了 13:22 纵观100年中国现代商业史,细数中国企业家的代际和关键年份 16:21 今天是第六波创业者,是最奇怪的一波(高速发展结束了、市场充分饱和、这一世代是有产阶级的孩子) 17:22 过去五个代际的企业家的不同特征:最容易出大家伙的?最血腥的? 20:01 在革命叙事年代,企业家是保守力量,曾经是“被遗忘的群体” 23:42 美国企业家的群体性人格 vs 中国企业家的群体型人格 27:15 互联网企业家是革命性一代,财富创造和资源获取不再从政府获得 29:20 我们进入到保守主义时期,未来中国做企业学腾讯挺难,学茅台相对容易一点 29:51 如果企业家精神没了,国家就不进步了 30:50 采访了那么多不同代际的企业家,最有心灵共鸣的是哪一代? 31:57 对当下的看法:AI是工具,有很强平台性、通吃性,不会带来所有人的创业机会 33:54 未来可能没有大生意了,大量人就满足做一个小生意 34:17 关于《你吃你的苦,我吃我的苦》这篇文章:“我有可能就是我女儿的苦” 37:57 怎么看新闻一则:章泽天净资产600亿冲上热搜第一,排在清华优秀校友第三(口误:张一鸣出生于83年) 38:38 给我女儿和她的同代人一些建议:不要再去幻想,不要再去讨好人家了

    【更多信息】

    本集首发于腾讯新闻,点击前往音频版

    联络我们:微博@张小珺-Benita

    更多信息欢迎关注公众号:张小珺

  • 前段时间身边人很多人追完了王家卫的电视剧《繁花》,讨论热烈。我邀请上海财经大学副教授梁捷老师来聊聊。他是上海人,又是经济学者,我们从local和财经的双重视角,看真实版上世纪90年代上海的时代风貌与股市风云。

    这集节目,不仅有经济学者对剧中角色与交易的专业解析,复盘历史上第一场兼并收购案“宝延风波”,还延展了中国股市在同时代更多惊心动魄的故事。

    01:39 《繁花》:王家卫的电视剧和金宇澄的小说是两部作品 04:16 作为上海人,我关于上世纪90年代与黄河路的记忆:鱼龙混杂、高深莫测 07:55 黄河路特殊的地理位置,让它“进可攻、退可守” 11:56 恢复上海证券交易所的真实故事,最开始只有八只股票,一切处于混沌中 17:35 上世纪90年代中国股市的特征与局限性 19:39 剧中人物宝总的身世与入股市动机,真实性如何? 30:50 专业解析:阿宝抄底A先生、强总收购与反收购(历史上第一场兼并收购案,剧中叫“宝瀛大战”,原型是“宝延风波”) 37:50 90年代,中国股市中几起惊心动魄的故事 42:25 “宝总们”体现的90年代关于炒股与财富的时代风貌 50:10 剧中大大小小的人物:A先生、强总、爷叔、邮票李 53:40 《繁花》开拍前,我受邀去剧组,对方希望还原90年代K线图 01:01:25 时代逝去,繁花落尽,令人唏嘘 01:09:25 《繁花》意外地让不同代际的上海人开始重新对话

    【更多信息】

    本集首发于腾讯新闻,点击前往音频版

    联络我们:微博@张小珺-Benita

    更多信息欢迎关注公众号:张小珺

  • 本集话题是近期很火的中国消费品牌全球化的案例:名创优品(MNSO)。嘉宾是我的朋友、财经作家沈帅波。我得知他正在写一本关于名创的书,所以把他拉过来先跟大家聊聊。拼多多、名创优品崛起,是消费降级的胜利吗?名创这家在美国开了100家店的中国公司,是如何迈出国门的?

    01:31 沈帅波自我介绍 02:00 爆文《藏在县城的万亿生意》的创作与调研方法 27:47 为什么开始深入调研名创优品?零售业没有虹吸效益,靠的是吃苦耐劳 36:16 中国企业出海的三阶段,各有千秋 43:30 创始人叶国富其人 50:51 消费品打造超级IP背后的零售业趋势 54:10 名创优品从单店店型跑通到全球化扩张的阶段总结 01:07:06 中国公司全球化要告别一夜暴富的心态 01:09:33 全球各地不同人群的消费习惯洞察(不爱挣钱地方的人爱买娃娃) 01:18:28 怎么看 Manner咖啡/RELX悦刻/元气森林/完美日记等中国新消费品牌?怎么看完美日记的衰落 01:21:00 消费理性化、分层分级化是趋势 01:25:17 欧美奢侈品本质是皇室东西的平民化,而不是高端化的产物

    【更多信息】

    本集首发于腾讯新闻,点击前往音频版

    联络我们:微博@张小珺-Benita

    更多信息欢迎关注公众号:张小珺