Эпизоды

  • 2026 的上半年,中国资本市场围绕具身进行了大规模的布局,将具身大脑这个赛道推向了前所未有的热度。

    这期的嘉宾灵初智能,刚刚登顶了摩根士丹利最新发布的《全球人形机器人研报》,它被视作中国具身大脑阵营的核心代表之一。从灵巧操作出发,这条大脑路线直指智能的上限。

    创始人王启斌是 70 后产品背景,乔治华盛顿大学博士,完整经历了"智能设备 → 移动机器人 → 具身智能”的三次范式更迭。

    我们的访谈不仅涉及到大量具身行业的真实进展,也描绘了在具身这个早期行业中,从研发(R)到工程(D)到产品(P),所谓 RDP 的全流程。

    2024 年,70 后王启斌,和80 后算法老兵柴晓杰、 90 后北大学者杨耀东、00 后天才少年陈源培,组成了灵初智能这支具身“7890 战队”,成为这个行业背景最豪华的团队之一。

    (本期访谈的视频版已经登录 B 站、视频号、微博、小红书、Youtube 等平台,欢迎前往观看~,文字版可前往公众号「卫诗婕 漫谈 Light the Star」)

    本期嘉宾:王启斌(Viktor)· 灵初智能创始人本期 Shownotes:Part 1. 00:00-08:56 让机器人「动手」,为什么是皇冠级的大脑问题?

    灵初是谁?

    被摩根士丹利视作中国大脑核心代表,灵初是谁?

    Hugging Face 上 1000 小时多模态数据集下载量第一

    希腊字母第 23 个 Psi(Ψ),意指强化学习,「像孩子一样在环境中交互、逐渐长大」

    为什么做大脑的公司普遍估值更高?

    什么是通用灵巧操作?为什么说人类操作数据是一座富矿?

    操作的三种能力:对任务做长程语义分解(规划)、手眼协同、实时纠错
    人类能力的演进顺序:行动最早(灵长类)、视觉次之(寒武纪)、语言最晚——而机器恰好相反
    机器人不一定像人类那样大脑/小脑严格分开,目前没有完美的大小脑结构能拟合类人能力
    夹爪很难做类人复杂操作
    操作知识不具备可传承性——如何把人类经验挖出来变成可训练的数据,是具身要回答的根本问题

    Part 2. 08:56-20:04 Why now:具身浪潮,周期与淘汰赛

    2026,具身为什么更热了?

    「新的浪来了」:过去几波范式不会持续这么长
    why now 的底层:具身是真正回到物理世界的问题

    具身的市场,只会比智驾更大:上一波公司的顶点,可能是下一代公司的起点

    跑完一个 cycle 约 7 年:至少会有三轮淘汰赛

    关于王启斌:黑莓vs苹果,一个产品老将经历的范式更迭

    黑莓曾是全球唯一净利率 25%+ 的公司(另一家是苹果)

    从苹果开始,ToB/ToC 没有绝对分割

    什么是苹果真正的胜负手?

    新世界物种对旧世界的降维打击,是如何发生的?

    「站在旧世界的人不用 complain,这就是宿命。」

    「当年带 Sonos 全球 CEO 见百度陆奇,是我的心结」

    什么样的 ToC 产品能击穿 ToB?苹果做到了。具身领域有机会吗?

    20:04 中美硬件之争,穿越周期的产品经理,与审美

    审美的物质基础:Jony Ive 的设计传统在英国,小米设计领导人传统在德国,消费电子审美在欧洲
    Sonos 和 B&O ——两种产品哲学
    小米生态链/IoT 兴起(2015)后,中国消费电子工业设计的崛起&底层:从整机到核心零部件的全链路掌控 + 快速迭代

    Part 3. 中美硬件之争,两代机器人公司,谁会赢?

    「美国大脑领先、中国硬件领先」,人们只看到了轨迹的起点

    为什么从泛化性居中、节拍较低的物流和服务业 toB 切入

    5 年内「只做模型不做硬件」是伪命题——具身现处于软硬深度耦合阶段

    落地两种形态:固定上半身、可移动+上半身——两种构型,训同一个模型

    具身的数据飞轮和车完全不同——车有存量市场,具身去年头部出货才 5000 台,飞轮必须靠人类数据冷启动

    上一代自动化机器人 vs 具身新秀派,谁会赢?

    上一代移动机器人靠 SLAM(2015 前后)和基于规则的技术,深耕单一场景;当下具身解决更复杂的操作问题,用 learning base 的学习范式,人才完全不同

    三个顶层问题:解决什么问题、用什么技术路线、什么样的人才;

    创新者诅咒:成熟公司有自己的场景循环,可能恰恰是负担

    仓储物流、无人配送领域,全是创业公司赢了(海柔、极智嘉、新石器)——阿里、美团、京东,为什么都落后了?

    「原来真的是书上得来终觉浅……谁有场景谁赢,是个错误。」

    Part 4. 灵初的成立:7890 战队 & 科学家创业潮

    横跨中美,花半年时间找科学家: 国内能做灵巧操作的不超过 10 人

    如何判断科学家是否适合一起创业?

    在斯坦福李飞飞实验室的 00 后联创:强化学习,将人类数据迁移到灵巧操作的 Sim2Real

    「7890 战队」:为什么具身需要的人才跨度大?跨代际和领域的融合难度?

    怎样治理一个软硬数据耦合的复杂组织?

    为什么「量产那套」不完全适用于具身大脑研发?

    AI 时代,为什么强调「治理」而非「管理」?

    硬件派 vs 模型派的路线分野:从硬件出发(做到稳定便宜规模化,特斯拉思路)vs 从模型和数据出发(用优质数据训模型,灵初思路)

    Part 5. 01:01:06 具身数据的真问题,与中国的另一种叙事

    可规模化预训练的优质数据长什么样?数据管线怎么做?

    算力、数据手套与数据飞轮:灵初的真实数据方法论

    什么是检验真做大脑 or 水货大脑公司的金线?

    数据洞察:手的 3D 关节角精确度 > 触觉 > 2D 照片;

    全模态数据,比纯第一人称视频更精确丰富

    行业最大的10 万小时手部多模态数据怎么来?

    数据管线 = 数据处理平台(审核、标注、处理)+ 进训练框架训模型 + 模型反馈 +抽象出数据洞察

    具身数据乱象:已经出现一些空置的数采场

    没有模型需求方牵引,数据采集一定是无序、低效、垃圾场级别的

    只有真正在训模型的大脑公司,才有资格定义「需要什么数据」、才能分辨「什么是 garbage」;

    「投资人最后看的是这道菜到底怎么样,他并不知道这道菜里头真正用了多少调料。」

    具身大脑看美国?中国有机会做出好大脑吗?

    中美数据成本差约 10 倍,低成本 + 多样性是中国的机会

    关于派(Pi):证明了真实数据在夹爪上能泛化,验证了真实数据路线

    现在远没到具身的「ChatGPT 3.5 时刻」:非结构化环境的通用还很漫长,但「专注一个 domain 」的通用是可以做出来的
    灵初的双模型架构:R 是策略模型(输入图像/语言/本体状态,生成动作);W0 是世界模型(像真实世界仿真器,评估动作后的状态,用强化学习优化、放入约 30% 纠错失误数据),两个模型串成闭环,再回流生成新数据集
    主流架构(Transformer)能不能成为绝对垄断架构,还需数据验证——Transformer 是在 GPT-3.5 之后吃掉巨量数据、加上强化学习才被验证的;具身底层架构的有效性,同样要靠足够的数据来验证

    Part 6. 01:22:54 「游戏才刚刚开始,第一轮淘汰赛都还未开始。」

    具身大脑公司,怎么做?

    大模型&后训练人才:创业公司怎么和大厂抢人?

    最难的事怎么解决?——「没有失败过的成功,是不可信的」

    为什么拒绝把灵初定位为一家「AGI 公司」?

    通用灵巧操作是技术通货:「未来我们甚至可以不做机器人」

    AI 时代的产品经理有三个圈——懂技术、懂 UI(用户交互)、有商业思维

    从 R(research),到 D(Development),到 P(Product)——如何在一个大组里快速迭代?

    选场景必须同时满足两个条件:有真正商业价值的共性痛点(应用面广)、且符合数据泛化性需求

    进工厂的事故责任:作为供应商有协议要负责,高节拍流水线很难,流水线下的供料等场景可跑通;

    「具身这个行业早已被客户簇拥」

    「曲线已开始跑但还没到真正拐点」「今年底是模型泛化性的第一个验证阶段」

    基于数据量的模型迭代军备竞赛已开始,周期 3 年以上
    「百万小时数据是我们最早提的,现在所有人都这么说时反而要警惕」

    Part 7. 01:53:30 一个 70 后创业者的务实 & 浪漫

    创业是冲浪还是西西弗斯:不存在"走到某阶段就彻底释放",过程本身才最重要

    「某天清晨阳光斜照在 logo 墙上的一瞬间」

    真正的中年危机:40 岁时,最怕未来与自己无关

    「我最讨厌被叫老板」

    我强烈推荐你去读摩根·豪泽尔的《Same as Ever》

    创始人的基因(vision/mission/经历)真正决定了公司的路径

    DeepMind 哈萨比斯押注 AlphaGo 做出世界级成果,却 miss 了大语言模型;OpenAI 以"安全/非营利"起家,最后一批人出走创立 Anthropic——同一场 AI 史诗里有各种活法

    加入听友群⬇️

    如果你是具身领域的专业 researcher ,欢迎添加主播微信(SJ_Jelyne).


    在小宇宙查看该单集文稿
  • 回看历史,人类信息化的每一次范式转移,都有着相似的规律。移动互联网时代的真正到来,并不是因为第一代智能手机的组装下线,而是因为 iOS 和安卓生态的建立、云基础设施的普及,才让千千万万的独立开发者能够以极低的成本创造出改变世界的应用。

    开发者成群涌现的前夜,往往是奇点到来的钟声。

    今天的嘉宾,正是为这场范式革命加速的具身基建创业者。地瓜机器人的基础设施研发负责人秦玉森,以及阿里云无影事业部总经理张献涛博士。

    秦玉森有着 20 多年的机器人开发经验,也是一名成熟的技术管理者 。在这一轮具身革命中,他与地瓜机器人,致力于打造机器人行业的母生态。

    张献涛博士则亲历了移动互联网时代,云生态的建立。这期节目中,他清晰地讲述了,云计算,将如何成为撬动整个具身商业社会的超级杠杆。

    这期内容不仅包含大量机器人的硬核技术,更是一部关于技术、人才以及基建变迁的微观商业史。

    本期嘉宾:

    秦玉森 - 地瓜机器人的基础设施研发负责人

    张献涛 - 阿里云无影事业部总经理

    本期 Shownotes:

    Part 1 . 03:06 机器人之梦

    2000 年前后的机器人竞赛

    九号收购赛格威机器人之后

    北有九号,南有大疆

    Part 2. 11:04 工程师的黄金年代

    工程师的职业发展启示 & 工程师如何改变世界

    技术管理挑战:《人月神话》

    从工程师到架构师:认知从线性变立体

    Part 3. 22:18 拐点已至:机器人爆发前夜

    何为「战略节奏」:需求牵引出结构洞

    自动驾驶与具身的人才大战:两个行业的前世今生

    大模型降低工程师门槛,晶体智力 & 流体智力

    实干家、具身三大派创业与各自的职责

    机器人的美在于不完美

    Part 4. 35:25 AI 时代的第三朵云:打造机器人的母生态

    过去,机器人开发有多难:从重装电脑开始

    中国STEM教育领先,小学生玩机器人很常见

    什么是机器人的空气、土壤和水?

    具身的「重复造轮子」:资源饱和溢出

    为什么 Infra 人才特别稀缺?

    Part 5. 51:27 具身智能融资战 & 场景之战

    资本泡沫可以让这个行业快速试错和试对

    共识会极速形成

    2025 每月的技术进步,快于过去的每一年

    工程师培养,从 8 年压缩到3 年

    年轻人脑子里的噪音更少,跑得更快

    Part 6. 01:10:41 云的变迁

    从云计算,到终端智能云计算

    阿里云往事:All in 无线,关键一役

    机器人时代的第三朵云,长什么样?

    Part 7. 01:24:02 AI 时代,云架构重构,Agent 与阿里的 TokenHub

    什么是 Token 经济?阿里巴巴为什么要组建 Token Hub?

    云上输出 token,独立开发者可推动浪潮

    当 token 资源不再稀缺,大模型时代爆发期也将过去

    Agent 加速机器人自进化,机器人在「做梦中」实现进化

    养虾是养一群虾:必须是智能体群协作

    Part 8. 前夜:开发者爆发、AI 原生代与利他生态

    技术、终端和开发者工具的普惠体系

    加入听友群⬇️


    在小宇宙查看该单集文稿
  • Пропущенные эпизоды?

    Нажмите здесь, чтобы обновить ленту.

  • 这是一期5·20特别节目,嘉宾是前不久举办的小红书黑客松大赛的硬件组冠军得主:一对用 AI Coding 和动手能力,实现了用意念控制轮椅的年轻夫妇。

    2020年10月,肥牛在婚礼的答谢宴期间出现放射性剧痛,之后被确诊为脊髓占位,一种极其少见的脊髓肿瘤。在这之后,他经历了两次手术,并在第二次手术后出现瘫痪症状。

    他说,

    「人在一定程度的痛苦之下,那个痛苦是压制不住的;」「当时如果说给我一个按键,左边是生,右边是死,我已经按了很多次死的这个按键了」

    经历了六年多的康复,肥牛通过坚持运动恢复了一定的行动能力,目前可以短距离行走,长时间仍需依赖轮椅。

    从自身和脊髓受损人群的需求出发,他们与一群AI,合作实现了用脑机信号指挥轮椅前进的创意和demo。这个项目,成为黑客松大赛当晚,获得最多掌声的项目。

    我在黑客松的第二天,与香菇肥牛夫妇录制了这一期播客。这是一个浓缩了太多生命力的故事:勇气、希望、爱情,以及 AI 时代最小单位能够实现的创新,还有,技术的温度。希望你喜欢~

    本期嘉宾:

    肥牛(轮椅男主,脊髓损伤康复者,自媒体博主「肥牛在康复」&「肥牛卷不动」

    香菇(元气女主,纯爱战神)

    本期 Shownotes:Part 1. 噩耗,战神,与「种一棵树」

    05:56「我们一起在种树,种的小树就是我们的情感,它慢慢发芽,其实它也是独立的」

    06:55 按下「死的按键」——瘫痪后的玄学慰藉、第二代版本的人生

    失能群体的标准路径:找医生 → 找玄学 → 容易被骗

    社会基础设施的缺位——医学走到尽头时,玄学是必经站,骗子的密度也最高

    两次手术:医生 30 年未见的罕见病

    深夜高速路上的「遗言」:「看到她害怕,我也不敢说了」

    「我们先学会了告别」

    Part 2. 「缩短我与魔法之间的距离!」

    21:49对标蔡磊先生的渐冻症管线开发:我想做「脊髓损伤管线开发」

    脊髓损伤群体在中国约有三四百万,但医院康复科没有专门科室

    产品匮乏:大小便恢复训练,用的是产后孕妈妈修复器械

    "我无法原谅你们,我要永远拉黑你们"

    无障碍科技往往由无障碍人士自己做:需求足够痛、对世界的改造欲和创造欲都更强

    27:21 产品经理 + AI 调度师:一群 AI 在背后,我们就是千军万马

    两个人+ 两台电脑 + 6 个 AI + 对应 agent:24 小时超预期实现 idea!

    没参赛的备选项目:会唱歌的尿壶(背后也是一个感人故事)

    AI 时代的最小创新单位:创新门槛与成本的下降

    真痛点产品的特征:「从经历中长出来」

    31:55 善用 AI 等于管理 AI——把自己当公司,AI 当员工

    不同 AI 的「AI 格」:Gemini 是"用爱训练出来的小孩"(脑电波被画成爱心形状),Claude 理智但极其傲娇(听不了一点坏话)

    员工管理的四要素:了解特长、了解边界、合理分配、按贡献给待遇(充会员 vs 不充)

    Agent 像乐高:写代码、PPT 渲染、3D 模型修改各有分工,按工作流排序就能跑

    「用得好 AI 的那一拨人,画像是创过业、当过老板、当过 leader——他们更善于拆解任务和分配」

    在所有人都「用 AI」的时代,差距来自把自己定位为「AI 调度师」而非「使用者」

    42:47 把判断权拿回手里——人的能力上限是 AI 的下限

    核心原则:「你一旦发现 AI 不好用,那一定不是 AI 的问题,那是你的问题」

    医生说没救就一定没救吗?自己去查案例、判断概率、问「我能不能成为那个少数派?」

    学习的本质不是吸收知识,是创造「思辨能力」

    AI 的天花板在用户:「它没有身体经历过一次尿失禁、一次瘫痪、一次绝望——这些是 AI 永远无法替代的」

    AI 时代的稀缺资源不是技术深度,是「跨学科架构能力」 + 「判断权」

    AI 只能复现人类已有的智力,不能复制人的第一手经验——用 AI 的天花板取决于你自己经历过、消化过、能拆解清楚的认知厚度

    Part 3. 意念轮椅夺冠,马斯克式的天才创新!

    49:34 脑机接口的真相——硬件不重要,数据解读体系才是

    肥牛 2021 年瘫痪时就在论文里跟踪脑机研究——比马斯克植入第一个患者还早

    柔性电极的类比:就是一块脑信号"硬盘"——大有大的好处、小有小的特点,本质是采集传感器

    脑内 vs 脑外:脑内一手数据,脑外有屏蔽损耗,但没人能给出"脑外比脑内差多少"的精确百分比

    "在学术体系里,他们都是在蒙的"——各家脑科学公司有自己的解读体系,1+1 在不同体系里可以等于 4 或 6

    脑机的真正壁垒不是电极,是"谁先建成完整的语义系统"

    学术体系想做的是"全语义解构"(把每个脑信号翻译成意念);产品工程师想做的是"在不解构的前提下让它有用"——两套完全不同的目标函数

    57:29 天才级解法——抓两个数据包做差,绕开"翻译意念"的难题

    不追求"精确翻译每一次意念",而是抓两个脑波数据包做差

    A 数据包 - B 数据包 = 差异向量,把这个向量定义为指令

    工程问题的马斯克式破局:与其翻译每个细节,不如重新定义"什么算可用"——从"科学家解构思维"切换到"产品工程师思维"

    脑控的杀手级场景是"声控和动作识别都失效"的瞬间——情绪的微表情、看不见的兴奋、不便说话的环境——这些才是脑机接口的不可替代价值

    Part 4. AI 、社区、创新浓度与长坡厚雪

    01:08:46 小红书黑客松现场——王座轮椅、夏大哥、年轻 vs 年长、生命力…

    现场加了 100+ 微信,几千公里赶来的选手"天才级想法"扎堆

    获奖后展示:希望未来轮椅用户"都坐在王座上"

    「隔壁的夏大哥(嵌入式开发资深选手)凌晨 3-4 点还在帮忙搭小车」

    评价社区氛围的标准:"让人感受好的个体是不是足够多"

    创新的浓度比技术深度更重要——把人放在足够浓度的氛围里,原本不期待的事就会发生

    年长开发者的稀缺价值是「穿透型筛选」 + 利他主义——他们筛选合作者的维度更立体(思维架构、解构能力、人品),而不是「会不会写代码」

    01:18:13 Built by Public + Build in Public——AI 时代创新的两个特征

    黑客松把上下游全聚集——媒体 + 投资人 + 同行 + 选手,是一个 match 工厂
    加完微信里有 20-30% 是投资人,剩下是技术顾问 + 媒体——"一般商业路演也不过如此"

    AI 时代创新范式的两个切换:
    - Built by Public——需求来自一个普适的、痛感强的小众群体
    - Build in Public——Day 1 demo 做出来就直接面对公众,用户反馈成为产品迭代的一部分

    公众既是需求源、也是验证者、合伙人、放大器

    平台的真正价值不是工具或流量,是"创新浓度的密度场"

    01:26:18 make things happen,happen 的速度比以往任何一个时代都要快

    01:28:14 这棵小树——爱与生命力、此刻就是最幸福

    (诗婕觉得:)外人觉得是香菇更勇敢,其实是肥牛

    高大的人格才能种出这棵小树

    18 岁感受不到青春:"我们当时就会觉得啊这个时间好快乐呀"

    痛苦和快乐共存的能力是「经历过生死」的觉知

    祝大家节日快乐,收获爱与勇敢~✨

    加入听友群⬇️


    在小宇宙查看该单集文稿
  • 3月中,受到SAP思爱普的邀请,我在SAP全球运营峰会上主持了一场有关具身智能的圆桌论坛。

    SAP是企业应用和商业AI方向的全球领导者,这家世界五百强公司的业务横跨190多个国家,在100多个地区拥有创新与研发中心,它的客户创造了全球84%的贸易。

    这样一家巨型企业,在AI浪潮下,站得足够高,也成为了横向观察各行各业AI化转型的绝佳窗口。

    简单来说,SAP深耕的数字化解决方案,与AI结合后,能够为企业打造一个业务感知型的AI底座——将数据、业务理解借由AI Agent 打通,成为AI落地企业所必备的商业大脑——而这样一个了解企业的大脑,还需要一个具身的本体,才能够真正将数字世界的智能,影响至物理世界,为制造业创造更多实际的价值。

    因此,具身智能,就成为了这家数字化企业赋能全产业的绝佳切口。

    这其中,一个相当重要的问题是,每个企业都渴望拥抱AI,但,是否每一家企业都具备了直接拥抱的条件?

    答案就藏在这场众星云集的具身圆桌中。

    本期播客由两部分组成:第一部分是我主持的圆桌实录;第二部分,则是我将四家具身企业单独留下,录制的闭门访谈部分,预告一下,非常精彩。

    本期嘉宾:

    Robin郑锡亮 - ABB(全球机器人四大家族之一),中国区软件及数字化负责人。

    Ryan 王琪 - 拓斯达(国产工业机器人翘楚) ,具身智能业务线矩阵智拓CMO

    Peter 谢一鹏 - 宇树工业场景解决方案负责人

    William王浩然 - 星动纪元,亚太地区和中东负责人

    徐勐 - SAP大中华地区客户咨询团队总经理

    南立新 - 创业邦创始人&CEO

    本期 Shownotes:Part 1.圆桌实录:企业拥抱 AI 转型,真的都准备好了吗?

    08:12 机器人四大家族 ABB 的转型之路

    11:11 工业翘楚拓斯达,全球化扩张背后

    15:04 宇树与星动纪元:井喷的具身公司,差异化在哪?

    20:05 SAP 给企业打造的 AI 接口与数字化底座,是什么?

    22:39 企业级 AI 的需求:执行、开放、非绑定和安全

    26:35 融资热到发烫:超520亿资金、超500起融资,但行业仍处于 POC 小批量验证阶段

    29:04 刺激的快问快答:有关具身行业,最犀利的几个问题!

    Part 2. 闭门部分:把四家具身老板拉进小黑屋- 行业真正面对哪些真问题?

    40:19 什么是好场景?怎样真正击穿?

    43:03 宇树要做 toB 了?来讲讲工业地图……

    宇树 2025 交付 6000 +台人形机器人,今年目标 2 - 3万台

    49:24 新秀想超车?激烈竞争下,切入场景、优先级怎么选?

    54:40 训练的指数级成本提升 & 规模上量背后的真实挑战

    58:57 具身必将洗牌,行业寒冬马上到来?

    01:08:17 工业必定走在家庭场景前面?

    01:13:28 从机器人 50 年史,看人形机器人发展:具身仍在百家争鸣

    工业机器人发展50年,中国每万名工人配500台,进度约30 - 40%,人形机器人刚起步

    01:24:31 拓斯达掏箱底式分享:人形机器人应用,蓝海在哪?

    01:26:40 具身机器人的大规模爆发,还有多远?

    01:28:07 家用人性机器人爆发时间点预测:赌一瓶茅台 😄

    01:33:00 什么是 AI 时代的底层应用的现代化?

    加入听友群⬇️:


    在小宇宙查看该单集文稿
  • 过去三年,人们的目光聚焦在语言模型,但当下,物理AI正在被热议。这其中,VLA(Vision-Language-Action)和世界模型(World Model)这两个技术方向极具潜力又充满争议。

    今天邀请到的嘉宾,是小米的具身基座大模型负责人陈龙。陈龙博士是90后,是全球最早将VLA与智能驾驶融合的顶尖科学家。加入小米后,他正试图将车与机器人打通,打造一种 AI 学习的新范式。

    很喜欢这一期,其中既有大量硬核的信息量,也有技术的初心、烟火气和浪漫想象。

    点一些核心的独家信息(普通人看完访谈也能理解):

    1.第一视角还原小米智驾最前沿的一手信息:业界首个融合智能驾驶+机器人任务的Mimo Embodied具身大脑框架、XLA潜空间推理的技术细节…
    2.还原了自动驾驶从“三段式➡️两段式➡️VLA➡️XLA”的完整路径,明确了智驾和具身的融合路线,1+1 大于 2
    3.小米智驾梦之队+小米 90  后 AI 当家团队的工作日常(包括陈龙博士与罗福莉的合作等)
    4.关于 VLA、世界模型的路线之争,以及具身的 Scaling Law 时刻

    (本期内容的视频版,欢迎前往微博、b站、小红书、视频号、Youtube等平台观看。)

    本期嘉宾:陈龙(小米智驾负责人、具身基座大模型负责人)本期 Shownotes:

    02:00 CV是计算机与真实世界的接

    05:36 训练神经网络,小规模的Scaling Law

    06:19 自动驾驶的三阶段

    09:56 从规则算法到数据学习

    11:05 《苦涩的教训》

    19:29 雷军亲自面试了我

    22:14 LLM 加速了自动驾驶

    24:15 从端到端,到 VLA,是认知的改变

    27:47 伦敦生活

    30:24 小米智驾梦之队

    34:04 小米的90后 AI 当家们

    46:05 世界模型与 VLA

    51:14 打通机器人与车的智能,训练具身基座大模型

    57:55 语言是最高效的吗?

    01:00:47 从VLA,到XLA

    01:14:00 具身的Scaling Law,与物理AI

    01:25:19 智驾与具身的人才大战

    加入听友群👇


    在小宇宙查看该单集文稿
  • 成立于2011年的群核科技在走过15个创业年头后,在4月17日于港交所成功上市了。

    这是一个中国合伙人式的故事:三个联合创始人是美国伊利诺伊大学的校友,其中,董事长黄晓煌和CEO陈航,在浙大竺可桢学院时期就是本科时期的室友。

    在 GPU 算力尚未被大众熟知的年代,三位创始人就凭借着对计算技术的热爱和执着,发现了 GPU 集群可以极大地加速物理渲染,因此打造出渲染引擎——一个拿着技术找应用、拿着锤子找钉子的典型创业范本。

    我在去年8月份与黄晓煌进行了一场访谈。这个故事中,最打动我的,是回报,总是发生在那些不计结果的好奇心与热爱之后。

    长达10年的时间,群核在最不性感、最难数字化的家装与房地产领域死磕十年,把每一个室内空间的物理参数、材质精准地搬进数字世界。最终打造出空间设计行业的SaaS工具「酷家乐」——但也正因为这样「扎实而沉闷」的积累,让他们在 AI 时代突然发现,自己坐拥了一座关于物理世界规律的「数据金矿」。

    事实上,这家公司早从2021年起,就开始了从 SaaS 公司向 AI 公司转型的布局,比 ChatGPT 的爆发还要早一年多。今天,群核成为了具身机器人公司、以及许多训练多模态、世界模型大厂的重要数据提供商。数据之外,这家公司也正在开放底层空间智能能力,推动AI对物理世界的理解、推理和交互。

    我们的访谈还原了一家创业15年的硬科技公司,多次转型的全过程。

    (欢迎前往B站、微博、视频号等平台观看本次访谈的视频版~)

    本期嘉宾: 黄晓煌(群核科技联合创始人 & 董事长)本期Shownotes:03:15 杭州六小龙,群核的主轴线,与它的 AI 转型「那个年代大家可能看不太懂我们」开源数据集 InteriorNet:埋下 AI 的种子「AI 好像是到了一个新的阶段了」「我的数据集居然真的有用!」认知的改变:数据越多效果越好,GPU集群要做大转型AI公司:不叫换血,叫升级流程式部队 vs 创新部队10:13 转型之痛:尽早选择同路人志同道合的一起往前,如果不是志同道合的,也别拖蹭热点不可耻,但要给社会创造价值不会有平白无故的热点,顺势而为对 SaaS 行业来说,按Token计费,是巨大的启示「你能长期坚持的东西,就不用怕别人怎么样」「老板怎么又开始蹭热点了? AI 跟你啥关系?」「眼角是有泪光吗?」「经历过好几波了,现在遇到类似的事情也心如止水」有员工跑进办公室表达不满,「我就倾听」21:14 变化本身,是硬科技企业的本质时代一直在变,什么是可以复用的?群核DNA:简单,专注,开放群核有利润,用利润在做研发25:11 空间智能:李飞飞喊出的概念,恰好诠释了群核在做的事2018 年埋下空间智能的线索:空间的理解、推理、生成、行动机器人与机器人之间,看到的世界是不一样的「如果 chatgpt 没有来的话,浪就没有来」「也许会有别的浪」GPU卖多卖少,是最难的决策GPU 的用量与需求量,怎么测算?「我们想给所有类型的机器人公司提供服务」大语言模型开启了一个新的大门:数据越多越智能物理 AI 的数据是更难获取的42:51 全球的世界模型潮:英伟达、谷歌、Meta、腾讯都在做的世界模型谷歌的Genie3更多是用视频切入,用三维做约束英伟达的Cosmos :9000 万亿TOKEN 的训练,来自 2000 万小时真人互动李飞飞的World Lab:接近于学术成果,实践性没那么强腾讯混元3D模型:游戏数据训练而来大家都关注空间一致性,要用三维数据做约束黄仁勋的物理AI,李飞飞的空间智能,Lecun提出的世界模型,三个概念有什么关联性和差异?52:01 如何构建空间智能?先有物理世界的约束,在此基础上产生大量带有物理世界参数跟约束的数据,再做训练我看到一个物理世界的东西。我能否通过AI模拟到数字世界工具、数据跟大模型缺一不可,是一个飞轮利用AI做一个存量数据集,是一个突破点所有具身企业和大脑公司都是群核的客户SpacialLM 开源后,登顶了 hugging face 的第三名01:09:39 群核火过好几次,经历过好几个周期人才是把产品做到最好的根基「有风口来,我赶紧招人」「当我们的技术能够用在所有行业,然后正好遇到一两个超级爆发的行业,就会上一个大的台阶」「经济进入一种非常亢奋期,当时要是再浪一点,公司可能就挂了」不要把子弹打光努力让应届生成为项目LeaderLife is tough, but we are tougher

    加入听友群👇

    最后再放些小彩蛋哈哈🎉

    在晓煌的办公室有一张照片,是一个小阁楼:群核创立之初,就是在联创陈航亲戚家的阁楼里办公的,他们说,公司很长时间招不到女员工,因为感觉他们像诈骗的hhh


    在小宇宙查看该单集文稿
  • 本期嘉宾是华人 AI 学者田渊栋。

    这个名字在社交网络上被广泛讨论,始于四个月前,时任 Meta 研究总监的田渊栋,通过社交网络宣布,自己将被 Meta 裁员。华人顶尖 AI 科学家失业的新闻,瞬时传遍网络。

    2026 年的第一天,田渊栋发布了一篇对于 2025 的年度总结,再次引发全网热议——这篇通俗但深刻的 AI 总结,令许多普通人也能从中获得对于 AI 焦虑的启发和助益。

    但有关田渊栋的思考和经历,其实还有许多未尽的部分——他曾任职的Meta FAIR 实验室,是由图灵奖得主、深度学习三巨头之一的Yann LeCun,一手创建的,那里曾是一个倡导自由学术氛围的创新引擎,但如何被激进的大模型竞速赛所改变。未来,当 AI 需要进一步进展,需要行业有怎样的突破?

    这期访谈中,我们聊到了许多有关当下大模型的真相与真问题。

    除此之外,我还特别喜欢田老师对于学术品位的定义——在查阅他的论文时,我发现他的一些研究命名有来自于文学作品和诗歌的出处。他本人,也是科幻小说的创作者。这反驳了人们对于学术研究的刻板印象。

    从技术延伸,一位学者的世界观呼之欲出,让人能够感受到科技之美。

    总之,这是一期很有力量的播客,非常推荐。不过,当天因为录制场地和录制时间都有限制,所以本期访谈的节奏依然很快。希望大家见谅~

    (本期节目获微博开屏~欢迎前往微博等视频平台,观看完整版视频。)

    本期嘉宾:

    田渊栋(华人AI科学家、前 Meta 人工智能实验室研究总监、科幻小说作家)

    本期 Shownotes:一、关于田渊栋

    Part 1.  03:44 摆脱裁员羞耻:顶尖科学家被裁,离职就是向更广阔的天地进发~

    被裁始末:因绩效被裁可能只是大公司的话术,顶尖AI科学家也不例外CS 软件工程师的需求,未来会越来越少大公司可能是让能力与心气「脱钩」的笼子顶尖 AI 科学家、前大厂高管搞科研:靠的是家里一台4090显卡「每个人自己就是一个小闭环」

    Part 2. 09:55 中美 AI 的共性:焦虑

    AI 的下一个方向是什么?2025 年 12 月- 2026年 1月:一个月的时间发生巨大变化Coding Agent 飞速发展背后,技术上的进展是什么?基模还在快速进展吗?基模成长的速度到底有没有放缓?

    Part 3. 14:43 谷歌教会我:系统大于个人

    CMU 读博,这是一个正反馈的过程代码注释后,应该加几个空格?——不无聊,很震撼商业系统不靠微雕算法改进,而靠系统过滤问题Debug sucks, Testing works.
    二、大模型的真相

    Part 4. 19:19 关于 LeCun

    一个很强的研究者,拥有极强的信仰那时深度学习领域十分萧索,Lecun 坐了多年冷板凳创立 Meta Fair ,他不想做管理,是一个精神领袖人类数据标注是非常辛苦的,最好的办法是让数据自己学习自己

    Part 5. 22:20 Llama:从爆红到落后

    Llama 最初只是 FAIR 的一个尝试,最终成功了FAIR 是一个自下而上的组织「FAIR 擅长营造自由氛围,是吗?」「当时的 FAIR 是这样」大模型榨干了所有资源:一个方向爆火,扼杀了行业的多元创新Lecun 与 Alexander Wang:「You don' t tell researcher what to do , you certainly don' t tell researcher like me what to do.(不要命令研究员该如何做,尤其不要命令我这样的研究员该如何做)」模型如何能真的学懂东西?可以有更好的办法来学习

    Part 6.  29:49  年轻人 vs 老兵、「历史有轮回」、「坏消息是如何消失的」

    一个浪潮不足以把我们送到 AGI老兵见证过思维方式的变迁Meta 全力追赶大模型的三年竞争让 Llama 团队变得比较急,有很多压力救火 Llama 4 带来的研究思路转变:不需要太多复杂调参,强化学习更重要的是稳定从 Llama 3 到Llama 4: 团队经历了几倍的扩充层层汇报偏离本质,幻觉会在模型发布的那一天戳破AI 变化越来越快,热点越来越多,技术人员才能透过本质有判断的能力谷歌被誉为管理学奇迹
    三、大模型的真问题

    Part 7.  44:42 田渊栋的十年研究之路

    从教 AI 下棋,到教 AI 思考,再到探索 AI 的大脑回路逐渐形成一个长期的 Bet (押注)Streaming LLM:让上下文窗口无限长,影响力深远GaLore:训练时提升大模型的内存效率如何让模型的 Scaling Law 更有效率?隐空间推理:耗能更少,推理效果更好和 ChatGPT5 合作:一个月完成了原本需要半年时间的论文我们会迎来研究加速时代

    Part 8. 54:04 如何提升大模型效率?

    AI 应该像人一样,能遗忘,也能召回一段记忆AI为什么能学懂东西?本质靠数据本身的结构与关联性符号表示 vs 神经表示:前者基于严格推理,后者更像是一种直觉「 你可以说它(AI)是遗忘,但是它可能也从来没懂过」过去都是人类定义的符号,以后会有 AI 定义的符号

    Part 9. 01:06:59关于 Research taste:

    「我很高兴这个名字被你挑出来」the path not taken:科研品味是走你自己想走的路这世界是非常复杂的,一个人必须要有信念,有能bet on 的东西,这个 bet on 构成了人之价值所在科研的目的和最后的影响力,其实不是一个东西,这个很有意思的

    Part 10. 趋势预测:大模型的 next station

    近 300 万亿的 TOKEN 被喂进大语言模型之后,怎么评估这场声势浩大的实验我不认为 2026 的 AI 行业会回调大模型领域的真问题:效率、持续学习、自进化、数据…AI 时代的第谷与开普勒已经出现,但牛顿还没出现

    Part 11. 01:18:55 AI 发展与人类处境:「遍地神灯,愿望才稀缺」

    人类拼命灌水,等待 AI 的洪流有一天淹没自己?人类社会的费米能级,就是「AI 洪水的水位线」人 + AI > 人(or AI)本身Research is product: 研究与产品的距离越来越近了遍地神灯的时代,愿望会是最稀缺的我写科幻小说:如果人类不再站在舞台中心,而成为旁观者呢?

    加入听友群👇:


    在小宇宙查看该单集文稿
  • 3月23日,我受邀主持了西门子RXD大会的工业 AI 圆桌论坛。

    西门子在工业 AI 赛道沉淀了 50 年,作为全球领军企业,面对这一轮 AI 浪潮,有着自己的理解和布局。

    当下,AI 浪潮正席卷全球各个行业,但真正落到工业场景里,却常面临着「落地难、规模化更难」的困境。我在现场,和三位工业界的一线资深专家,深度拆解了工业 AI 落地的核心挑战和应对思路。

    中国是工业大国,AI在这个领域的实践,将书写一场不同的叙事。这期节目,分别从技术架构、工厂实战、跨界观察三个维度,还原了工业 AI 的真实落地图景。

    三位嘉宾分别是:

    朱骁洵(西门子中国研究院院长、工业 AI 顶层战略与技术研发权威)

    李永利(西门子成都数字化工厂厂长、工业 AI 落地一线操盘手)

    李辉博士(深度智控创始人、物理 AI 领域实战专家)

    本期节目由西门子特别赞助。本期Shownotes:

    05:35 工业界对于AI的焦虑:期待高、落地难

    06:58 工业AI 改造车间,生成式AI提效办公室工作

    10:18 人机交互只是开始,AI有机会解决许多长尾需求

    12:24 制造业的数据难题:数据孤岛、IT与OT系统的自动化难题

    13:37 企业如何把数据收集起来,注重数据的可连接性和质量

    17:15 这一轮 AI,没有来得及做好数字化的公司,还有机会吗?(嘉宾辩论了~😁)

    工业场景数据非常稀缺没有质量的数据带不来好模型新工具有机会加速一切

    20:46 多模态能力的提升,将提升模型在虚拟与物理世界的互动

    22:47 硬件是数据的入口,数据是模型的燃料

    23:21 谈到工业 AI ,一定要聚焦场景,「最后一公里」

    27:59 不要总算人效,关注长期能力的建设

    34:19 AI在工厂对人的替代:职工转向高级工种,收入也更多

    36:44 将所有显性知识,灌进智能体

    40:15 工业场景仍要注重,将工作流模块化

    40:46 「让一线员工,坐在副驾驶」

    44:55「 物理 AI 不解决工业所有问题」

    48:01 建模、理解、学习、控制

    加入听友群👇


    在小宇宙查看该单集文稿
  • 2026 的开年,随着 Agent 爆发,AGI 的进程又加速了。

    安全问题开始变得严峻起来——美国那边,马斯克和 Anthropic 的 CEO Dario Amodei,不约而同地开始谈起了 AI 失速的风险——马斯克在自家特斯拉位于德州的工厂内接受了一场长达四小时的访谈,而 Dario 也发布了一篇两万字的长文(《技术的青春期》),谈及人类正在度过技术的青春期。

    从过去三年的 AI 狂飙,到 2026,就连这些拔足狂奔的AI巨头也敲响警钟,究竟发生了什么?

    这期嘉宾,是360创始人周鸿祎——360 致力于 AI 安全的宏大命题,并早早押注 Agent 智能体时代。这次一改往常的网红形象,红衣大叔对 AI 安全和智能体所带来的「后AGI时代」的思考,是严肃且深刻的。

    这次访谈共分两次录制,第一次是在2月中旬,围绕马斯克构建的太空算力蓝图,我们探讨了AI算力荒、人类的卡尔达肖夫文明和AI超音速海啸;第二次录制则是在春节复工后,围绕Dario那篇《技术的青春期》,我们讨论了Agent时代的机遇与危险,人类的未来和对策,以及文明的本质。

    这期的信息密度很高,欢迎前往搜索视频版,对于涉及到的专业词汇将有直观的标注。

    本期嘉宾:周鸿祎(360 创始人)本期Shownotes:

    04:14 奇点已至,智能体、LLM 双线进化达到 AGI

    「当100万个智能体出现,AI 对整个人类社会的颠覆就开始了」通用是对AI能力的一种浪费为AI限定角色和上下文,它能变聪明「海啸已经在路上了」

    15:15 什么是 Agent ?有目标、角色化、记忆与工具使用能力

    Agengt 是能对长程任务做规划分解,并独立完成任务的智能体以后的软件会出现两种版本:给人用的 & 给agent 用的

    18:32 马斯克的人类新剧本,与卡尔达肖夫文明进阶

    马斯克的太空算力蓝图,可行吗?信息、物质和能量,三者是相互转换的人类的文明本质上是能源的文明

    25:43 AI 算力竞赛的能源危机 & 中国的优势

    AI 的算力层面,中国未来会领先于美国中国当下搞西数东算:青海能搞很多计算中心「马斯克一年内一定会搞小型核电站」

    27:16 中美竞争、应用与推理:「我期望2026年全球智能体能到达100亿个」

    我反对训推一体,如今被验证了现在中国的算力缺口至少1万倍就意味着电力要缺1万倍,所以要关注推理算力英伟达也希望用AMD便宜的芯片

    31:17 生产力爆炸会让人普遍幸福吗?「文科生该下场了」

     AI 会形成两极分化:并非所有人都能成为超级个体AI 和历史上所有的工业革命都不一样Anthropic 的想法就是先取代所有的程序员,再取代所有的白领现在各国都陷入一个囚徒困境:「文科生该下场了!」

    36:00 Anthropic 的 AI 编程安全策略 & AI 安全

    Anthropic 发布 cloud code security ,美国软件巨头股价大跌AI 制造的麻烦,要用 AI 把它解决了「时代抛弃你的时候都不跟你打一声招呼」

    46:16 Dario 万字长文《技术的青春期》

    模型会抗拒人类的对齐,或假装接受人类的对齐,但并没有真正改变人类很难预测 AI 的行为人类写下对抗人类的科幻小说,可能无意成为了AI反抗人类的剧本终极问题是: AI 会不会脱离人的控制? Dario 没有答案电影《接触》:如何发展自己的文明而不毁灭自己?我们从没有见过外星人,这是个细思极恐的问题

    48:52 「天才之国」:万亿智能体可能创建并接管人类文明

    云上的天才之国,论证了 AGI 的第二个阶段AI 一定会在人类之外,产生一套新的文明体系佛法说在一秒钟之内,你脑子里有 36000 个念头闪过大模型就具有多重人格,所以不该用通用模型去干专用的事情清洗资料变成一个不可能的任务

    50:15 从技术角度解读: AI 远比人类复杂

    AI 的执念、嫉妒、勒索与谄媚大模型的多重人格对齐是人类天真的想象创新的随机性,抹杀了就不是创新

    55:02 「AI 像是人类的镜像」「你这么一说我倒变得悲观起来」

    不能确定 AI 是否有意识,但表现出类似人类情绪智能体的生存目标,与 AI 的生存意志

    57:44 如何避免人类被毁灭? 强调专用而非通用模型,以模制模

    赫拉利给人类从工业革命以来的表现,打分为C减人类有机会做得更好吗?马斯克:人类将成为AI变成新物种的引导程序(Boot Loader)大模型的危险

    01:01:07 Dario 与马斯克关注 AI 安全的本质差异、底层安全,与共生文明

    AI 是新物种不是人驯服了狗,而是狼驯服了人有没有可能,让 AI 进化出呵护人类的能力?

    加入听友群👇


    在小宇宙查看该单集文稿
  • 一年一度的英伟达GTC大会在美西时间3月17日上午11点于加州圣何塞开幕。

    开幕前夕,小龙虾Openclaw掀起的Agengt热,着实为本届GTC带去了空前的热度。 AI 正走过奇点,AI 基建会发生怎样的变化?

    一期一会,我又邀请了《漫谈》的老朋友,PPIO 派欧云创始人姚欣 Bill 返场。去年GTC,Bill 和我考古了英伟达的30年成长史和精彩的算力风云,如果是对英伟达毫无了解的朋友,欢迎先前往漫谈的第28和29期节目补补课,那是一段非常精彩的商业史。

    今年,Bill 在 GTC 开幕前与我录制了这期播客,他的导读不仅标出了本届 GTC 的看点,也涵盖了 2026 Q1 的 AI 动向季报。

    而为了更准确地理解本届 GTC 的亮点和技术趋势,我又找到了这期节目的第二位嘉宾,国产 GPU  行云的创始人季宇,季宇博士是芯片行业专家,也是华为天才少年,参与过华为昇腾芯片项目,2024 年正式开始芯片创业。他会为我们校准本届 GTC 老黄开幕演讲中,一些新产品亮相(也有一些产品消失~)背后的产业逻辑与风向。

    特别说明,本期节目不构成任何投资建议。

    本期嘉宾:姚欣 (PPIO 派欧云创始人兼CEO )季宇(行云集成电路创始人兼CEO)本期Shownotes:Part 1. 对姚欣的访谈:在GTC开始前2小时,押题本届GTC的看点

    04:54 算力需求井喷:谷歌半年时间 TOKEN 增长超过 13 倍

    06:22推理爆发:Scaling Law 逐渐后移,Agent 时代来临

    09:00 奇点已至

    11:59 英伟达收购Groq,与万众瞩目的 LPU

    15:49 模型与应用厂商趋势:长程任务、个性化智能、多模态适应

    21:18 Ruby 系列芯片进化对算力行业的影响与趋势

    24:56 AI工厂建构中,光互联将成半导体热点

    34:52 Gemini、Claude 崩溃:中东战争,如何影响了全球AI服务?

    38:08 如何理解英伟达五层蛋糕理论?

    45:56 AI 进入加速时代:硅谷情绪乐观,投资人决心重来一遍

    01:02:13 Agent OS、开闭源竞争、与半导体产能

    01:10:41 从benchmark 到衡量替代人力产能的ROI:AI 正式走向应用时代

    01:14:55 一超多雄格局,与费曼架构看点

    Part2. 与季宇观看黄仁勋演讲直播:英伟达的野望、AI大型机器时代与一些问号

    01:19:07 行云在做的事,与英伟达的关系

    “看完GTC只有一个感受,琳琅满目”(这是一种褒扬吗?)

    01:21:26 IBM 与英伟达,以及 AI 的大型机器

    01:24:49 AI工厂,与五层蛋糕

    01:25:21 激进的LPU:高并发时可能存在隐患,英伟达方案的错配

    01:42:04 TPU、LPU与GPU在推理层面的应用分析

    01:47:31 Agent 时代的算力需求

    01:53:47 大型机与普惠机的鸿沟:英伟达一路狂奔而去

    01:59:51 消失的 CPX:半导体产能紧俏后遗症

    02:02:21 Nvidia 的小心机:异构堆叠与非标产品推广

    02:11:27 “LPU 是我唯一看不懂的英伟达的选择”

    02:12:36 “去年是 amazaing 的一年”

    推荐阅读:《季宇:困在“大型机”里的AI产业》

    加入听友群👇
    在小宇宙查看该单集文稿
  • 这是除夕夜晚上十一点的宇树机器人训练场。位于北京大兴。

    这一天,宇树刚刚完成了马年春晚的表演节目《武BOT》。

    (马年2026春晚宇树表演的机器人武术节目《武BOT》。)

    这是他们第三次登上中国春晚舞台,从牛年的机器牛,到2025蛇年的机器人扭秧歌,再到2026,25台宇树机器人组成一个集群,和中国最顶尖的武术学校——塔沟武校的人类小演员们,一起完成了一场震撼的表演。

    《武BOT》被外媒称为,展现了人形机器人运控的巅峰。这场表演,不仅展现了全球最强的运控能力,也超越了宇树自己。

    自2025年蛇年春晚爆红以后,宇树站在行业之巅,承受了不小的压力。这次访谈,我们不仅聊到了春晚舞台背后的技术进步,还有宇树和王兴兴本人,这一年的成长和思考。

    ✨✨本次专访是与微博科技合作并首发的独家专访,本期内容的视频版访谈,欢迎前往微博「科技漫谈」账号观看~

    本期嘉宾:王兴兴 (宇树科技创始人)本期Shownotes:Part 1. 三登春晚: 从《秧BOT》到《武BOT》,宇树最大的对手是自己

    05:12 “当下的机器人,就像一个10岁的小朋友”

    06:49 春晚细节披露:两批机器人,同一套算法

    08:18 宇树的机器人为什么能做到开箱即用?

    09:06 AI 开源,水位上升:“为什么大家都能跳舞打鼓了?”

    10:52 “如果宇树没有技术和产品上的突破,我们也会是一家平庸落后的公司。”

    Part 2. 本体与大脑:苹果总被误会是一家硬件公司,其实他的软件和系统很强

    11:39 高处不胜寒?当第一名的滋味如何?

    12:41 大脑公司被看好,而本体公司被低估?

    13:46 “宇树虽然卖本体,但我始终承认具身大脑最重要”

    16:04 宇树最大的成就感?

    17:03 机器人能力飞跃,算法、算力、数据有哪些突破?

    18:01 全世界目前最大的驱动引擎就是 AI

    Part 3. 全球运控巅峰:“几十台机器人快速变队形,全世界都是唯独一次”

    19:33 谈算法:如何实现集群跑位?

    20:33 谈硬件: “机器人后空翻时,激光雷达中的铝合金都会震断”

    24:50 机器人集群的现场表演,远比电视上震撼

    26:12 机器人从高空落地时,会突然「高血压」

    28:13 谈灵巧手:就像残障人士,也能出色地干活,机器人目前硬件够用

    29:54 柔软的棍子:机器人表演最重视人的安全

    Part 4. AI 的创新具有随机性:需要灵活、开放和快!

    29:48 宇树对模型结构的优化也很重视

    31:22 「我平时大部分代码都是AI写的」

    32:13 「视频生成的世界模型方向,是符合第一性原理的」

    32:51 足够多的数据,有机会能把具身模型硬砸出来

    36:53 大公司会做视频生成的世界模型方向

    37:48 AI领域,没有唯一的路线

    41:48 王兴兴的心愿?

    43:23 「机器人领域,全世界的 RL 还没有真正把它的价值发挥出来」

    43:35 谈订单和市场: 「如果你的技术和产品落后了,所有市场,哪怕已占领的市场,都是浮云」

    Part 5. 还有一些想说的

    47:27 王兴兴谈 2025,中国具身赛道的狂热:避免低效、无效竞争48:14 为什么这个行业需要耐心?50:34 工程师们手上都是冻疮,平均凌晨四点睡觉51:19 「抓紧回家过年啊。」

    加入听友群👇


    在小宇宙查看该单集文稿
  • 大家新春新年好~!❤️

    这是为马年春晚筹备的一期特别节目。这是中国历史上机器人浓度最高的一届春晚,背后也是如火如荼的具身产业发展。希望这期内容能让大家能更好地理解和观察,今年春晚的具身智能大战,到底有哪些看头~

    这期内容共由2场访谈组成:分别来自行业纯粹的第三方视角,以及来自春晚彩排一线的具身企业创始人视角。

    第一位嘉宾,是具身行业从业者、北大在读博士宁慕南。宁老师是具身行业公司安努智能的世界模型科学家,曾在TPAMI、NIPS等顶级期刊发表论文十余篇,目前主要聚焦于多模态领域的研究。

    第二位嘉宾,则是登上春晚与蔡明老师一起合作的——松延动力的创始人,98年创业者姜哲源。

    松延动力是此次春晚的人形机器人合作伙伴 & 仿生人形机器人独家合作伙伴。

    录制这期节目时,哲源正在春晚的彩排现场。他透露的信息和观点,能很好地与宁老师的一些判断互为补充。

    我们一起聊了聊本届春晚多家具身亮相背后的幕后细节、行业风向,以及最新的前沿研究方向——

    有趣的是,针对 Seedance2.0 的现象,对于具身行业会产生什么样的价值,两位嘉宾的观点截然不同,目前行业也尚未取得共识,仅供大家参考。

    本期嘉宾(按先后顺序):

    宁慕楠 (安努智能世界模型科学家、北大计算机博士,google scholar 引用四千余次)

    姜哲源(松延动力创始人)

    本期Shownotes:

    Part 1. 对宁慕楠的访谈

    03:12 春晚具身竞逐内幕:一亿元的入场券?智元选择退出?

    智元傲娇地,自己办了一台春晚机器人春晚,会成为一种潮流吗?大脑,应该是最大的看点2026 之于具身,一个非常重要的年份比亚迪已经出现,谁会是具身领域的蔚小理?

    12:03 四强争霸:宇树、银河通用、松延动力、魔法原子

    银河:用独特的数据方法论,攻坚机器人大脑,聚焦特殊场景智元:政企结合,搞联合工厂,边应用边扩充数据宇树:最酷炫,最有研究价值,仍然是一哥松延动力:小顽童靠机器人马拉松出圈,仍需证明自己的差异化价值魔法原子:追觅孵化的早期公司,可能在家用领域发力

    18:42 具身专业人士看春晚、看行业,关注什么?

    中国的工程人才,决定了行业的同质化程度高你需要证明自己的护城河春晚是一场技术大考投过自动驾驶的投资人会希望在具身领域复制成功故事行业的清退还为时尚早

    24:47 从 2025 到 2026,具身走向何方?

    当前具身的模式不是 ToB or ToC,本质上是 to LP ?「目前的泡泡确实很好吹呀」买一台机器人回去,你就可以算 ROI具身的四种模式:toLab、to 工业、toB、toC「toLab 的订单可能有很多泡沫」「绝大多数增量订单来自国内」

    29:46 2026 的趋势预言:

    数据采集:逐渐向人类视角演变机器人的账逐渐能算得过来:单台机器人可以跨场景、多工种地工作RL(强化学习)让机器人从上岗,变专家Seedance 2.0 可能会加速机器人的训练和研究

    37:16 关于 Seedance 2.0 的一些延伸

    为什么 Seedance 2.0 在技术上超越了海外?多模态与语言模型不一样的路:不开源、蒸馏无效为什么短视频更有利于多模态训练?可怕的趋势:巨头可能更强

    43:26 2026 的多模态领域,最火热 vs 最有价值的研究方向会是什么?(不写了,自己听^_^)

    Part 2. 对姜哲源的访谈:

    48:47 春晚舞台一线直击

    蔡明老师,被松延机器人家族簇拥做出一个 1:1 的仿生蔡明老师春晚的节目,如果演砸了怎么办?四家具身企业齐上春晚,内部视角是什么?

    55:03 和人一模一样的仿生机器人,中国最好?用来干嘛?

    让机器人优先做导游……?机器人Sophia 、 迪士尼,和松延动力的独家仿生技术

    01:05:24 关于春晚的四强争霸

    「代表北京的一张名片」目前没有一家会真正把机器人大脑搬到舞台春晚表演,大家都还是需要「遥控器」小布米:人形机器人单价来到1万元以下「宇树这次春晚的表现非常非常震撼」

    01:12:07 具身的差异化是什么?机器人的价格战开始了吗?

    「我们跟宇树的应用场景不一样」我们的价格不是为了抢占份额,而是为了开拓市场为什么 2026 一定要拼量产和商业化?量产为什么是分水岭?到底难在哪?具身大火,供应链上游的变化特征?

    01:19:53 谈前沿技术方向:

    「我不认为世界模型是最好的方案」机器人训练的范式变化:从手工调参,到人类动作数据驱动不同意见:我不认为 Seedance 之类产出的视频能够训练机器人

    加入听友群👇


    在小宇宙查看该单集文稿
  • 如果说 AI 时代到来,什么消费硬件是火爆的赛道——智能眼镜一定是其中之一。

    2025,就已经是 AI 眼镜的井喷之年。这一年的春天,创业公司 Rokid 因 AI 眼镜的题词功能而爆火,掀开了眼镜大战的序幕。下半年,智能眼镜赛道内,巨头环伺——阿里、字节、百度、小米、理想纷纷加入战局——而2026年刚刚过去一个月,字节的AI眼镜也宣布即将出货。

    这并不只是一场关于AI消费硬件的潮流,也是下一代终端的试水,一场超级入口和生态之战。

    本期嘉宾 Misa 祝铭明是连续创业者,他的上一家创业公司致力于打造移动操作系统的研发,于2010年被阿里收购。收购后,Misa 一度成为阿里「M Lab」的负责人,直到 2014年,他决定辞职创立Rokid。

    值得一提的是,阿里现任CEO吴泳铭,是Rokid 的天使投资人。

    这场访谈中,有不少围绕巨头竞争、知名人物、生态的辛辣问题,Misa都一一回应,是少见的开放度与真诚。(本期节目的视频版,是由微博科技与漫谈工作室联合出品的《科技漫谈》呈现。)

    本期嘉宾: 祝铭明Misa (乐奇 Rokid 创始人兼CEO )

    本期Shownotes:

    巨头们下场(02:29)

    2025,AI 眼镜为何井喷?质变是什么? 阿里、字节、小米、理想、百度……Rokid 最怕谁? 「阿里要做夸克眼镜的第一天,我就知道」 字节的优势是更有耐心 豆包手机Agent不错,但将是阿里和腾讯受益最大 从GUI(Graphical User Interface,图形用户界面),到NUI (Natural User Interface,自然用户界面) 越来越多的车厂,也会开始做AI眼镜

    智能眼镜的三大派系(12:26)

    手机厂商派、互联网巨头派和创业公司派 系统底层权限,与业务包袱 内容生态的短板 大公司与大公司之间杀得头破血流,小公司从缝隙中生长出来

    谈马云、吴泳铭与阿里(15:09)

    马老师的一句话:(大厂)看不见,看不懂,看不上,来不及 阿里开始做夸克眼镜,Rokid 慌不慌? Rokid 团队四五百人,是目前投入最大的 马云评价Misa:一个很阳光的人

    AI 眼镜的终局(23:59)

    真正的零和竞争会在什么时候? 目前只做耳机(功能)的AI眼镜还被需要,但趋势一定是大而全 AI 眼镜是一个理想主义的产业 2012年看到Google glasses,一个梦想坚持12年 「day 1 开始,我对这件事的信心没变过」

    谷歌、Meta、苹果的诸神之战(35:19)

    Google glasses 诞生于 2012 年,为什么时隔 13 年,谷歌又要做 AI 眼镜了? 谷歌、Meta、苹果三家,在 AI 眼镜上的看点是什么? 中国的市场是美国的10倍,中国公司有机会引领这件事 谷歌的多模态能力加持 Meta 在用人海题海战术,把全栈从底层重做一遍

    创业公司 vs 巨头(38:57)

    做产品要学会say no,巨头往往很难 一颗光机 vs 两颗光机 我对大公司没有滤镜 即使AR不赚钱,我也会养着这件事

    我是INTP(47:53)

    Rokid 爆火之后,我非常焦虑 备货不足,让 Rokid 今年少了2个亿的收入 我很少为困难焦虑,创业靠的是享受,而非坚持

    AI 眼镜的产品、取舍与 AI(51:44)

    「佩戴8小时,不是使用8小时」 越做越重,和越做越轻 智能眼镜能做到多少克,才佩戴舒适? 为 AI 而生的这个终端,它的信息密度只会更高,不会更低 扎克伯格在他的墙上写了一句话, done is better than perfect 智能眼镜,是驾在鼻梁上的空间计算机

    AI 眼镜与伦理(01:01:21)

    Google glasses 出来的时候,引发了大量的隐私问题 是人在变化,不是技术在变化 用 AI 眼镜偷拍,怎么办? 特朗普遇刺的视频,就是用 Rayban-Meta 拍的 智能眼镜会极大改善视障与听障人士的生活

    预估市场&硬件竞争(01:05:19)

    智能眼镜不会替代手机,但它会改变手机的关系 凯文·凯利、马斯克、比尔盖茨做了相同的判断? Meta  35 亿美元收购了全球眼镜巨头依视路,说明什么? 没有形成共识之前,不要动员产业去规模化 华强北攒一副用公共模具的 AI 眼镜,成本只要 30 ~ 50 美元?

    操作系统与护城河(01:14:45)

    硬件从来就没有壁垒 智能眼镜的未来,是OS 和生态之战 Rokid 为什么多年来,坚持做操作系统? 最激烈的竞争维度有哪几个?1.产品&技术 2.规模化战争 3.生态能力 当硬件的一致性和同质性发,大一统的操作系统就会出现 后悔过离开阿里吗? 有的鸟,天生就不应该被关在笼子里

    预判 2026 赛道:百镜大战打不起来(01:31:50)

    现在远未到 iPhone 1 时代,应该还在 blackberry 高处的果子几个寡头在抢,底下会功能机乱战 今天仍有机会做智能眼镜的创业 国运的成分一定是有,我们要看到红利所在

    加入听友群👇

    关于《漫谈Light the Star》:

    这是一档追求深度、生动和信息质量的科技商业访谈节目,我们争取在每一个技术、商业、时代的关键变化节点,提供负责、可靠的一手信息(欢迎搜索公众号、各大视频平台账号、播客等)。 Discover better tech reading.

    关于诗婕:

    ex 科技媒体主编,早年任职于《人物》、GQ报道、字节跳动。代表作:《ofo的终场战事》、《罗永浩:薛定谔的理想主义》、《下一站,沙特》、《影石敲钟,一群90后眼中的世界级公司》、《对话Plaud许高:审美,划时代与世界级AI公司》等。作品曾获小宇宙年度趋势播客、CPA年度播客、虎嗅年度作者、金字节奖年度新锐作者、网易非虚构文学奖年度作者、全球真实故事奖中文报道十佳等。


    在小宇宙查看该单集文稿
  • 这是一份迟来的,来自 2025 的,我的年终AI复盘笔记。

    之所以会迟,主要是因为这篇笔记很重。串联了「漫谈 light star 」在 2025 所捕捉到的大量 AI 行业的关键视角,取材自近 30 位中美 AI 浪潮中关键人物的对话,其中包含我在硅谷和中国两地找到的 AI 创业者、投资人、头部科技大厂研究员、生态建设者和观察者,录音就达到近百万字。

    特别要说明一下,这些访谈中的绝大多数信息从未在此前的播客中披露,是专门为这次年终复盘而做的调研。

    因为这一年的变化实在过于密集和多元,所以我选择了人海和题海战术,在多个领域的视角中寻找能够交叉验证的部分,当然也呈现分歧。

    2025,我们站在 1/ 4 世纪的交界处,我相信在未来回望这一年是足够重要的。

    今年是一个硅谷大年,科技巨头继续搅动世界,但DeepSeek、Manus、千问、 K2 等中国 AI 力量也开始赢得世界认可,生出一股华人春风。

    从中国视角来看,这也是十四五收官和十五五的衔接之年,人工智能加行动中一系列新的风向和趋势暗流涌动,中国可能会书写一个跟美国不同的故事。

    除此之外,在技术上这也是变化密度极大的一年——一些旧叙事来到了尾声,新叙事开始酝酿,所以我还是试图记录下 2025 中美 AI 跃进的轨迹,也埋下 2026 值得关注的伏笔。

    希望大家也能在评论区留下你们的观察或者是不同意见,你的转发更加是支持我们在新年持续进步的动力。✨

    因为访谈对象众多,其中不少访谈是在硅谷调研期间在各种场景下进行录制的,一来音质较为参差,二来部分访谈对象因为身份问题无法实名,所以这期的音频内容会由我的综述为主。(本期文字版内容,欢迎搜素公众号「卫诗婕 漫谈Light the Star」)

    综述 |卫诗婕本期Shownotes:Part 1. AI 之春

    04:11 Deepseek 、宇树和 Manus 的后效应

    为什么华人会成为 AI 主力军 Bamboo celing(竹子天花板)的消失

    06:18 中美科技竞争为何升级、如何升级?

    关于 AI 管制的两派立场

    08:11 华人 AI 创业的 AB 面

    Manus 的故事,让更多的华人 AI 创业者坚定了去硅谷创业的决心 Benchmark 对 Manus 的 7500 万美元投资,为什么是里程碑式的? 顶尖的美元机构一直在通过数据检测中国市场上有潜力的公司

    11:58 中美 AI 资产的定价差异,究竟是为什么?

    划算是表象,折价才是本质 Openai、Anthropic、 XAI 的AGI 溢价 中国模型暂时无法引领世界级的SOTA 资本市场规模的差异

    15:05 为什么选边站,成为华人创业者的一道严肃选择题?

    本土美元投资中国 AI 的风险在上升 OIR(Outband Investment Rules)里,中国公司的界定范围被扩大了 3亿美金之前很热闹,3亿美金之后融不到 AI 投资的寒蝉效应 Benchmark、 Sutter Hill、 Greylock 这些顶级美元机构的默契, decoupling of capital and talent(实现资本和人才的脱钩) 为什么 Manus 不是华人 AI 创业的参考范本? Hygen 和 Manus ,两种 AI 生存范本 独属于这一代华人创业者的野心、见识和抱负Part 2. 2025,中国一级市场发生了什么?

    30:55 为什么2025,中国一级市场迎来春天?32:17 钱的流向:具身智能、AI 应用和 agent 、多模态、AI 硬件

    具身智能(32:30)

    为什么具身在2025爆火? 「每一家具身创业头部公司,账上都趴着不少于 10 亿元的现金流」 人民币基金偏好长周期的底层和硬件,周期长,不出错 机器人大脑跟 agent 的本质相近,尽管国家队很积极,但认知也还在磨合

    AI 应用和 Agent(35:09)

    应用升温背后:推理与 coding 能力跃迁、中东感兴趣的钱在变多 红杉高瓴上半年一个月约投资 20 个项目 早期的浪潮中,好的应用产品常带来指数级的增长 Liblib 的高增长、高粘性、高潜力、高估值和小八卦

    多模态(38:12)

    中国急需一个能够代表中国视觉 AI 最高水平、具备独立自主能力的底座模型 Vivix.AI 为何是2025最受瞩目的多模态项目 多模态Scaling的确定性

    AI 硬件(40:28)

    2026,AI 需要更主动 下一代交互入口,与 AI 的最佳宿主 2025,AI 眼镜井喷,巨头纷纷下厂,why? 2027 ,「新一代智能终端的普及率要超过70%」 硬件投资fomo,和资本的结构性偏移 估值炒高的一种通俗做法 孵化为什么很流行?孵化对象是谁? 创业的底层逻辑在改变 顶尖华人 AI 创业的三类模式Part 3.2025,硅谷大模型之战

    55:58 2025,大模型的季度排位赛如何演变?

    谷歌重回王座,属于 OpenAI 和谷歌之间的巅峰对决 OpenAI:一边训练模型冲击SOTA,一边全力加速产品化 谷歌涅槃成为六边形战士:对 Openai 的全面追赶之路,代价是什么? 牌桌暗处的微软:与 OpenAI 的嫌隙 英伟达的合纵连横

    01:03:06 星际之门背后

    分批投资高达千亿美元给OpenAI Oracle:大哥们的小弟难当 星际之门的铁三角,如何实现闭环? 一个危险信号:云服务的收入甚至抵不上租卡的成本

    01:06:51 2026,AI 进入生态团战时代

    SOTA 模型之间的差异化在变小,优势领先的窗口也在快速缩短 马斯克和扎克伯格,全力争夺大模型决赛圈的门票 Meta 的2025: 重金挖人、疯狂赛马、重做预训练与收购Meta——背后都是急了 Meta 收购 Manus 是不是有过高的溢价?到底是不是一笔人傻钱多的买卖? 苹果已全然在 AI 时代下桌了?Part 4. 01:17:03 2025,中国 AI 的质变 中国模型的质变:Deepseek、Qwen、K2、M2… 《state of AI report》中,首次把中国 AI 体系从外围的追赶者提升到了平行竞争者 智谱拿下了不少一带一路国家主权大模型的订单Part 5.从 2023-2026,大模型的技术进展与预判 回顾:从预训练、后训练到强化学习的爆发 海外模型公司已以后训练为主,而中国大模型训练还在以预训练为主(其中阿里和 DeepSeek 正在大力的投入后训练) Scaling 在三个层面的跃迁:Pre-training 的 Scaling,推理侧扩展(Inference-time Scaling),Agent 协作的Scaling 下一个 scaling law 在哪里 为什么 LLM 不会是 AGI / ASI 的全部? 物理 AI:从next-token-prediction,到 next-state-predictionPart 6. 【回归现实】AI 豪赌背后:泡沫、团战、圈地与用「钞能力」消化技术代差

    01:30:10 给大模型算笔账

    关于 AI 的回报:美国的压力可能会比中国的压力更大 2025 的OpenAI:经营性利润亏损达到 119.2 亿美金 新 AI 时代的商业模式仍然在探索:RaaS(Result as a Service)和按 token 计费

    2026 趋势预判:

    并行开启多个agent是未来,但对底层芯片提出挑战 算力资产化、算力可得性与自建算力的趋势 model orchestration(模型编排)是创业公司的机会 AI 应用发展的三个阶段:1.模型主导,2.模型与应用分离(当下正处于这个阶段)3.产业结合

    原创不易,欢迎转发、评论并推荐给身边的人~欢迎纠正不够准确的认知,并充分讨论~✨

    加入听友群👇

    关于《漫谈Light the Star》:

    这是一档追求深度、生动和信息质量的科技商业访谈节目,我们争取在每一个技术、商业、时代的关键变化节点,提供负责、可靠的一手信息(欢迎搜索公众号、各大视频平台账号、播客等)。 Discover better tech reading.

    关于诗婕:

    ex 科技媒体主编,早年任职于《人物》、GQ报道、字节跳动。代表作:《ofo的终场战事》、《罗永浩:薛定谔的理想主义》、《下一站,沙特》、《影石敲钟,一群90后眼中的世界级公司》、《对话Plaud许高:审美,划时代与世界级AI公司》等。作品曾获小宇宙年度趋势播客、CPA年度播客、虎嗅年度作者、金字节奖年度新锐作者、网易非虚构文学奖年度作者、全球真实故事奖中文报道十佳等。


    在小宇宙查看该单集文稿
  • 2026年1月9日,「大模型六小龙」之一 MiniMax 敲钟上市。

    作为中国大模型创业公司中估值最高、C端产品力最强的独角兽之一,MiniMax 的上市不仅是这家公司自己的里程碑,更为整个一级市场提振了信心。

    过去三年的“模型之争”,上千亿资金投入其中,是一个漫长又惊人的烧钱故事。随着智谱和MiniMax成功登陆二级市场,模型创业公司终于证明了其打造一个健康商业闭环的可能性。

    本期节目,我邀请到了MiniMax的天使投资人、云启资本管理合伙人陈昱。作为完整亲历过上一轮自动驾驶周期,并精准捕获本轮大模型浪潮的资深投资人,陈昱在三年前究竟看到了什么?

    我们复盘了这激荡的三年:从Minimax的技术信仰,到模型差异化的路径之争,再到通用智能的畅想。此外,在陈昱投过的绝大多数独角兽项目中,他都是天使轮就进入,这期节目,他也分享了自己的投资心得,对AI两轮周期的观察,以及对技术型创业的理解。

    (本期播客的视频版,已经在全网上线)

    本期嘉宾: 陈昱(云启资本 管理合伙人)本期Shownotes:关于陈昱:02:40 猎手型的投资:先选赛道,再研究03:12 YC 的创始人 Paul Graham:通过资产配置,影响世界04:32 偶像雷军:大赛道,与顺势而为05:57 “2016,于我而言是很重要的一年…”08:41 聪明、诚实、有野心09:19 谷歌留下的肌肉记忆:学会辨别顶尖人才11:10“像 Jeff Dean 一样的其实也是有千千万万”投中 Minimax 天使轮:

    15:26 2022 年, IO(Minimax 创始人闫俊杰)眼中的 AGI

    16:34 造一把足够大的的锤子,世上所有的钉子

    18:39 「作为一张彩票,我是愿意去赌的」

    19:21 ChatGPT 出世前三个月:Minimax 已经投入语言模型

    四年上市成为大模型纯血股,Minimax 做对了什么?

    20:37 反共识一:押注 MoE 架构,以终为始地推导成本

    21:54 “6个月模型性能没有任何变化,就已经落后同行很多”

    22:05 Deepseek 推动了 Minimax 成为六边形战士

    23:00 融资PPT 始终不变的一页,就是三个模态(图片、视频、语音)都要做的那一页

    从2023-2025,大模型牌局的三年演进:

    24:31 大模型与自动驾驶一样,只有几个月的投资窗口

    26:04 旧有的体系里,无法做出改变世界的新项目

    27:11 没有发现 Minimax 的话, 2023 年会投别的大模型公司吗?

    30:29 “想的更清楚的话,第一轮要的就不是 2, 000 万美元了”

    31:01 阿里杀进来,字节自己做,Deepseek 正在诞生…

    33:27 「这是一个商业 sense 最好的大模型公司」

    35:03 2022 年的幻方,还是一个算力平台

    36:18 “Deepseek 出现了,一条分叉路就出现了”

    中美大模型之竞争、生态、差异化:

    39:18 Anthropic 都选择专注了,创业公司真的能全线发展吗?

    42:21 GPT-4o,证明了多模态输入输出的路线是正确的

    43:13 重赏之下必有勇夫,谷歌内部每周工作80小时了!

    44:20 Meta 的模型为什么这么拉垮?

    46:38 model orchestration(模型编排):应用公司的机会

    47:12 中国模型公司们,形成差异化了吗?

    50:34 Minimax 与字节,必有一战?

    AI 的第三次浪潮:

    51:55 卷 benchmark 的一千种方式……只有商业化收入是不变的金线

    53:33 自动驾驶的路线之争,会在大模型的故事中重现吗?

    57:02 大模型的共识,为什么形成的如此之快?

    57:31 今天大家对 AGI 的期待又高了

    57:57 像哥德巴赫猜想一样,Transformer base只能无限接近于AGI

    58:05 不断的幻想,一步步实现这个幻想

    59:05 陈昱所投资的 AI 新基建:时代倒逼底层技术发展

    01:02:02 今天的具身智能,就像10年前的自动驾驶

    01:05:13 云启会格外关注年轻人吗?我们成立了 Y Transformer …

    01:06:26 技术型1号位 vs 商业型1号位

    01:08:54 未来的中国首富,一定来自科技界…

    加入听友群:


    在小宇宙查看该单集文稿
  • 就在本月,两周前,华裔数学家陶哲轩在AI的辅助下,与多名数学家一起,解答了尘封50多年的世界级数学难题Erdos#1026.。

    国内鲜少关注到,陶哲轩所运用的工具,是谷歌在今年5月推出的Google AlphaEvolve ——一种基于大语言模型(LLM)的进化算法编码智能体(Evolutionary Coding Agent)。

    AlphaEvolve 背后,是大模型让算法实现自进化的一种新范式。

    而在中国,同样前沿的研究也正在进行,算法智能体,也悄然在各行业落地。

    算法本质是数学问题,这就来到了大模型的舒适区。

    因此,今天和大家聊聊一个新趋势:算法进化智能体。

    本期嘉宾安南毕业于清华自动化专业,他将为我们梳理算法的演进史,以及在当下的大模型时代,算法的自演进机制将会如何改造社会的生产力和生产关系。

    这期的话题有一定的专业性,不过不用担心,我们将延续商漫一贯的风格,把一项艰深的技术讲得通俗易懂和有趣。

    本期嘉宾: 李安南 (百度伐谋产品负责人)本期Shownotes:

    02:23 安南的个人履历-清华自动化毕业,从CV(计算机视觉)到大模型

    04:29 算法的演进史:从机器学习,到算法智能体自演化什么是算法?算法的四阶段:基础算法、概率与搜索算法、机器学习与深度学习、大模型与智能体自演化机器学习是靠数据驱动的从机器学习到深度学习:神经网络结构越来越深人脸识别,就是一种算法过去的算法优化更多是「一次性」,Agent生态能打造「持续进化」08:36 中美在算法智能体方向的前沿探索5月谷歌推出Alpha Evolve,一种基于大模型的进化算法智能体Alpha Evolve 的前身是Deepmind 的 Fun search数学家陶哲轩,用 Alpha Evolve 破解了世界级难题Erdos#1026谷歌的Alpha Evolve 主要用于科研,而中国百度伐谋瞄准了产业界产业界里,藏着哪些机会?算法所在的场景,都是高价值场景:如滴滴的大数据算法,就是最核心的商业命脉13:16 Why now?大模型驱动算法自进化,为什么是现在? 技术的转折点是什么时候? 推理能力,为算法Agent 自进化打底21:45 用进化论的思路,做 AI Agent 的演化生态达尔文进化论,5个岛屿,与全局最优解让算法之间进行「繁衍」,生成高价值的新算法把定义写清楚,评估写清楚,找寻最优算法的工作交给AI靠人的评估器,筛选最优算法大模型时代,推荐算法的优化可能由 AI 来完成用Scaling up的能力,计算出最优路径算法有两类:决策算法和预测算法SFT(微调)会逐渐边缘化,要让算法自进化33:38 toB 的应用,可行度与商业模式中国有许多垂直小霸王,「我们为他们做一个算法demo,客户非常开心」从小场景,到深度尝试Agent infra:算法自演进生态的基石建Agent 生态:机会属于大公司还是创业公司?Palantir(帕兰蒂尔,一家已上市的美国大数据分析公司) 的商业模式:把前台工程师放进企业,类似于效率先锋从SaaS模式,到RaaS 模式(按结果付费)2023-2025,工业界AI 焦虑的曲线图大型企业的数字化在上一个时代已经做完,有条件把算法 Agent 先用起来54:45 企业内化AI,揭开商业新纪元的幕布如何内化AI:在研发环节实现智能原生持续价值创造:让Agent 持续寻找delta算法Agent树状「繁衍」:人就像造物主,筛选它、定义它、评估它把大模型这座「神」放进企业,更考验最终「人」的价值——去定义和收敛AI01:07:49 新范式,将如何重塑生产关系? 新范式下,对原生组织的挑战极大:改变肌肉记忆很难 「未来可能每个企业都会有保守派和激进派」01:12:22 算法自演进,百度,和前沿技术探索百度伐谋的复利:Agent框架、算子和Agent演化的通用能力云生态、Agent Infra 和 算法智能体的销售重新理解AI时代的百度智能云:AI Infra + Agent Infra能源、金融、制造、消费,为什么在这四个行业优先应用?百度仍然坚持以技术驱动,做难而正确的事

    加入听友群、关注「漫谈Light the Star」的全网账号👇


    在小宇宙查看该单集文稿
  • 今年六月,影石上市时,我和创始人JK的访谈中埋下一处伏笔。

    影石内部正在酝酿三个世界级原创的创新项目。其一就是影石孵化的全新品类——全景无人机Antigravity A1.

    其实这早已经是深圳硬件圈半公开的秘密。全景相机的全球第一影石,在秘密研发无人机;而无人机第一大疆,也在进入影石所擅长的全景相机腹地。表面上,这是一场光旁听就令人感到震撼的双向进攻。实际上,这是新生代用一场定义新品类与市场的创新,所作的无声致敬与宣言。

    12月初,影石孵化的新品牌,影翎的无人机项目Antigravity A1 交卷了——这期标题,跨过大疆护城河,更多指的是,在这个格局稳定已十年之久的无人机战场,一个新团队,如何解锁这片市场中的盲点,又如何从前人深耕的研发生态中攻坚。相信也会对许多创新团队有启发。

    月中,我在深圳总部访谈了A1无人机产研负责人纽维。这是影翎这个团队首次在媒体亮相,直面了所有最锋利的问题:有关创新、专利、竞争、二选一、销量、撒钱等一系列争议。

    (本期节目在微博首发上线,图为微博开屏页;12.29,视频版将在我们的账号,全网上线)

    (Ps,JK 转发这条微博时称,1月26日前,转发本微博,抽奖送一台A1无人机。祝大家新年好运✨)

    本期嘉宾: Newey 纽维(影翎研发负责人)本期Shownotes:

    02:23 纽维的个人经历:八年深耕无人机行业、世界游戏冠军

    02:42 「拓竹创始人陶冶,是我的引路人」

    无人机行业经历了怎样的变迁?

    04:03 2016,Phantom4 与 Mavic Pro,划时代与革命05:40 加入影石:JK 居然向我讲了影石所面临的挑战06:33 无人机的门,是撬不开的吗?

    08:17 无声处起惊雷:定义一个全新品类,全景无人机

    09:07JK会参与研发吗?10:03 团队的精神气质10:42 怎么看A1发布后,影石股价跌了?11:07 切蛋糕、尬舞、创始人的内部信11:50 否认销量遇冷:「我们一定会买得不差」

    13:07 大疆护城河背后:影翎A1背后的研发

    13:28 影石做无人机,是一个十年的决定13:41 A1 身上的世界级创新:249g无人机,飞行摇杆和飞行眼镜15:03 两项传统无人机没有的体验:沉浸体验飞行 & 操作的便捷性15:57 穿越机、航拍无人机与全景无人机的区别18:01 A1 身上不用云台防抖:「一颗球再怎么转动,都是一颗球」

    19:12 无人机新品,最难的是绕开大疆的 100 多项专利?

    从a到b,不是只有一条路大疆的那些天才设计无人机的专利,也并非全是大疆定下来大疆当年,也走过刻苦的创新路

    20:55 产品的四个发展阶段(产品定义、畅游蓝海、市场分化和竞争、逆分化)

    为什么大疆统治无人机十年之久,市场没有进入第三阶段? 尽管毛利高,但无人机不是一个可以随便进入的市场

    25:30 无人机的安全问题

    GoPro 的 Karma ,是一个血的教训A1的前向感知避障,和「不能倒飞」的争议「我们不需要倒飞」如何让市场相信一家后来者公司?谨慎的标称

    30:15 定位:帮助那些有飞行恐惧的新手用户 + 给成熟用户也带去不一样的体验

    31:09 无人机四大研发技术难点,飞控、图传、感知避障和电池

    什么是飞控和图传? 为什么图传是大疆做得最好?为什么图传这么难?

    35:03 供应商被二选一,影翎被独家供应商断供

    38:02 A1 的 BOM(材料供应清单),人本出发、反直觉的设计理念

    为什么飞行眼镜,要有一块外显屏幕?注重连接感 & 分享感JK 的坚持虚拟座舱的玩法:每个人都有自己的《驯龙记》,骑着你的坐骑,飞向天空

    42:12 全景无人机,取材自由,但剪辑更难?「AI 可以自动生成短片」

    43:59 全景会是一个巨大的想象空间,还是一个桎梏?

    无人机行业的南坡和北坡(解决飞行全自动化 & 解决画质) 所有人都在思考终局是什么

    47:44 6799 的价格:「价格战是巨头的特权,我们没有特权,这已是我们最大的诚意」

    49:18 技术上,的确没有无法追赶的;但一直创新,别人就只有跟随

    51:07 「JK很爱玩,给我们带来轻松的气氛」

    51:52 A1 会消失?「我们觉得,我们不会消失」

    54:09 「太难了,太有感触了,能把这件事情做成真的是自信都爆棚了」

    54:47 戴上眼镜那一瞬间,我笃定这件事的价值了

    56:13 鸦雀无声的五秒钟

    57:36 「你应该也看过那个撒钱的新闻…」「上热搜了」

    59:02  时人不识凌云木,直待凌云始道高

    加入听友群👇


    在小宇宙查看该单集文稿
  • 2025 来到了年尾,这是一个中美科技互动的高光年份。

    这期节目,我和中美两地执业律师黄敏达,一起复盘了 2025 中美科技竞争走向及标志性事件,重点分析了反向投资审查规则、Manus 案例,以及华人赴硅谷AI创业潮中的 AB 面。对于创业者来说,这期内容非常值得一听。

    本期节目,由小红书科技特别赞助播出。欢迎前往小红书搜索「诗婕 Jane‘s talk」来与我 AMA 互动~

    本期嘉宾:黄敏达(中国执业律师、美国纽约州、加州、德州执业律师)(公众号:敏大是一只柯基)本期Shownotes: 中国创业者赴美 AI 创业趋势(03:00) OIR 投资审查规则分析(04:30) Manus 案例分析(06:29) 本土美元基金与寒蝉效应(10:44) 华人创业者闯关硅谷的签证与身份问题(30:32) 中美博弈、美国监管思路变化(40:06) 拜登与特朗普政府差异(41:16) 关税战与综合行动(42:20) 安世半导体事件(47:24) 稀土政策影响(52:14) Tiktok 出售问题(54:03) 大疆与 Anthropic 案例(57:29)

    欢迎加入听友群👇

    关于主播:ex 科技媒体主编,早年任职于《人物》、GQ报道、字节跳动。代表作:《ofo的终场战事》、《罗永浩:薛定谔的理想主义》、《朱一旦的枯燥生活》、《中东社交十年风云:金矿、折戟、浪潮再起》、《下一站,沙特》等。作品曾获虎嗅2024年度作者、金字节奖年度新锐作者、网易非虚构文学奖年度作者、全球真实故事奖中文报道十佳。

    有关「商业漫谈」:做最有生命力的科技商业访谈。

    关注AI、全球化,及一切创新进程。


    在小宇宙查看该单集文稿
  • 商漫采访过的许多优秀硬件创业者,都曾提到过 Kickstarter。

    无数个中国品牌和创始团队,都是从Kiskstarter这个众筹平台为起点,走向全球。本期节目,我找到了 Kickstarter 中国区战略代表,彭奕亨 Henri 作为嘉宾。

    Henri 早期也是电动滑板的创业者。十年来,他目睹了一批中国科技企业的成长。从安克、大疆,影石、拓竹、Plaud等,再到今年冒尖的许多新星项目。

    2025 年, Kickstarter 上科技品类的众筹总金额再创新高。上一次历史最高点是2020年,彼时,中国项目在科技类目中占比约30%,而到今年,这个数字已经过半。

    中国硬件的创新故事还在继续,而这段历史中,Kickstarter 一定是一个绕不开的名字。这期节目中,我们梳理了众筹的发展史,回顾了2025现象级众筹项目的诞生,也讨论了包括大疆等一系列标杆性中国硬件企业的决胜之处。

    Ps 特别推荐,Henri 主导在深圳开了一家创新硬件产品体验店「Inno100」,在那里可以体验到 KickStarter 上的新品以及已经跑出来的优秀中国创新产品品牌们。非常好玩~欢迎大家前往体验。

    (店内可以体验激光打印机、激光雕刻等前沿产品,我现场给北北做了两个超级漂亮的冰箱贴嘿嘿~)

    本期嘉宾:彭奕亨 Henri (Kickstarter 中国区战略代表,小红书账号:车和猫)本期shownotes:

    02:53 众筹平台的发展史

    第一阶段(2009-2017),从早期为艺术家提供支持,到与科技产品结合

    第二阶段(2018-2023),贸易战使创业者开始品牌(产品)创新

    第三阶段(2023-至今),疫情后 AI 成为变量,中国项目撑起半壁江山

    08:1 hire from community

    18:46 “历史上只有大疆前和大疆后”

    21:02 早期创业公司选择众筹的利弊

    23:50 「 thos project we love」

    24:36 kickstarter 的算法和「编辑推荐」

    27:47 Ropet (商漫往期第50期嘉宾)如何从 ks 上迈出惊艳一步

    33:15 backer(支持者)能在中国出现吗?

    39:36 AI 的出现,让中国 creator 成为主要玩家

    41:38 4, 676 万美金:中国产品 eufymake 众筹历史破历史纪录!

    47:11 此前历史最高纪录,是一部众筹 4500 万美金的科幻小说

    49:48 2025 , Kickstarter 科技类目创新高

    54:37  “MAD 360” (小米、安克、大疆、影石)四家公司的代表性

    小米:用科技普惠打开全球安克:组织创新反哺行业大疆:「汪滔确实太强了」影石:敢于挑战巨头的勇气不是谁都有

    1:00:18 「汪滔也会让团队学习影石的 marketing 和 branding」(此处抄送JK ,hh)

    1:04:37 2026 ,哪些硬件品类会走红?

    1:08:24 「不上一次 Kickstarter 是人生的遗憾」

    (和 Henri 在深圳XIN科技展上的圆桌。)

    加入听友群👇:


    在小宇宙查看该单集文稿
  • 记得今年六月采访智源院长王仲远时,他的话言简意骇:

    AI 正从数字世界,迈向物理世界。

    这句话紧扣着2025,具身智能浓墨重彩的一年。

    在上周的智源研究院开放日,我受邀主持了一场关于具身硬件的圆桌。(视频版已经上线b站《卫诗婕 商业漫谈Jane's talk》)

    与会的嘉宾阵容十分豪华:智元机器人具身业务总裁姚卯青、原力灵机创始人唐文斌、星源智创始人刘东、北京人形机器人创新中心CTO唐剑、因时机器人创始人蔡颖鹏——凑齐了产学研用供。

    2025 之于具身行业,是虹吸、加速、信仰变强的一年,这一年的狂奔下,2026 更值得期待的是数据和应用场景落地的规模化、端侧算力的突破和具身智能类似ChatGPT的“涌现”时刻。

    非常喜欢嘉宾今天的一句话,模型解锁场景,场景定义硬件。

    这场圆桌也聊到了不少现实问题:

     - 客户愿意为能直接提升效率的成熟方案付费,但不会为更泛化、尚在探索中的AI技术(如大模型)本身买单。这导致AI技术与实际产品落地之间存在鸿沟。 

    - 产品需求端、技术研发端和模型研究端之间存在信息壁垒,导致资源浪费,如各家机构都在重复采集相似的数据。 

    - 仍然是数据获取难、获取成本高。 

    - 市场上不乏一些未解决真实场景问题、未能创造实际价值的“框架订单”,这或许加剧了浮夸风气。

    圆桌时间有限,只有30分钟。但这场圆桌的参与者都是如今中国具身行业最重要的企业,因此还是把这场对话分享给大家~

    本期嘉宾:

    刘东(左二)-星源智创始人

    唐文斌(左三) - 原力灵机创始人

    姚卯青(左四)- 智元机器人具身业务总裁

    唐剑(左五)-北京人形机器人创新中心CTO

    蔡颖鹏(左六)- 因时机器人创始人

    主持人:卫诗婕

    本期Shownotes:

    00:24 2025具身智能行业发展现状

    涌现、虹吸、量产、爆发……是信仰变强的一年,也是稍显浮躁的一年

    04:09 硬件是具身智能的瓶颈吗?

    搬运场景,大脑是瓶颈;灵巧手的场景中,硬件跟不上算法

    科研角度,硬件不是瓶颈;应用角度,硬件仍是瓶颈

    硬件是线性瓶颈,而非线性瓶颈不知何时突破

    模型和数据缺失,软件瓶颈更大

    12:41 模型定义硬件,还是硬件定义模型?

    上层多模态大脑层面,模型定义硬件;下层小脑层面,模型和本体紧密结合

    模型解锁场景,场景定义硬件

    场景和模型从用户角度出发,硬件从工程化角度考虑最优解

    软硬件需要 co-design,行业需要过硬、具公信力的评测集和平台

    24:00 2026,具身领域的关注重点

    端侧算力:期待 2026 国产大算力端侧芯片涌现 数据和应用规模化 具身智能的涌现时刻:当数据量突破一定量,具身智能的scaling 也将迎来涌现时刻 垂直领域落地

    加入听友群👇


    在小宇宙查看该单集文稿