Эпизоды

  • ERA-42中的“Era”代表新的纪元,象征着公司致力于开启机器人技术的新时代,是“Robot Era星动纪元”的延续。而“42”这一数字则源自经典科幻作品《银河系漫游指南》中的一个梗,寓意着“宇宙的终极答案”。

    星动纪元是北京清华系的一家人形机器人创业公司,成立于2023年下半年,创业初期市场普遍认为这也是一家以机器人本体和下肢运动控制能力为主的创业公司,亮点只是在于用强化学习进行控制,直到最近公司陆续发布了灵巧手以及ERA-42机器人大模型完成丰富的操作任务,才让大家认识到了公司完整的软硬件技术实力和快速的迭代能力,今天有幸邀请到星动纪元创始人陈建宇教授跟我们分享他们是如何做到这一切的。

    陈建宇目前是清华大学跨学科信息科学研究院(IIIS)的助理教授。在此之前,他曾在加利福尼亚大学伯克利分校与Tomizuka教授合作,并于2020年获得博士学位。他于2015年获得清华大学的本科学位。陈建宇的研究工作聚焦于人工智能与机器人学的交叉领域,旨在构建高性能、高智能的先进机器人系统,研究兴趣包括强化学习、机器人学、控制理论和自动驾驶。

    本期节目由嘉宾主持Tim来Host。

    播客文字整理可以在ReSpark同名公众号《ReSpark》上查看(文字可能有滞后)。

  • 机器人赛道的投资机会在国内已经有十几年的历史,但在这个方向上,能够做到有业绩、有认知,并且长期深耕的投资人并不多。在我看来,陈哲(Peter)就是其中做得非常出色的一位。在当前资本寒冬的背景下,陈哲刚刚成立了一只新基金——Alphaist Partners。我非常荣幸能够在他新基金成立之际,和他进行这次对谈,让我们来听听陈哲在机器人领域的投资经验,对当下具身智能的独到见解,以及他给新基金会支持的创业者们的寄语。

    陈哲(Peter)是一位工程师出身的投资人。他高中毕业后前往加拿大留学,完成了电子工程的本科和研究生学业。毕业后,他的职业生涯从黑莓开始,主要从事智能手机通信相关的工作。之后,他前往硅谷,加入了Google,成为Google Glass团队的一员,专注于嵌入式系统和信号处理领域。

    2016年,陈哲前往哈佛大学攻读MBA。在MBA期间,他选择回到国内,并加入了晨兴资本(后更名为五源资本),正式开启了风险投资(VC)的职业生涯。他在五源资本一直工作到2024年底,期间专注于AI和机器人领域的投资。

    陈哲对机器人领域的关注始于自动驾驶领域,他曾主导投资了多家优秀公司,并密切关注技术的拓展与衍生场景。见证了自动驾驶技术外溢到其他场景的趋势,包括小米投资的石头科技推出的单线激光雷达扫地机器人,以及大疆推出的带有视觉避障功能的消费级无人机,从2017年到2018年,他开始密集布局机器人领域的投资。

    如今,陈哲成立了一家新的早期美元基金Alphaist Partners,继续聚焦于AI和机器人方向的投资。

    可以关注小宇宙APP搜索ReSpark,或者苹果Podcast搜索ReSpark收听播客栏目。

    00:54自我介绍及新基金

    第一部分:机器人行业投资经验

    05:10 过去10几年机器人行业投资的观察

    10:30 对机器人方向创业和投资有可能会大成的心得是什么?

    12:40 机器人2B和2C领域的企业成功的特质是什么?

    14:50 怎么看2B和2C机器人企业的空间?

    第二部分:当下具身智能赛道的投资观察

    19:40 过往两年,作为机器人赛道的顶级投资人感受是什么?

    23:35 怎么理解这波机器人的技术变量?

    26:32 怎么期待技术的落地?

    31:25 可否总结通用操作创业公司的技术路径?

    37:00 怎么看只做具身模型的创业?

    42:55 关于机器人数据,怎么看机器人数据相关的创业?

    48:00 怎么看具身智能可能的落地场景?

    57:00 怎么看待通用机器人的终极场景?

    第三部分:关于工作方法和新基金

    59:40 如何做到一直以来对机器人领域前沿进展保持紧密跟踪?

    62:35 推荐的内容

    68:05 新基金的寄语

    本期节目的文字总结可以关注公众号《石麻笔记》或ReSpark同名公众号《ReSpark》查看。也可以通过[email protected]联系Peter。

  • Пропущенные эпизоды?

    Нажмите здесь, чтобы обновить ленту.

  • 卢策吾,作为中国具身智能领域的先行者之一,他的职业生涯起步于2002年,学习通信与信息系统,并在中科院和香港中文大学深造,逐步为后来的具身智能研究打下基础。他认为,尽管自己跨越了多个领域,但信息学科培养的全局视野和严谨思维对他后来的研究至关重要。

    2013年,他开始研究三维视觉,探索如何将二维图像与三维物理世界结合,为机器人智能的突破奠定了基础。2015到2016年,他在斯坦福大学AI实验室工作,参与具身智能的前沿探索,尽管当时该领域的关注度较低,但他与团队依然保持着热情与创新。

    回国后,卢策吾成为上海交通大学的教授,并与王世全共同创办了“非夕科技”,这段创业经历为他后来的穹彻智能奠定了基础。他认为,从科研到产业化的转变,要求高水平的综合素质,而这种从实践中获得的经验,让他更深刻理解整个技术闭环。

    如今,卢策吾不仅是中国具身智能领域的领军人物,也在推动AI与机器人技术融合方面取得了显著成果。他的目标是让机器人更好地融入人类生活,成为真正的合作伙伴。

    本期的嘉宾主持是穹彻的投资人Tim。

    时间线

    01:55 第一节:个人经历

    1. 学术经历

    2. 非夕经历

    15:31 第二节:穹彻智能

    3. 穹彻的数据路线

    4. 如何采集机器人数据

    5. 机器人开源数据集

    6. 机器人的力控

    7. 穹彻的具身基座模型

    8. 穹彻大脑的进展

    9. 长程任务如何解决

    10. 怎么适应多种硬件

    11. 视觉-触觉融合

    12. 怎么看商业落地

  • 《机器人五号》(Short Circuit)讲述了一个军事机器人被雷击后获得自我意识,开始探索世界的故事。影片中的机器人充满了情感和好奇心,甚至能够模仿人类的行为和思考,这种突破性的设想触动了儿时的来杰。作为星尘的创始人,他现在终于有机会去创造“真正的智能”,“将所有的信息在某个高维空间对齐”,让机器人不再仅仅是执行命令的工具,而成为能够理解环境、感知情感、自主学习的生命体。

    来杰的故事始于2009年左右,当时的他并未立即踏上如今这条充满前瞻性与突破性的创业之路。作为一名年轻的工程师,来杰早期的工作集中在传统控制领域,那个时候,他还未意识到AI与机器人将成为他未来的舞台。随着时间的推移,他逐渐在强化学习的研究中找到了新的方向,并开始探索如些算法应用于运动控制的场景。

    2014年,百度宣布全面加大AI投资,来杰敏锐地捕捉到了这一波变革的信号。他加入百度,参与了机器人团队的建设。当时的百度在自然语言处理(NLP)领域取得了一定的进展。来杰在团队中不仅承担着机器人相关的研究任务,也在思考一个更大的问题:AI与机器人结合的未来到底会走向何方?他深刻意识到,尽管AI的飞速发展为行业带来了许多突破,但机器人技术的进步却相对滞后。

    2018年,经过深思熟虑,来杰做出了一个重要的决定——辞去百度的工作,加入腾讯,成为腾讯机器人实验室的最早期的成员。在张正友教授的带领下,来杰和Robitics X团队成员,围绕ai与机器人开始了更加深入的探索。张正友教授曾经预言,机器人与AI的融合将迎来一场革命,这一切将远远超出我们现在的认知,这也成为来杰后来的创业原动力。

    2022年,对于来杰来说,是一个复杂的年份,也是他职业生涯的一个重大转折点。他和戴媛决定出来创业,成立了星尘。星尘的目标是明确的——AI与机器人的融合,是“50年一遇”的机会,类似于当年PC行业硬件与软件结合所带来的革命性突破。两年多的时间里,星尘秉承“Design for AI”的设计理念,致力于打造更加贴近人类形态、具备精细力控能力以及高效触觉反馈系统的机器人。这一切努力都是为了让机器人能够更好地融入我们的生活,构建起一种前所未有的新型关系。

    夜幕降临,当星光洒落在南沙和中山那片远离城市喧嚣的土地上时,来杰常常会带着他的望远镜仰望星空。那里有无数个未解之谜等待被揭开,也有着关于头顶这片浩渺宇宙最纯粹的梦想。

    “某一天,当机器人完成绕月一周的任务时,所有人都会抬头看向天际,去感受宇宙的浩渺与神秘。这个时刻会激发人们对于未知的幻想和期待,这就是人类最大的一种情感与渴望。而我们做机器人,就是希望能让人们实现这一点,帮助人类拓宽视野,探索更多的可能。虽然现在大家可能不相信,甚至觉得遥不可及,但某一天,大家会开始相信、看到、感受到。机器人在某种程度上释放了人类的创造力和好奇心,这是我们真正追求的价值....”

    ReSpark 邀请了星尘智能的创始人来杰和种子轮投资人德迅资本的Ted 作为本期访谈的嘉宾,播客内容非常精彩。

    Ted,来自德迅的投资人,Vandy毕业,流体力学工程师cover硬件领域(机器人/消费科技),滑雪爱好者,碳水爱好者,喜欢狗狗/二次元和一切阳光美好的事物,业余吉他手和演奏级古典萨克斯,相信工科直男改变世界!过往投资案例:星尘智能/极壳/若创/时的科技/纵贯创新/享刻/Airdroid

    如果你在AI硬件领域创业,可以已联系来杰的“真天使”,非常Cool非常Chill的Ted(Wechat:teddy370471)

    播客目录

    01:30 来杰自我介绍

    06:58 Ted自我介绍

    12:00 为什么在2022年那么早的时间点看到具身智能的机会?

    17:04 目前行业的进展和两年前的预期有什么不同?

    21:34 在全球具身智能的竞争格局上,星尘在什么位置上?

    28:05 机器人行业会是一个五十年一遇的大机遇,甚过电脑和手机行业。

    32:32 Design for AI的机器人应该有什么特征?

    40:40 如果和PC时代类比的话,怎么看现在智能机器人在什么时间点?

    45:10 智能机器人短、中、长期的预期是什么样子?

    51:41 短期内机器人的落地预期:机器人的网吧和游戏

    54:20 工业场景的机器人怎么落地

    56:00 可以提供情绪价值的娱乐性机器人

    60:20 世界模型和机器人数据

    66:10 创业感悟

    67:20 《认知神经科学》

    69:15 来杰与Ted的惺惺相惜

    71:24 看星星的兴趣

    75:00 对机器人的热爱源于哪里?

    访谈中提到的电影:《 Short Circuit》(《机器人五号》)

    访谈中提到的书籍:《认知神经科学》

    欢迎关注ReSpark同名公众号ReSpark查看访谈文字。ReSpark是几位看AI、机器人方向的投资人伙伴共创的栏目,我们希望能够在技术变革的大时代下,从现在开始记录,记录那些推进这个领域前进的学者、创业者、投资人在不同阶段的成果、故事和心路历程。

    欢迎联系播客主页的三位主理人:

    Cindy 投资人(Wechat: cindyxin0223)

    Jamie 投资人(Wechat:Jamie_wang_7)

    Lin 媒体人(Wechat:scghmd)

    When intelligence reshapes reality, the future sparks now!Welcome to Respark!

  • 在具身智能爆火2年之后,在2024年的年尾,我们聊一个理想很丰满但现实很骨感的问题:具身智能可靠性!这次论坛,我们邀请了在解决可靠性问题最有机会的两条路线,RL和model based control的代表性学者,来一起交流如何将机器人可靠性逼进99.9x%大关。

    这期栏目是一个在线Panel的录音,邀请到的嘉宾是(嘉宾介绍以姓氏拼音顺序):

    罗剑岚是伯克利人工智能研究(BAIR)实验室的博士后学者,与Sergey Levine教授合作。2022年回到学术界全职工作之前,他在Google [X]担任研究员,与Stefan Schaal教授合作了两年。他于2020年在加州大学伯克利分校获得硕士和博士学位,还曾在DeepMind和Everyday Robots工作过。罗剑岚在强化学习+真机这条路线上持续深耕七八年,也于近期推出强化学习+真机这条路线上非常有代表性的两篇工作SERL和HiI SERL。

    卢宗青现任北京大学计算机学院长聘副教授,国家级青年人才,智源学者。主要研究方向是强化学习、多模态大模型、通用智能体。旨在赋予智能体自主获取技能、决策与推理能力,在开放世界中完成复杂任务、合作和交流,迈向通用人工智能。

    石冠亚是卡内基梅隆大学(CMU)机器人研究所和计算机科学学院的助理教授,领导 LeCAR 实验室(Learning and Control for AgileRobotics),于2022年在加州理工学院(Caltech)完成博士学位:导师为Soon-Jo Chung和Yisong Yue。2017年,他获得清华大学工学学士学位。从2022年到2023年,他在华盛顿大学保罗·G·艾伦计算机科学与工程学院担任博士后学者,与Byron Boots合作。

    朱秋国是云深处创始人兼CEO,同时也是浙江大学控制科学与工程学院副教授,主要研究领域为仿生机器人和机器智能,主持研制人形机器人“悟空”、四足机器人“绝影"以及四轮足机器人“山猫"。他于2008年获得浙江大学机械工程学士学位,2011年和2020年分别获得浙江大学控制科学与工程硕士和博士学位。他也是云深处科技(DEEP Robotics)的创始人,云深处是全球四足机器人行业应用的引领者,自主研发的“绝影"系列机器人在国际同类产品中已经达到先进水平,并率先在电力、消防、隧道、安防等领域投入使用。

    播客目录:

    01:00 嘉宾介绍

    04:30 在智能机器人浪潮来临之前就选择了这个方向,浪潮来临前后的感受

    14:16 RL和Control之于Locomotion

    15:20 石冠亚:如何将RL和Control结合

    26:20 朱秋国:RL和Control在产业和学术方面的应用

    33:05 卢宗青:RL对人形机器人的控制

    37:00 罗剑岚:RL+真机

    48:00 石冠亚:Leaning在操作上的路径怎么看

    55:22 罗剑岚:Leaning在操作上的路径对比

    69:00 对人形机器人的控制什么时候可以达到可靠

    69:30 卢宗青:基于RL的路线做人形控制结合真机数据

    73:20 卢宗青:人形达到99%可靠性需要多久?

    76:20 朱秋国:目前行业应用的可靠性如何?人形什么时候可以达到今天四足的可靠性?

    83:00 石冠亚:现在人形机器人的控制迭代速度如何看待?

    91:27 RL的算法是否应该对机器人领域做一些理论的创新?

    101:40 对机器人方向的学生如何调节迷茫期?

    罗剑岚主页:https://people.eecs.berkeley.edu/~jianlanluo/

    石冠亚主页:https://www.gshi.me/

    朱秋国主页:https://person.zju.edu.cn/0011353/657053.html

    云深处主页:https://www.deeprobotics.cn/

    卢宗青主页:https://www.ai.pku.edu.cn/info/1139/2783.htm

    访谈中提到的工作:Diffusion Policy、Hil-SERL、SERL、H2O、OmniH2O、ABS、AnyCar等,可以过几天查看石麻笔记公众号,会有具体查看访谈的总结,会有更多关于论文以及方法的细节。

    因为是学术访谈,并且嘉宾很多在海外,所以涉及很多学术名词会用英文表达。这里简单罗列一些英文名词:

    RL:Reinforcement Learning 强化学习

    Control:控制,特指基于模型的控制(Model Based Control)

    Humanoid:人形机器人

    Sim:仿真,是一种机器人训练常用的仿真器

    Sim2Real:仿真到现实,虚拟到现实的转化

    欢迎关注ReSpark同名公众号ReSpark,记录AI和物理世界融合过程中的精彩商业访谈内容。欢迎关注石麻笔记,记录AI和物理世界融合的学术成果。

  • 随着具身智能在国内的关注度快速提高,两年前还非常冷门的AI Robotics如今已经成为产业界和学界关注度最高的话题。我相信两三年后,国内会有越来越多在这个领域世界级的工作出现,人才密度也会快速提升。但在今天,我们不得不承认的一个现实问题是,国内高质量的AI Robotics学术人才是比机器人数据更稀缺的要素。

    真实机器人数据通过堆人堆钱是可以快速解决的,但人才的培养需要时间。在机器人学习领域,有一个非常有意思的现象是,全世界范围内,最顶级的论文常常出自华人学者。可以说华人学者引领着AI Robotics这个领域的发展,但反观国内,因为代际差异和学术重点的不同,目前真的非常缺少AI Robotics领域有经验的学者。AI Robotics国内人才的话题也是我一直想来探讨,借着这个话题,我非常荣幸的邀请到了两位即将毕业的国内本土培养的AI Robotics方向博士生来探讨一些他们的研究方向,中美学术代际差异,具身大模型路径等问题。

    汶川是清华大学交叉信息研究院(IIIS)的博士五年级学生,导师是高阳教授。他从2019年开始跟随高阳老师进行相关研究,主要专注于端到端的模仿学习,探讨如何融合不同来源的数据,以提升具身智能系统的性能和鲁棒性,从而实现高效、安全的智能系统。

    吕峻是上海交通大学的博士四年级学生,导师是卢策吾教授。他的研究路径是基于仿真来学习机器人智能,目标是开发能够在现实世界中执行各种任务的机器人,以解决人类在生产和生活中面临的问题。

    时间线:

    00:30 吕峻博士求学经历和研究方向

    01:33 汶川博士求学经历和研究方向

    03:08 当初为什么选AI机器人这个方向作为博士研究方向?

    07:40 为什么AI机器人在北美会比国内早这么多年热起来?

    09:15 国内近几年在AI机器人领域的进展主要由什么因素刺激?12:27 中美在AI机器人领域的代际差异如何?

    17:57 关于发顶会

    19:20 汶川研究方向详细介绍

    25:13 吕峻研究方向详细介绍

    31:23 仿真未来发展的挑战有哪些

    34:40 模仿学习的挑战有哪些

    38:00 怎么看数据融合?

    47:00 具身大模型框架有哪些

    (这个时间轴梳理有更自动的方法吗?)

    吕峻博士主页:https://lyuj1998.github.io/

    汶川博士主页:https://alvinwen428.github.io/

    主播:Jamie

    非专业剪辑,正在寻找给力的播客剪辑小伙伴,欢迎留言联系。

  • 大家好,欢迎来到SOTA!这是一档分享AI机器人领域最前沿的产业和学术动态的播客,我是Jamie!

    这期节目我们非常荣幸的邀请到了四位具身智能领域优秀的企业家和学者探讨具身智能领域的热门话题。四位嘉宾包括Covariant的联合创始人兼CEO 陈曦(Peter Chen),UCSD助理教授王小龙,清华大学交叉信息研究院助理教授许华哲,和云深处创始人朱秋国。

    嘉宾介绍:

    陈曦(Peter Chen)是Covariant.ai的首席执行官兼联合创始人。Covariant是一家领先的AI机器人初创公司,已经融资超过2亿美元。Covariant正在构建用于机器人学的基础模型,使机器人可以对物理环境进行识别、推理和操作。在创办Covariant之前,陈曦(Peter Chen)曾是OpenAI的研究科学家,也是加州大学伯克利分校人工智能研究实验室(BAIR Lab)的研究员,他专注于强化学习、元学习和无监督学习。Peter在领先的学术期刊上发表了30多篇论文,引用超过2万次。

    朱秋国是云深处创始人兼CEO ,同时也是浙江大学控制科学与工程学院副教授,主要研究领域为仿生机器人和机器智能,主持研制人形机器人“悟空”和四足机器人“绝影”。承担国家重点研发项目、国家自然科学基金等项目10余项,发表学术论文40余篇,授权发明专利40余项。云深处科技(DEEP Robotics)是全球四足机器人行业应用的引领者,自主研发的“绝影”系列机器人在国际同类产品中已经达到先进水平,并率先在电力、消防、隧道、安防等领域投入使用。

    王小龙是加州大学圣迭戈分校(UCSD)电子工程系的助理教授,同时隶属于TILOS NSF人工智能研究所。他在卡内基梅隆大学(CMU)获得机器人学博士学位,并在加州大学伯克利分校进行博士后研究。他的研究聚焦于计算机视觉和机器人学的交叉领域。他特别关注从视频和物理机器人交互数据中学习3D和动态表示。这些综合表示被用于促进机器人技能的学习,旨在使机器人能够在真实物理世界中与各种对象和环境有效交互。他获得了NSF CAREER奖、Intel Rising Star Faculty奖,以及来自Sony、Amazon、Adobe和Cisco的研究奖励。

    许华哲博士现为清华大学交叉信息研究院助理教授,博导,清华大学具身智能实验室负责人。博士后就读于斯坦福大学,博士毕业于加州大学伯克利分校。其研究领域是具身人工智能(Embodied AI)的理论、算法与应用,具体研究方向包括深度强化学习、机器人学、基于感知的控制(Sensorimotor)等。其科研围绕具身人工智能的关键环节,系统性地研究了视觉深度强化学习在决策中的理论、模仿学习中的算法设计和高维视觉预测中的模型和应用,对解决具身人工智能领域中数据效率低和泛化能力弱等核心问题做出多项贡献。顶级智能机器人会议CoRL'23最佳系统论文得主,在IJRR, RSS,NeurIPS等发表顶级期刊/会议论文四十余篇,代表性工作曾被MIT Tech Review,Stanford HAI等媒体报道。曾在IJCAI2023、IJCAI2024、ICRA2024担任领域主席/副主编。

  • 大家好,欢迎来到SOTA!这是一档分享AI机器人领域最前沿的产业和学术动态的播客,我是Jamie!

    这期节目我们来聊一聊具身智能模拟器simulator。我也非常荣幸的邀请到了机器人模拟器开源项目simulately的发起人之一耿浩然和主要参与者之一秦誉哲进行访谈。

    耿浩然是北京大学图灵班20级本科生,同时也是2023年北京大学年度人物,他从大一开始在北大王鹤老师的具身智能团队进行科研实习,他科研成果突出,作为本科生在 CV和机器人顶会上发表了多篇论文。

    ​秦誉哲是加利福尼亚大学圣地亚哥分校(UCSD)的博士生,由王小龙和苏昊教授共同指导,本科毕业于上海交大。他的研究领域涉及使用五指手进行灵巧操纵、3D感知以及强化学习(RL)和模仿学习(IL)。

    00:02:56:为什么会做Simulately

    00:04:59:Simulately之后的迭代

    00:10:03:机器人模拟器目前的生态格局是什么样子

    00:15:04:做一个好的Simulator最大的挑战是什么

    00:20:07:强化学习和模仿学习对Simulator的选择有什么不同?

    00:25:08:如何解决Sim2Real Gap问题

    00:30:11:模仿学习和强化学习哪条路更可行?

    00:35:07:Anyteleo遥操作为什么也需要模拟器?

    00:40:11:模仿学习可以你直接部署的真机上吗?

    00:45:16:目前常见的物理引擎对比

    00:50:19:3D生成和模拟器的关系

    00:55:21:触觉在操作上的必要性