五角大楼密件曝光
「自动化」是具身数据行业的第一竞争力。? ? 作者丨高景辉? ? 编纂丨马晓宁? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?2026年的具身智能赛路,热烈非凡。各家机械人厂商都在秀Demo、拼算力,试图用海量数据教会机械人叠衣服、冲咖啡。但一个狼狈的现实是:我们似乎从未真正教会机械人"看懂"这个世界。绝大无数机械人仍在仿照人类作为的表层轨迹,却不理解为什么拧不开瓶盖时要先擦擦手。这种认知缺失,像极了自动驾驶早期依赖高精地图的逆境——能应酬固定场景,却处置不了充斥不确定性的真实生涯。而故障具身智能真正进入生涯的瓶颈,是数据。没有足够好用的数据,机械人就无法进建和训练,从而无法理解真实的世界。因而,在行业集体陷入"做模型"的巨大叙事时,简智机械人选择去啃一根更幼多、也更苦的骨头:具身数据基建。"行衣凤不缺做模型的公司,缺的是数据,出格是从人类第一视角启程、蕴含思虑与触觉反馈的关环数据。"在简智机械人联创朱雁鸣看来,单纯靠仿照进建在物理AI里跑不通。若是给机械人喂的是不足因果链的"表演数据",训练出的模型往往只是机械的复读机,一旦遭逢长程工作或意表滋扰,就会瞬间崩溃。简智所做的,是一套关于"人"的全维度数据产品。他们自研重新、得手、到全身的高精度数据获取产品,深刻家庭和商超做多包,去捉拿人类不经意的力反馈、多模态感知,甚至并反向分析出其行为背后的思想链。在具身智能的底层逻辑里,数据不仅是燃料,更是构建认知的"第一性道理"。当大无数玩家热衷于"造车"时,简智为什么笃定要去建"电池厂"?未来具身智能的主题壁垒,到底在算法还是在于那套关乎人类行为的"说明书"?答案,远比我们设想的更硬核。01每一条技术路线,都有一个"CTO"雷峰网:先从简智的缔造起头吧,其时缔造公司的初心是什么?朱雁鸣:我们最初对具身智能行业有一种昏黄的周到。智驾自身也是一种具身智能,但更广义的具身智能能够做人类能做的所有事件,是对出产力的底层刷新。所以我们在具身赛路中深刻钻研的时辰,比力想去创造一些差距化的价值,这也是我们选择细分方向时辰的一条准则。我们在2025年7月成立时,更多在复盘整个具身智能产业中有哪些空缺、不及,所以不想盲目追热点。我们细想下来行衣凤不缺做模型的公司,缺的是数据基建,出格是无本体或其他范式下的数据。其时行业还没有大规模崇尚 UMI 或 EGO 概想,更多在通度日动节造急剧出demo,或是用 VLA 的方式训练模型。但我们相信,scale up和数据驱动是智能通往终局的关键蹊径。而对于物理AI他所必要的数据也与之前分歧,文本的世界是结构化的,但3377体育生涯场景每时每刻都在变动,长短结构化的世界,在此之上具身必要的是逐步代替人的能力。我们必要的是从 Human Data(人类行为数据)动手,构建一套从行动到思虑再到反馈的关环数据产品和平台。雷峰网:简智主题团队来自智驾领域,这一布景带来了什么优势?朱雁鸣:重要是认知层面的优势。泛 AI 领域里,真正实现落地的物理 AI 产品就是自动驾驶,其他 AI 落地大多停顿在对话、图像天生层面。自动驾驶是真切实路上跑、服务于人,且在技术上实现了端到端、数据飞轮架构落地,这让我们对数据的 infra 有了深刻认知。第一,模型算法迭代所需的数据,肯定是伴随迭代的人类真实数据。今天具身领域,最必要被突破的方向是的预训练,让模型具备通识、泛化且跨本体的长工作执行能力,并低成本做宽泛的落地。在这个过程中,除了量大之表,更多是让数据"坐标系"与"人理解世界"对齐,这样能力更好的从行为到认知形成关环。并且在这个过程中,好多corner case极度有价值,好比人在操作时辰收到滋扰失败,又怎么去添补的过程,这些是贸易化的必备能力,而这些数据必须通过长功夫的真实世界堆集,而非报答枚举。第二,是对数据关环链路与贸易关环链路结合的思虑。做自动驾驶时,数据成本极度低,由于每一台上路行驶的量产车,都在持续出产数据。但具身智能齐全分歧,它的数据无法天然获取,视频只是最单一的大局,要给模型做持久进建训练,触觉模态、人类思虑链路等信息,无法单纯通过装置摄像头获取。这给了我们底层思虑:要构建可行的数据链路,必须往更深处发力。智驾的数据出产基于已有的车辆,而具身数据的主题基础,是若何占有能让人类在天然生涯中出产全维度数据的设备。第三,是长链路、高并发数据处置的经验。做自动驾驶时,每天回流的数据级别靠近几百 T,大规模数据和行为必要长链路的洗濯流程。这给3377体育主题经验是,数据交付除了做好硬件,更沉要的是应对长链条、大规模交付的能力,这必要在最起头就对硬件、数据链条、数据加工处置方式做齐全的结构化设计。雷峰网:简智此刻团队或许有几多人?研发占比几多?朱雁鸣:规模在140人左右,研发人怨丶比超过85%。雷峰网:具身数据是一个交叉领域,对此简智在组织上有什么调整?朱雁鸣:具身智能必要专业领域人才,更必要领域融合后的综合性创新,数据业务也是如此。所以我们结合各技术领域优势,每个领域预研出一条主线,这条线下的每幼我都是CTO。例如在数采设备上,涉及摄像头、触觉、IMU、磁编码器等,我们有类似CTO的角色做垂线预研,横向则由技术委员会组成,从出产加工到模态再到自动化链条,通过模型驱动拼出齐全规划。成熟行衣凤,一幼我很难全栈把所有事件规划明显,当下的具身数据领域,更必要每个领域都有创新,实现 1+1>2 的成效。雷峰网:简智此刻招人通常会招哪些人?朱雁鸣:我们第一优先级是模型方向的人才,但我们要的模型人才,不是做具身作为输出模型的人才,而是做 data 仿真模型的人才。主题工作是将采集到的人类行为数据,通过模型加工还原成靠近人类整体感触的数据体式,这件事难度很高。我们界说的 human data,主题身分蕴含人的第一视角图像、全身关节活动、手上的触觉,以及每个作为中的力反馈,这些维度能够齐全描述人类绝大无数行为。好比拿起一杯水,蕴含看到水、接触水、拿起时胳膊感触到的力反馈、拧开瓶盖的全流程。这里的主题难点是,每个模态由分歧硬件网络,各硬件有分歧的特点、频率,以及硬件自身个性导致的信息残破,若何把它们还原成统一功夫轴、统一时空坐标系下的齐全数据。单纯靠人为、粗糙的功夫对齐,城市影响数据质量和精度。因而我们尝试用数据基础大模型(data foundation model)解决这个问题:把多模态输入注入模型,像训练自动驾驶端到端模型一样,通过真值系统评测输出与真实世界的匹配度,再凭据 gap 反向优化模型能力。我们是行业内第一家不用大模型做具身作为模型,而是用模型解决数据问题的企业。第二类主题人才,是底层硬件能力有关的人才,蕴含光学、嵌入式软件、PCB 板设计,以及自研触觉规划有关的底层研发人才。我们但愿通过底层道理性创新,提升采集过程中的模态精度。上层数据和模型只能做交叉验证、基于已采集信息提升精度,而数据的底层对错,必要硬件质量来保障,这其中有好多萦绕人类感触的底层道理创新必要做。雷峰网:你们罕见采工厂吗?必要专人治理吗?朱雁鸣:我们选取多包模式,数据来自真实家庭和真实场景,没有效数采工厂方式,这是我们和其他企业不一样的处所,也是我们以为面向终局,大规模、高效采集真实数据的最终蹊径。02人的行为就是真值,人能做出来的作为,机械人就应该能实现雷峰网:具身数据赛路有细分方向,有的只卖数据,有的也卖设备,简智属于哪种?朱雁鸣:我们性质上是一家数据解决规划公司,但会凭据分歧场景提供分歧规划。好多面向 C 端的模型公司,落地场景偏生涯化,这类数据能够公开获取,好比家庭机械人必要的各类家庭场景数据,我们能够通过多包实现,直接给这类客户提供数据规划。另一类客户的场景是封关、自有场景,好比工厂产线、封关尝试室,这类数据无法公开获取,数据所有权性质上在场景利用方手里。针对这类客户,我们会提供硬件设备规划和最高效的本地化部署关环,让他们在自有场景中实现数据采集和出产。雷峰网:有人以为设备是具身数据公司的主题壁垒,卖了设备别人就不买数据了,你们怎么看?朱雁鸣:首先,数据和设备都很沉要。设备是基建中的最底层,它决定了数据的模态数量、底层模态质量,设备的便捷性、成本,也决定了数据采集的规;芰,但我不以为设备就是全数。数据最终是服务于模型的,模型必要的不是单纯的视频,也不是多模态数据的单一打包,绝大无数主题工作,都产生在采集后的数据加工处置环节。此刻绝大无数模型公司,哪怕是做预训练,都极端钻营数据质量,数据质量会从底层影响模型的成效、精度、以及对因果关系的认知。好比若是产生在餐馆,人会思考是不是避让其他人的移动、绕开一些饭菜,若是只有作为表层的标注也是不够的,背后都有齐全的因果驱动,我们必要给模型提供串联好全模态、浓密的COT过程,能力给模型提供有效的参考,让它更容易进建。另一个主题原因是规;。大批量设备采集的大批量数据,若何急剧、高效、低成本地转化成可训练的 Token,才是主题难题,出产 100 台设备和 100 万台设备,是齐全分歧的难度。雷峰网:刚刚提到家庭多包,具体是一种怎么的合作方式?朱雁鸣:我们在多包模式上的运作很像 C 端公司。我们自己做了一款 APP,把设备给到每个家庭,用户通过 APP 相识采集工作,用3377体育设备实现正常的家务作为即可,不必要对用户的操作做额表的教育和约束,用户的天然操作对模型来说反而更有价值,模型必要进建多样化的人类行为,能力补充场景盲点,因而行为上传后我们通过云端来鉴别、标注。另表3377体育设备在人机工程上也有显著优势,极度轻便,使用效能和人类正常干活的效能根基一致。用户实现操作后,通过 APP 上传采集的数据,我们基于数据回收情况给用户结算,整个流程天然且高效。雷峰网:有没有工业或贸易场景的多包?朱雁鸣:有的。目前50%是家庭,30%是商超和工厂,10%是物流,剩下的10%是医疗、尝试室等分拆档景。雷峰网:场景方会有隐衷顾虑吗?朱雁鸣:这个问题我们有美满的解决规划。首先,所罕见据的隐衷处置,都有一套尺度化流程,蕴含地址、人脸、对方知识产权有关的信息,城市在数据售卖前实现脱敏处置,这是数据公司的基础使命。第二,我们和每一个场景方、采集方合作时,城市在合作和谈和用度注明里,明确标注双方的权势归属,我们获取的不是用户的幼我信息,而是其在场景下的行为和操作数据,自身不会涉及过多幼我隐衷数据。雷峰网:多包没有尺度化流程,数据质量会不会参差不齐,给后期处置带来压力?朱雁鸣:由于我们崇尚人的行为其实都是"真值",终于无论什么情况,人都是能够克服难题实现工作。因而关键在于真值上传后,是否有一套自动化的方式实现数据鉴别与处置。3377体育自动化鉴别,主题是把人的行为和作为做对齐,进行详细化的标注、分类,而非判定人的行为对错;褂兄始旎方,主题是对人的操作行为做分类,而非抛弃数据。我们会分辨高速高效实现的作为、有滋扰场景下实现的作为、失败后实现纠错的作为,同时对数据做颗粒度极细的原子化处置,以适配模型分歧训练阶段的需要。雷峰网:你们的海表收入占比挺高的,你们在出海过程中有遇到哪些故障?朱雁鸣:海表模型公司对数据的要求极度高,目前海表模型公司在模型训练上的进展整体快于国内,他们对触觉模态、训练数据的体量规模、多样性的要求极度严格,同时要求3377体育迭代速度能匹配他们模型的进展。雷峰网:随着数据量增长,存储和算力会有压力吗?朱雁鸣:注定会有,但这件事我们很早就有预判,由于数据飞轮的沉要成分就是"数据流转效能",对此我们从源头做了三层解决规划:第一,端侧的数据压缩与质检。3377体育每一台设备,在采集端就具备数据质检能力,能凭据人的行为、场景的特殊情况,自动抛弃无效数据,预防无效数据占用传输链路和存储空间。第二,行业当先的无损压缩能力。我们在压缩比例和对训练成效的影响上,做到了行业综