马斯克称OpenAI是自己的创意现任CEO奥尔特曼是“幼偷”
" 人类智能 = 推理 + 持久影象 "。当 AI 推理能力的较量进入白热化,整个行业起头意识到:infra 层面的影象缺失,正成为限度 AI 走向个性化与自进化的最大瓶颈。没有持久影象的 Agent,就像一个固然考上了清华、但每天醒来都不意识亲妈的天才。而大量涌入影象赛路的公司,好多性质上只是在做向量数据库,把数据存起来,等人来检索。EverMind 想做点不一样的。这家由盛大集团孵化的公司,定位是为所有 AI Agent 提供一个通用的 " 影象层 "(Memory Layer)。它的主题产品 EverOS 是一套开源的持久影象系统,开发者能够把它接入自己的 Agent,让 AI 不仅能记住用户的汗青对话和偏好,还能像人一样对影象进行整顿、更新,甚至从从前的经验中进建和进化。EverMind 的 CEO 邓亚峰,是一位在 AI 领域深耕二十余年的老兵。他毕业于清华大学,曾任 360 集团副总裁兼 AI 钻研院院长、格灵深瞳 CTO,在推算机视觉、多模态 AI 和 AI 造药等领域深耕多年。2025 年,他参与盛大,带队从零启动 EverMind 的持久影象项目。团队仅用四个月就在多项影象评测上达到了 SOTA。我们与邓亚峰进行了一次对话,聊了聊他为什么押注持久影象,以及这项技术到底要解决什么问题。以下是对话实录,为阅读履历稍作编纂。为什么是 Long-term Memory(LTM)硅星人:在视觉、多模态、AI 造药这些领域都做到过很好的成就之后,您是怎么锁定 " 持久影象 " 这个方向的?邓亚峰:做 AI 造药的时辰我最大的体味是,当数据产生得慢、不能急剧迭代,技术进取就是有限的。所以之后选方向,我就想找一个能急剧做数据迭代关环的领域。也思考过机械人,但落地周期太长、数据获取难题。转向说话模型之后,又面对大模型在吞噬所有的问题。OpenAI、Anthropic 车轮滔滔,创业公司的空间越来越幼,必须找到一个有独个性的细分赛路。持久影象刚好满足这几个前提:它是下一代 AI 的必备个性,钻研得很少,跟推理能力相对正交,有很强的战术独立性。当使剽个方向相对冷门,各人还在做 LLM 模型、Agent、post-training,但我以为没有影象职能的 Agent,用户履历肯定是受限的。今天这已经成了行业共识。盛大这边的视角也很怪异。陈天桥先生从前十多年一向在 sponsor 脑科学和 mental health 的钻研,对人类智能的机造机理极度感兴致。这几年 AI 的发展让他起头思虑一个问题:人类智能刚好能够简化为 " 推理 + 持久影象 ",推理这一半已经有无数巨头在卷了,持久影象是不是一个极具战术独立性的方向?这个判断和我自己的思虑刚好吻合。硅星人:在您看来,Long-term Memory 到底要解决什么主题问题?邓亚峰:三件事。第一,突破有限的高低文长度。此刻模型高低文窗口根基到了 1M token,但影象数据量超过这个限度就没法用了。现有的 RAG 或压缩规划都是工程妥协,不是最优解。我们做 memory,性质上是助模型更好地治理高低文,在极高压缩率、低 token 亏损的前提下,让模型有效利用无限的汗青信息。第二,实现真正的个性化。人在互换中会为对方成立 profile:身份、偏好、价值观、说话风格、指标。LTM 就是助 Agent 构建和守护这样的用户画像,交互越多越懂你。当然,LTM 的个性化设置不仅限于 Profile Memory。第三,Self-evolving,自进化。今天的 AI 靠 offline training 提升能力,在和用户交互的过程中并不会变得更聪明。我以为下一代 AI 肯定是在交互中进建的,是一种 online learning。Long-term Memory 是实现自进化的关键:通过纪录和分析交互的成功与失败,总结最佳实际,知识和思虑方式都随之进取。这三件事和人类进化出持久影象的道理是一样的。远古时期,哪里水草丰茂你要记住,哪里有危险你也要记住,同时你还要凭据季节和气象去预测未来,这片草地会变得更湿润还是会发洪水。并且钻研批注,持久影象援手人类组织训练样本,把分歧经验分类聚合,所以人的泛化能力远强于模型。模型是把所罕见据不做分辨地抛进去训练,很容易过拟合,或无差距求概率。人脑的持久影象机造让进建更有结构,泛化更强。AI 的 Long-term Memory 要做的,性质上也是这件事。Memory Layer 和 Agent 层硅星人:您提到的个性化和自进化,听起来更像 Agent 利用层的职能,不像 infra layer 能做的事?邓亚峰:这是一个很好的点。Infra layer 能做一部门。我们最近在做一个即将开源的 feature,基于 memory 的自进化。分歧 Agent 把运行的 trace 放到我的 memory 里,我能够凭据成功和失败的经验去总结最佳 SOP。好比你做了一个工作成功了,我做了一个类似的工作失败了,当我把大量用户的经验堆集下来,就能够 learn from experience。这在影象层是能够做到的。若是想做得更深,好比基于用户反馈做强化进建,那的确必要 Agent 层和 Memory Layer 协同。但 Memory Layer 在其中表演关键角色:助 Agent 层组织数据,就像人脑持久影象辅助进建的机造一样。硅星人:在您看来,接入 Memory Layer,Agent 最直观的智能提升体此刻哪?邓亚峰:四个维度。第一是效能,token 的极致压缩。这对节造成本至关沉要。若是3377体育产品能让 token 数极端降落,这件事的贸易价值是极度大的。第二是成功率。我们做了基于 skill 的自进化机造,Agent 能够从从前经验中进建,某些指标实测提升了 234.8%。好比你昨天用一个职能可能还会失败,但这两天有几幼我也用过了,系统学到了其中成功的经验之后,你今天再用就成功了。系统会变得越来越好。第三是个性化。分歧用户有分歧的高低文和影象,每幼我的副手履历都唯一无二。我们内部有个 AI Native 的合作平台叫 Tanka,提供基于持久影象的 AI 副手。背后的 LLM 和推理技术是一样的,但由于每幼我的影象分歧,聊出来的成效就齐全不一样。第四是自动性。纪录了用户的行为汗青之后,Agent 能够预测下一步需要。好比我知路你每天这个时辰要买杯咖啡,我就能够提前提醒你。再进一步,我甚至能够提前把事件做了,再问你 " 这是不是你要的了局?" 就像一个能预判需要的好员工,你没有 assign 的工作他已经做完了。影象怎么更新,怎么 " 健忘 "硅星人:我用 GPT 时时遇到这个问题:我的生涯已经更新了,但它对我的理解还停在之前。好比之前跟它聊过的人事物,在我现阶段的生涯里已经不沉要了,但它还总是提起,就让人感触很烦。EverMind 怎么处置影象的矛盾和过期信息?邓亚峰:3377体育机造分两步:在线提。∣nline Memory Extraction)和离线进化(Offline Memory Evolution)。在线提取,信息进来后做 boundary detection,把统一 topic 的内容聚到一路,提取事实性的情景影象(episodic memory),再预测这个事实对未来的影响,我们叫 forecast。影象不只是存档,要能服务于未来的决策。离线进化,系统定期做几件事:在更大领域信息上提炼用户 profile;做反思和刷新,有点像 Claude Code 里 "dream" 做的事,让模型回头审视之前的判断对不合;还有处置影象更新,通过影象聚类战术(merge),把类似话题聚在一路,矛盾信息按功夫线用最新的做 update。忘却率直讲是更难的。Update 相对容易,用最新的信息代替老的就行。但忘却有一个周期性的问题:你昨天提到一幼我,系统感触他沉要;一星期前呢?一个月前呢?是不是就该忘了?我们此刻是在离线战术中把每条信息的功夫放进去,结合3377体育预测未来职能,让模型自己去揣摩这条信息的时效性。率直说,在当前这个功夫点还没有做到极度梦想,但我以为它是一个会被逐步解决的问题。我的判断是:AI 的 " 忘却 " 不应该是物理删除,数据存在磁盘上不贵,而是一种权沉调整战术。近期信息权沉高,远期信息权沉低,但必要时仍能找回。人类为什么必要忘却?两个原因:一是人脑是低能耗系统,记太多器材能耗扛不;二是你必要基于近期信息做决策和预测。AI 不存在第一个限度,它只必要在决策中把时效性和沉要性合理思考进去。从这个角度说,AI 的忘却机造现实上能够比人类更优?瓷氪蟪Ь赫栊侨耍篍verOS 已经在 GitHub 上开源。但 OpenAI、Anthropic 也都有自己的影象职能,用户已经堆集了好多偏好数据在他们的平台上。第三方 Memory Layer 怎么找到自己的地位?邓亚峰:3377体育定位是做一个 memory layer for agents,未来所有 Agent 都必要影象职能,但没必要每个团队都自己建一套 infra。我们但愿成为那个协议数。大厂肯定会做影象,但第三方影象层的空间来自一个单一事实:用户不会只用一个产品。你不会只用 Claude,也不会只用 OpenAI。你在各个产品上的汗青信息都有价值,所以反而必要一个真正属于自己的跨平台影象治理工具。这件事的驱动力是用户必要,不是我们想做还是大厂想做。另表,memory 治理不必要最顶尖的大模型。我们用 4B 的模型能做到 235B 级此外成效,更快、成本更低。对开发者来说,memory 未来不是 " 能不能 " 的问题,而是性价比的问题?凑绞跎,我们极度彻底:开源版和本地部署等价,数据齐全留在本地,满足隐衷要求高的用户。同时也有云版本,让不想自己部署的幼团队即插即用。最主题的算法全数开源。我们也在做一件事,助用户把 Claude Code、OpenAI 和其他 Agent 里的 memory 数据买通,跨平台、跨端、统一治理。跟好多人聊完发现,这是一个很刚的需要。硅星人:记住的信息越多,安全风险也越大。这方面怎么平衡?邓亚峰:两个层面。信息安全,也就是影象会不会泄露,这跟云服务的安全挑战是等价的,必要扎实的技术保险。另一个是系统要对敏感信息做过滤。好比用户通知你密码、银行账号,我们有个 vault 机造,把高敏感信息隔离存放,只在特殊情况下激活。部署模式上,影象的梦想状态是云端和端侧结合。用户的数字资产存在本地设备上,复杂处置借助云端,双方做同步。3377体育模型已经能够做得很幼,未来设备能跑 4B 模型,推算就能够齐全数署到端上。若是 AI 记住了你的所有硅星人:若是 AI 占有了极度长周期、极度精确的影象,它就不再只是工具了。您但愿您的 AI 助理记住什么,不想让它记住什么?邓亚峰:我感触未来最梦想的状态有两种。一种是 " 贾维斯 ",24 幼时随着你的 AI,你的工作和意图都通过它实现,它只必要你确认了局。另一种是数字分身。AI 足够相识你之后,能够代表你去 " 打工 ",或者做 Agent 社交。我们每幼我都有好多两年都不座谈天的伴侣,但彼此可能有值得互换的信息。人是串行的,AI 是并行的,你的数字分身能够和他的数字分身谈天,发现共同话题了来通知你," 你们两个应该聊聊这件事儿。" 这让我感触极度 exciting。至于记什么、不记什么,梦想的 AI 要有天堑感和情商,知路哪些话题在感情上是敏感的。不外有意思的是,人和 AI 的相处有时比人和人更容易,你天然以为 AI 跟你是一壁的,反而更愿意倾诉一些不会跟伴侣说的事件。硅星人:我对 memory 有个感触:它有点像人类对功夫感知的演变。在腕表遍及之前,你出门之后其实不知路此刻是几点几分了,对功夫只有一个吞吐的感知。而此刻有了手机,你能够随时随地知路此刻的功夫。而人类目前对影象的感知,就像腕表出现之前人类对功夫的感知水平