lx1

EverMind 悬赏 8 万美元发起全球 AI 记忆大赛

快讯 | 2026-03-03 14:15:45
时间:2026-03-03 14:15:45   /   来源: 网络      阅读量:6776   会员投稿

开年,DeepSeek论文火遍全网,内容聚焦大模型记忆

无独有偶,谷歌近期也发布了一篇被誉为“Attention is all you need”V2(Nested Learning: The Illusion of Deep Learning Architectures)的重磅论文,核心同样指向记忆瓶颈。

就连最近这只彻底破圈的AI大龙虾——OpenClaw(原名Clawdbot),其亮点之一依旧是记忆。

也就是说,记忆≈今年全球AI圈集体押注的技术风口≈皇冠明珠。

几乎所有你能想到的大模型团队,都在加班加点往自家模型里塞记忆功能……

但这一次,让我们把视线从这些科技巨头身上稍稍挪开,就会发现有一支后起之秀同样不容小觑。

他们就是陈天桥和邓亚峰带队的EverMind

为什么这样说呢?

且看产品,最新发布世界级长期记忆系统——EverMemOS,发布即SOTA。

一举打破多项记忆基准测试的同时,还能远超此前所有的基线方法。

其次,它是真正能用的。

不是只会跑测试的“花架子”,实际部署后效果照样能打。而且团队有底气有信心,技术代码全部开源。

为了方便开发者使用,他们刚刚还专门上线了云服务——现在只需一个最简单的API,就能直接将最前沿的大模型记忆能力装进自己的应用。

并且要知道,从EverMemOS正式立项到开源,团队只用了短短四个月时间,这是什么实力不必多说。

不止如此,EverMind更是联手OpenAI等十多个技术社区豪掷英雄帖,发起首届记忆起源大赛(Memory Genesis Competition 2026),号召全球顶尖人才前来共同书写记忆元年。

学习大脑记忆机制,成了

启发于脑科学技术的研究成果,盛大一直以来非常重视长期记忆领域的研究。早在2024年10月,盛大团队就对外发布了长期记忆领域的纲领性文章《Long Term Memory-The Foundation of AI Self-Evolution》。

基于盛大多个团队在该领域的持续积累,EverMind在2025年8月正式启动EverMemOS项目,并于11月对外正式发布开源版本。

EverMemOS是EverMind打造的首款AI记忆基础设施,对比同赛道团队,似乎姗姗来迟。

Mem0、Zep等产品最早都能追溯到2024年,现在商业化最成功的开发者框架Letta(原MemGPT)也是2023年就开始起步。

EverMemOS却交出了亮眼的答卷:最晚入场,但效果弯道超车。

从技术角度看,它同时继承了基于外部存储基于隐状态两种路径。不过业内并非没有尝试过此类方案,但EverMind显然在记忆提取的精准度和逻辑一致性上实现了更优的平衡。

原因在于EverMind抓住了精髓,用邓亚峰的话说,就是:

通过EverMemOS,我们赋予智能体一个活的、不断演化的历史。

这里的关键词其实是“活的”。那么如何能保存最鲜活的记忆呢?人类大脑。

这就引出了EverMind的独特思路——生物启发

具体来讲,EverMemOS通过模拟人类记忆的形成并转化为计算框架,利用三阶段层层递进以实现大模型长期记忆的存储和提取:

Step 1:情景轨迹构建。

对应人脑的海马体和内嗅皮层,可以将连续的对话内容拆分成一个个独立的记忆单元(MemCell),每个单元里不仅记录有完整的聊天内容,还包括一些关键事实、时效信息等。

Step 2:语义整合。

类比新皮层(前额叶皮层+颞叶皮层),系统会将内容相关的记忆单元归类在一起,形成主题化的记忆场景(MemScene),同时还会更新用户画像,区分用户的长期稳定偏好和短期临时状态。

Step 3:重构式回忆。

这一步对应的是前额叶皮层和海马体的协同机制,当用户提问时,系统就会在记忆场景的引导下进行智能检索,只挑选出必要且足够的记忆内容,用于后续的推理任务。

由此,AI学会像人类一样记忆——这不仅是知识的数据库存储,更是认知系统的深度整合。如此一来,即便是在多个Agent之间,也能实现信息的高效传递。

至于效果如何,咱们还是眼见为实,看看基准测试结果。

团队选取了4个主流记忆基准测试,以及多种大模型记忆增强方法。所有方法都基于同一基础大模型(GPT-4o-mini或GPT-4.1-mini)进行测试。

结果也很明显,EverMemOS大获全胜,全面超越现有记忆系统和全上下文模型。

其中在LoCoMo上,准确率直接一跃来到93.05%,尤其是在多跳推理和时序任务上表现突出,分别提升19.7%和16.1%,同时token使用量和计算成本得到大幅度降低。

在多会话对话评估LongMemEval里,EverMemOS同样以83%的准确率位居榜首,说明在面对跨度极大、信息量极高的场景中,EverMemOS依旧能够精准检索和关联到过去的信息,并且通过持续交流还会不断进化完善自己。

HaluMem由MemTensor和中国电信研究院联合发布,是业界首个面向AI记忆系统的操作级幻觉评估基准。而EverMemOS在保证记忆完整性的同时,也显著改善了幻觉现象。

PersonaMem v2里,EverMemOS在九个复杂场景中依旧全场最佳,保证了深度个性化和行为一致性。

足以见得,EverMemOS是相当全能的一枚选手,记性好、搜得准,关键还运行速度快、成本还够低,最长可突破百兆上下文限制。

一边帮大模型减负,一边帮大模型补记忆力,堪称大模型版安神补脑液。

不仅云,还要赢

诚然,技术扎实是一回事,能不能让开发者用起来则是另外一回事。

EverMind觉得,开源还不够,直接上云服务。

省去中间繁杂的基础设施搭建,从开发者到EverMemOS,只需要完成简单的两行API代码调用,就能实现多项记忆操作,包括:

? 记忆摄入:从消息和交互中提取和存储记忆; ? 记忆检索:使用筛选选项(例如按元数据字段)检索已存储的记忆; ? 记忆搜索:利用关键字驱动的混合检索方式搜索记忆; ? 对话元数据:设置或更新对话元数据以改进提取和检索行为。

有两种使用EverMemOS的方式,EverMemOS Cloud开源版本。前者使用托管API,更方便也更快,且核心引擎会自动更新到最新版本,后者则由用户自己运维。

开源版本需要自行准备部署环境:

云服务上手更快,功能简洁,探索空间却很大:配置记忆空间→获取API密钥→保存记忆→使用记忆,即可轻松体验当前业界性能SOTA的Memory系统。

选择EverMemOS云服务或开源版本的理由

目前云服务已经正式开放内测申请,填写正确的邮箱地址后即可享受免费服务。

不过正如邓亚峰所说,要想掌握AI,多学不如多用。在部署好EverMemOS后,不妨来参加EverMind举办的记忆起源大赛

EverMind把舞台也给大家一站式搭好了~

比赛将从1月一直持续到4月,现已面向全球开发者开放注册通道和云平台,需要注意要在2月底之前完成项目提交。具体将分为三大赛道:

1、记忆+智能体:

要求构建具备长期、进化能力的智能体,例如个人数字孪生、内容创作者工作流程、销售/CRM协作助手、医疗保健/治疗智能体、教育伙伴、多智能体协作等。将选出5名获奖者,每人奖励5000美元。

2、平台插件:

基于VSCode、Chrome、Slack、Discord、Notion、Obsidian或LangChain等框架或SDK为EverMemOS建立扩展操作系统生态。将选出7名获奖者,每人奖励3000美元。

3、操作系统基础设施:

帮助优化EverMemOS的核心,例如核心功能修改、性能调优、架构改进等。将选出3名获奖者,每人奖励3000美元。

另外还将根据总成绩结合线下活动表现,选出额外的总冠军(额外1万美元)、人气开发者(额外5000美元)和2个Aha案例(额外3000美元)。

总奖金池高达8万美元,另外每位获奖者还将拥有收益分成机会和社区头衔。其中顶级贡献者还可有机会获得全职offer,以及受邀加入EverMind担任技术顾问。

所有参赛选手都将接受来自EverMind工程团队的直接导师指导,更多比赛细节可见赛事官网。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

  • 友情链接