真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文

  • 量子位
  • 2026-01-19 12:34:46

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本!

MIT CSAIL研究团队提出了一种叫做递归语言模型RLM的长文本处理新方法,来解决上下文腐烂问题。


【资料图】

不修改模型架构、不升级模块设计,但能让GPT-5、Qwen-3这类顶尖模型推理层具备千万级token的超长文本处理能力。

核心思路是不把提示词直接塞进大模型的上下文窗口,而把它“外包”给可交互的Python环境,让模型主动通过自动编程和递归调用拆解任务、按需处理。

啊?大模型读上下文也能递归操作?

上下文窗口不够,仍能推理

先说上下文腐烂这个扎心的问题。

不管大模型宣称自己的上下文窗口有多大,它们处理超长文本时,都会遇到文本越长,模型对早期信息的记忆越模糊,推理性能直线下滑的问题。

这就像我们读百万字小说,读到后半段,早就忘了前半段的关键情节。

现在主流的解决办法有上下文压缩、检索增强生成RAG,或者对模型进行架构级优化

比如,GPT-5.2-Codex采用的就是窗口内的原生上下文压缩技术,在持续数周的大型代码仓库协助任务中保持全上下文信息。

同时,GPT系列、Claude、Qwen等企业级版本原生集成RAG功能也是行业共识。

而架构级优化的例子,有社区普遍猜测的Gemini 3的环形注意力等。

现在的RLM和这些直接在模型上“硬磕”的方法不同,它把上下文处理给“外包”了

RLM给模型搭了一个可交互的Python编程环境REPL

开始处理上下文前,它先启动Python REPL交互式编程环境,将超长提示词作为字符串变量存入环境;

接着模型像程序员一样编写代码,对文本变量进行关键词筛选、局部探查、逻辑拆分等操作,通过「编写代码-观察结果」的交互循环减少无效信息摄入;

随后模型将复杂任务拆解为若干子任务,递归调用自身或轻量化子模型处理拆分后的文本片段,所有子任务输出均存储为新变量回流到REPL环境;

最后主模型编写代码读取并整合所有子任务结果变量,进行逻辑拼接或语义处理,形成最终输出。

全程由模型自主决策,实现按需处理,彻底解耦输入文本长度与模型上下文窗口的绑定。

实验显示,RLM有效处理规模已突破千万级Token,超过GPT-5等前沿模型原生上下文窗口的两个数量级。

在复杂长文本任务中,RLM的优势也比较显著。面对要求聚合成对信息、复杂度呈二次方增长的OOLONG-Pairs任务,基础GPT-5和Qwen3-Coder的 F1分数不足0.1%;

采用RLM方案后,两款模型分别取得58.00%和23.11%的F1分数。

在600万至1100万Token规模的BrowseComp-Plus(1K)多文档推理任务中,RLM(GPT-5)的正确率高达91.33%,大幅超越其他长文本处理方案;

即便在要求线性扫描并处理几乎所有信息的OOLONG任务中,RLM也实现了双位数的性能提升。

从调用成本上看,在50分位数这个指标上,RLM的成本和其他长文本处理方案处于同一水平,甚至更低。

这说明在大多数常规任务场景中,RLM的性价比是很有优势的。

但到了95分位数这类高百分位区间时,RLM的成本会出现明显飙升。

主要是因为RLM的推理过程是动态的,会根据任务复杂度自主决定代码编写、文本拆分和递归调用的次数,额外的步骤会增加API调用次数。

最后再划个小重点,RLM是一种不碰模型架构的通用推理策略,也就是说,理论上任何模型都能直接上车。

论文地址:https://arxiv.org/abs/2512.24601参考链接:https://x.com/MatthewBerman/status/2012701592756383893

— 完 —

标签: 调用 大模型 上下文 真·开 新论文

分享到:

真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文

真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文,调用,大

  2026-01-19 12:34:46

首次制定发布!中医体质分类与判定有了国家标准

近日,市场监管总局(国家标准委)批准发布《中医体质分类与判定》(GB

  2026-01-19 11:28:03

要闻速递:国家统计局:2025年规上工业发电量97159亿千瓦时 同比增长2.2%

原油生产保持稳定。12月份,规上工业原油产量1780万吨,同比下降0 6%;

  2026-01-19 11:00:38

第三季度证券股票净利率排行榜|证券排行榜

《南方财富网概念库》财报工具数据整理,截至第三季度,证券股票净利率

  2026-01-19 10:04:58

寒流中的生命托举 00后武警战士跳入邕江勇救落水少年|每日观察

1月18日,阳光明媚,武警杭州支队中士林宏骏在姐姐林倩的陪同下,来到

  2026-01-19 09:27:14

A股限售股解禁一览:208.61亿元市值限售股今日解禁

每经AI快讯,Wind数据显示,周一(1月19日),共有17家公司限售股解禁

  2026-01-19 07:56:41

焦点快播:皇马3500万红星崩溃 故意勺子点球踢丢绝杀 非洲杯失冠后含泪领奖

皇马3500万红星崩溃故意勺子点球踢丢绝杀非洲杯失冠后含泪领奖,门迪,点

  2026-01-19 07:24:24

露笑科技子公司8英寸导电型碳化硅衬底取得重大突破 聚看点

本报讯(记者吴文婧)1月16日,露笑科技(002617)股份有限公司(以下简称

  2026-01-18 21:24:40

名创优品(09896)1月16日斥资24.59万美元回购5.11万股 每日速讯

智通财经APP讯,名创优品发布公告,该公司于2026年1月16日斥资24 59万

  2026-01-18 20:03:18

伟思医疗:股东拟减持不超过3%股份

1月19日,伟思医疗发布股份减持公告,股东南京志达创业投资中心(有限合

  2026-01-18 17:30:33

海天味业603288股票分红如何(2026/1/18)

海天味业最新一次公布的分红方案为10送2派7元。本次权益分派股权登记日

  2026-01-18 17:05:59

ST逸飞(688646.SH):与国内锂电头部企业签1.58亿大单 占2024年度营收22.83%|快资讯

格隆汇1月18日丨ST逸飞(688646 SH)发布公告,公司于近日与国内某锂电头

  2026-01-18 16:10:41

数千人在哥本哈根游行抗议美国图谋格陵兰岛

记者在现场了解到,示威者中有人来自丹麦本土,有人来自格陵兰岛。中午

  2026-01-18 09:22:22

美国明尼苏达州动员国民警卫队 应对抗议活动

【美国明尼苏达州动员国民警卫队应对抗议活动】据美国方面17日消息,美

  2026-01-18 07:54:31

我国完善生育支持政策体系取得积极进展 每日速看

央视网消息(新闻联播):近年来,我国着力推动完善生育支持政策体系,促

  2026-01-17 21:08:56

特写|“记住‘猪湾事件’!”——数十万古巴民众游行表达捍卫祖国决心

1月16日,在古巴首都哈瓦那,民众手持古巴国旗在美国驻古巴大使馆前举

  2026-01-17 19:24:04

永辉定制4.0纯牛奶上市一周销售额破百万 焦点资讯

北京商报讯1月16日,永辉正式推出与蒙牛旗下精选牧场联合打造的永辉定

  2026-01-17 15:59:37

华泰证券:国网4万亿投资,利好电网设备商|焦点简讯

21财经1月17日电,华泰证券研报称,国网4万亿投资,利好电网设备商。根

  2026-01-17 15:06:15

连宿高速柴米河特大桥实现全幅贯通 焦点速讯

连宿高速柴米河特大桥实现全幅贯通

  2026-01-17 12:32:00

热门看点:A股定增一览:16家公司披露定增进展

每经AI快讯,数据显示,1月17日,A股共16家公司发布定增相关公告。其中

  2026-01-17 09:01:57

焦点资讯:U23国足被看低!董路:可能憋着输把大的 刘建宏:我们特别怕对手

U23国足被看低!董路:可能憋着输把大的刘建宏:我们特别怕对手,国足,

  2026-01-17 08:21:43

西红柿“身价暴涨”,背后原因几何?

“俩西红柿要10块钱”“鸡蛋都快配不上西红柿啦”……近段时间,全国多

  2026-01-17 07:30:56

新资讯:装修概念龙头,值得关注(2026/1/16)

装修概念龙头有哪些?据南方财富网概念查询工具数据显示,装修概念龙头

  2026-01-17 07:05:33

要闻:三河市茅香酒汇商贸有限公司成立 注册资本2万人民币

天眼查App显示,近日,三河市茅香酒汇商贸有限公司成立,法定代表人为

  2026-01-17 06:08:20

结构性降息下A股行情展望

昨日收盘后央行送出大礼包,调降结构性金融工具利率0 25个百分点等。此

  2026-01-16 22:06:08

智慧停车概念股分类盘点_智慧停车股票有哪些上市公司(1/16)

截至1月16日,A股涉及智慧停车的上市公司具体分布情况为:主板的有7家

  2026-01-16 20:08:04

华塑控股:公司双碳业务取得实质性进展,多个项目入选国家级推广目录 每日短讯

21智讯1月16日电,华塑控股在投资者关系活动中表示,公司在碳排放治理

  2026-01-16 19:55:10

上期所调整白银、镍期货相关合约交易限额

上期所发布公告,根据有关规定,经研究决定,自2026年1月20日(即1月19

  2026-01-16 19:07:44

华兰疫苗跌2.3% 2022年上市见顶募22.76亿元

中国经济网北京1月16日讯华兰疫苗(301207 SZ)今日收报19 14元,跌幅2 3

  2026-01-16 17:59:21

热门资讯

联系邮箱:291 32 36@qq.com

京ICP备12018864号-33未经授权不得镜像、转载、摘抄本站内容,违者必究!Copyright 2022  www.213.com.cn. All Rights Reserved

213网 版权所有