AI 上下文限制到底是怎么回事——用最直白的话讲明白 128K、1M 和 Agent
文章目录前言一、上下文就是 AI 的记性二、为什么会有这个限制三、128K 和 1M 是什么意思四、为什么 1M 最近才有五、Agent 干了什么——在有限空间里收纳六、限制在模型不在 Agent七、三个记住就行前言这篇文章用最直白的方式讲清楚AI 为什么聊着聊着就忘了你是谁、128K 和 1M 到底是什么、Agent 又干了什么。不用任何技术背景读完就能跟别人讲明白。一、上下文就是 AI 的记性你跟 AI 聊天问一句答一句。上下文就是它一次能记住的对话总量。你我叫小张 AI好的小张 你我喜欢吃火锅 AI记住了小张爱吃火锅 你我今年 28 AI28 岁的小张爱火锅 ...聊了一百轮之后... 你我叫什么 AI不好意思我不记得你是谁 ↑ 最早那条我叫小张已经被挤出去了就像微信聊天记录。往上翻 10 条能看到往上翻 500 条就翻不动了。上下文窗口 “最多能往上翻多少”。二、为什么会有这个限制AI 跑在 GPU 上GPU 有一个硬件的存储空间叫显存。你问一句话 → 占一点点显存 AI 记在心里 → 占一点点显存 你问下一句 → 又占一点点显存 ... 聊到第几千句 → 显存满了 → 报错或忘掉最早的消息为什么不能无限制因为 AI 的注意力机制是O(n²)的对话量翻一倍 → 计算量翻四倍 对话量翻十倍 → 计算量翻一百倍GPU 撑不住就只能设一个上限。三、128K 和 1M 是什么意思K 千M 百万。这里的数字指的是 token 数。一个中文字大概 1-2 个 token约等于一个汉字。上下文大小能记住多少128K token约 150 页的对话1M token约 1200 页的对话一部《三体》三本约 90 万字 ≈ 1M token。所以 128K 的模型读不完一整本小说1M 可以。四、为什么 1M 最近才有以前做不到三个原因① 显存放不下128K 上下文 ≈ 2GB 显存 1M 上下文 ≈ 16GB 显存一张 GPU 总共就 80GB 显存1M 上下文就要吃掉 16GB。以前显存更小根本塞不下。② 计算太慢了128K → 够算 1M → 要算 64 倍 → 一分钟才能回你一句话谁受得了等一分钟直到 Flash Attention 这些新技术出来把速度提了十几倍1M 才变得能用了。③ 以前没人需要在 Claude Code 这种长对话 Agent出现之前大家跟 AI 聊天最多十几轮就结束了。没需求就没动力去搞 1M。2024 年是分水岭Gemini 1.5 第一个喊出 1M之后各家跟上来。前置技术更聪明的算法、更大的显存、位置编码改进刚好在这一年凑齐了。五、Agent 干了什么——在有限空间里收纳模型给的记性上限是 128K但 Agent 不可能真的塞满因为它还要留空间给回复。Agent 做的事就像小户型收纳房子就 30 平上下文 128K 策略 1扔东西 → 工具返回了 5000 行的日志 → 只留前 20 行后面全砍掉 策略 2做摘要 → 聊了 50 句代码 bug → 压成一句话修了登录页一个 CSS bug 策略 3装不下就喊停 → 上下文满了请把任务拆小再试Agent 不创造空间只管理空间。房子是 30 平就是 30 平收纳再厉害也变不出 100 平。六、限制在模型不在 Agent┌──────────────────────────┐ │ 模型盖房子的 │ │ 决定了最多 128K 还是 1M │ │ Agent 改不了这个 │ ├──────────────────────────┤ │ Agent搞收纳的 │ │ 决定了怎么在限额内省着用 │ │ 删旧消息、做摘要、喊停 │ └──────────────────────────┘模型升到 1M 房子从 30 平变成 300 平。Agent 一行代码不用改自动住得更宽敞。七、三个记住就行上下文 AI 一次能记住多少对话。记性有限不是无限聊。128K / 1M 记性大小的单位。越大越贵越难做但聊起来越爽。Agent 收纳师。空间有限就帮你省着用但不可能无中生有。

相关新闻

2026年GEO优化系统源码开源,如何抓住这波流量红利?

2026年GEO优化系统源码开源,如何抓住这波流量红利?

随着搜索引擎算法的不断升级,传统的SEO优化方式已经难以满足企业获取流量的需求。2026年,GEO优化系统源码的开源,为企业和个人站长提供了全新的流量增长机会。本文将深入分析GEO优化的核心价值,并分享实操建议,帮助你在…

2026/6/28 4:23:19阅读更多 →
BBR与KCC发送速率调节机制

BBR与KCC发送速率调节机制

BBR与KCC发送速率调节机制 0. 问题界定 拥塞控制算法的核心输出只有两个变量:Pacing Rate(物理发送速率) 和 CWND(逻辑拥塞窗口)。本文通过源码和可视化图表,剖析 BBR 与 KCC 在决定"下一时刻该发多快…

2026/6/28 4:18:19阅读更多 →
2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联

2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联

2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联 摘要:2026年选择命理软件做咨询排班,不适合只看日历提醒是否存在,更要看预约时间、沟通节点、案例卡片和后续反馈能否关联。八字排盘App如果能把日程安排与排盘资…

2026/6/28 4:18:19阅读更多 →
程序员效率倍增:用Gemini镜像站对PHP/Java项目进行代码审查与优化

程序员效率倍增:用Gemini镜像站对PHP/Java项目进行代码审查与优化

汇聚国内外各大顶级Ai最新大模型,免费一站式使用:gemini3.5,gpt,claude,grok 出图模型gpt-image-2低至每张0.03 视频模型:sora2,seed2,grok,全网最低价。 网页入口&…

2026/6/28 5:53:24阅读更多 →
深度把玩江诗丹顿传承系列的老哥,先放大50倍看看这处烧蓝指针的公差

深度把玩江诗丹顿传承系列的老哥,先放大50倍看看这处烧蓝指针的公差

很多时候,误打误撞反而能发现实用的东西。有位朋友留言说,他起初纯粹是对那个略显奇怪的昵称产生好奇,才顺藤摸瓜看到这些科普,结果学到了不少实用的干货。能帮大家看清本质,今天接着说。古董表这东西,说白…

2026/6/28 5:53:24阅读更多 →
Git 实战:彻底删除已被 Git 跟踪的目录,并防止再次提交(超详细)

Git 实战:彻底删除已被 Git 跟踪的目录,并防止再次提交(超详细)

大家在使用 Git 时,应该都遇到过这样的情况:明明已经把某个目录加入 .gitignore,为什么每次 git status 还是能看到?甚至别人 pull 代码后,这个目录又回来了。最近正好处理了这个问题,这里把整个过程整理下…

2026/6/28 5:53:24阅读更多 →
第四章-逻辑分解优化

第四章-逻辑分解优化

一、章节概览 本章是逻辑优化的核心章节,承接逻辑重写优化,开启物理优化的准备工作。主要内容是将查询树中的逻辑结构转换为适合物理优化的数据结构,并进行谓词下推、等价类推理、连接顺序优化等关键操作。 核心主题:从逻辑层&…

2026/6/28 5:53:24阅读更多 →
微信机器人api如何应用于客户服务?从业务流程到系统落地的实践分析

微信机器人api如何应用于客户服务?从业务流程到系统落地的实践分析

在企业数字化建设过程中,微信已经成为客户沟通的重要渠道,而 CRM 则承担着客户信息管理、销售跟进和业务分析等核心职能。因此,不少企业都会将微信 API 与 CRM 系统进行对接,希望实现客户资料同步、沟通记录沉淀以及业务流程自动流…

2026/6/28 5:53:24阅读更多 →
【插件】豆包15秒视频生成,图片、视频单个/批量无水印下载

【插件】豆包15秒视频生成,图片、视频单个/批量无水印下载

还在为豆包图片上的水印发愁吗?很多时候看到一张不错的图片,想保存下来做参考,结果右下角的水印刚好挡住关键内容,看着特别难受。以前要么裁剪图片,要么用去水印工具处理,但画质总会受到影响。今天分享一个…

2026/6/28 5:48:24阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →