Headroom 完整安装与使用教程
Headroom— AI Agent 的上下文压缩层在工具输出、日志、文件和 RAG 块进入 LLM 之前压缩 token实现 60-95% 的 token 减少。目录简介系统要求安装步骤配置说明功能详解使用方法测试与监控常见问题参考链接简介什么是 HeadroomHeadroom 是一个本地优先的上下文压缩工具可以在 AI Agent 读取内容之前对所有输入进行智能压缩工具输出tool outputs日志logs文件内容filesRAG 检索块RAG chunks对话历史conversation history核心优势优势说明节省 Token 费用60-95% 的 token 减少API 费用大幅降低更快响应更少的 token 更快的推理速度兼容所有 AgentClaude Code、Cursor、Codex、Aider、Copilot CLI 等都支持完全本地运行数据不离开你的机器隐私安全可逆压缩原始内容被缓存LLM 需要时可以检索还原零代码改动Proxy 模式下无需修改任何代码跨 Agent 共享记忆不同 Agent 之间共享上下文记忆系统要求操作系统: Windows 10/11、macOS、LinuxPython: 3.8 或更高版本磁盘空间: 至少 500MB用于安装和缓存内存: 建议 4GB 以上安装步骤方式一使用 pip 安装推荐1. 创建虚拟环境# 创建虚拟环境目录mkdirD:\toolscdD:\tools# 创建 Python 虚拟环境python-mvenv headroom-venv# 激活虚拟环境# Windows:D:\tools\headroom-venv\Scripts\activate# macOS/Linux:source/d/tools/headroom-venv/bin/activate2. 安装 Headroom# 安装完整版本包含所有功能pipinstallheadroom-ai[all]# 验证安装headroom--version3. 安装包含的功能模块headroom-ai[all]包含以下模块模块功能proxy代理服务器模式memory跨 Agent 共享记忆mlML 压缩模型code代码压缩mcpMCP 服务器集成方式二使用 Docker 安装# 拉取 Docker 镜像dockerpull ghcr.io/chopratejas/headroom:latest# 运行容器dockerrun-d\--nameheadroom\-p8787:8787\-vheadroom-data:/data\ghcr.io/chopratejas/headroom:latest配置说明目录结构安装完成后会创建以下目录D:\tools\├── .headroom\# 配置和记忆数据库│ ├── memory.db# 记忆数据库│ ├── memory_graph.db# 图数据库│ └── memory_vectors.db# 向量数据库├── headroom-data\# 数据备份目录└── headroom-venv\# Python 虚拟环境├── Include\├── Lib\├── Scripts\│ └── headroom.exe# 可执行文件└── pyvenv.cfg配置文件位置Windows:C:\Users\用户名\.headroom\macOS/Linux:~/.headroom/环境变量配置在启动脚本中设置以下环境变量echo off chcp 65001 nul title Headroom Claude Code REM 配置信息 echo Configuration: echo - Proxy URL: http://127.0.0.1:8787 echo - Target API: https://api.xiaomimimo.com/anthropic echo - Mode: token optimization (60-95%% fewer tokens) echo. REM 禁用 Rust 核心可选 set HEADROOM_REQUIRE_RUST_COREfalse REM 设置目标 API URL set ANTHROPIC_TARGET_API_URLhttps://api.xiaomimimo.com/anthropic REM 启动代理 D:\tools\headroom-venv\Scripts\headroom.exe proxy --port 8787 pause功能详解1. Token 节约功能原理: 在请求发送到 LLM 之前智能压缩上下文内容减少 token 数量。压缩策略:内容路由: 根据内容类型选择压缩策略智能跳过: 短内容50 词不压缩避免压缩开销可逆压缩: 原始内容缓存需要时可还原压缩率: 通常 60-95%取决于内容类型和长度2. 记忆功能数据库文件:memory.db— 主记忆存储memory_graph.db— 知识图谱memory_vectors.db— 向量索引功能:跨 Agent 共享记忆持久化对话历史向量化检索3. Proxy 代理模式工作原理:用户 → Claude Code → Headroom Proxy(localhost:8787)→ 目标 API ↓ 压缩 token 缓存优势:零代码改动透明代理自动压缩使用方法方式一Proxy 代理模式推荐1. 启动代理服务器# 激活虚拟环境D:\tools\headroom-venv\Scripts\activate# 启动代理headroom proxy--port87872. 配置 Claude Code 使用代理在 Claude Code 配置中设置 API 端点为:http://127.0.0.1:87873. 创建启动脚本创建start-headroom-claude.bat:echo off chcp 65001 nul title Headroom Claude Code echo Configuration: echo - Proxy URL: http://127.0.0.1:8787 echo - Target API: https://api.xiaomimimo.com/anthropic echo - Mode: token optimization (60-95%% fewer tokens) echo. set HEADROOM_REQUIRE_RUST_COREfalse set ANTHROPIC_TARGET_API_URLhttps://api.xiaomimimo.com/anthropic echo Starting Headroom proxy on port 8787... echo. D:\tools\headroom-venv\Scripts\headroom.exe proxy --port 8787 pause方式二Wrap 包装模式包装 Claude Code# 一键包装 Claude Codeheadroom wrap claude# 包装 Codex与 Claude 共享记忆headroom wrap codex# 包装 Cursorheadroom wrap cursor# 包装 Aiderheadroom wrap aider# 包装 Copilot CLIheadroom wrap copilot方式三Python 库内联使用importasynciofromheadroomimportcompressasyncdefmain():messages[{role:system,content:You are a helpful assistant.},{role:user,content:Explain quantum computing...},{role:assistant,content:Quantum computing is...}]# 压缩消息compressedawaitcompress(messages,modelgpt-4)print(f压缩后 token 数:{len(str(compressed))})if__name____main__:asyncio.run(main())方式四TypeScript 库内联使用import{compress}fromheadroom-ai;asyncfunctionmain(){constmessages[{role:system,content:You are a helpful assistant.},{role:user,content:Explain quantum computing...}];constcompressedawaitcompress(messages,{model:gpt-4});console.log(压缩完成:,compressed);}main();方式五MCP 服务器集成# 安装 MCP 服务器headroom mcpinstall# 查看 MCP 状态headroom mcp status测试与监控查看压缩效果# 查看完整统计默认 7 天headroom perf# 查看最近 24 小时headroom perf--hours24# 查看最近 1 小时headroom perf--hours1# 导出 CSV 格式headroom perf--formatcsv--hours24stats.csv# 导出 JSON 格式headroom perf--formatjsonstats.json性能报告解读Headroom Performance ReportWindow: last 168h Requests:236# 总请求数Tokens:12,623,728 -12,455,827(1.3% reduction)Total saved:167,901tokens# 节省的 token 数Content Router Routing ---------------------------------------- Compressed:29(4%)# 实际被压缩的内容Excluded:21(3%)# Read/Glob 输出被排除Skipped:460(69%)# 太短 (50 词) 被跳过Unchanged:155(23%)# 压缩比率不够高重置统计# 备份旧日志cp~/.headroom/logs/proxy.log ~/.headroom/logs/proxy.log.bak# 清空日志~/.headroom/logs/proxy.log# 重新开始统计headroom perf--hours1监控脚本创建monitor-headroom.sh:#!/bin/bash# 每 5 分钟刷新一次统计watch-n300headroom perf --hours 1常见问题Q1: 压缩率很低10%怎么办原因: 大部分内容是短消息50 词会被自动跳过。解决方案:增加长内容的使用场景代码、文档、工具输出调整压缩阈值如果支持检查压缩路由统计了解哪些内容被跳过Q2: 代理服务器启动失败检查步骤:# 1. 检查端口是否被占用netstat-ano|findstr :8787# 2. 检查 Python 虚拟环境D:\tools\headroom-venv\Scripts\python--version# 3. 重新安装pipinstall--upgradeheadroom-ai[all]# 4. 查看详细日志headroom proxy--port8787--verboseQ3: 记忆功能不工作检查步骤:# 1. 检查记忆数据库是否存在ls-la~/.headroom/memory*.db# 2. 查看记忆统计headroom memory stats# 3. 列出所有记忆headroom memory listQ4: 如何更新 Headroom# 激活虚拟环境D:\tools\headroom-venv\Scripts\activate# 更新到最新版本pipinstall--upgradeheadroom-ai[all]# 或使用内置更新命令headroom updateQ5: 如何卸载 Headroom# 1. 停止代理服务器CtrlC# 2. 卸载 Python 包pip uninstall headroom-ai# 3. 删除目录rm-rfD:\tools\.headroomrm-rfD:\tools\headroom-datarm-rfD:\tools\headroom-venv参考链接GitHub 仓库: https://github.com/chopratejas/headroom官方文档: https://headroom-docs.vercel.app/docsHuggingFace 模型: https://huggingface.co/chopratejas/kompress-v2-baseDiscord 社区: https://discord.gg/yRmaUNpsPJ许可证: Apache 2.0附录完整命令参考命令说明headroom proxy --port 8787启动代理服务器headroom perf查看压缩性能统计headroom perf --hours 24查看最近 24 小时统计headroom perf --format csv导出 CSV 格式headroom memory list列出所有记忆headroom memory stats查看记忆统计headroom learn从失败会话中学习headroom mcp install安装 MCP 服务器headroom wrap claude包装 Claude Codeheadroom wrap codex包装 Codexheadroom wrap cursor包装 Cursorheadroom update更新到最新版本headroom doctor检查配置状态附录快速启动脚本Windows 批处理脚本start-headroom-claude.bat:echo off chcp 65001 nul title Headroom Claude Code echo echo Headroom Claude Code 启动脚本 echo echo. echo Configuration: echo - Proxy URL: http://127.0.0.1:8787 echo - Target API: https://api.xiaomimimo.com/anthropic echo - Mode: token optimization (60-95%% fewer tokens) echo. echo Usage: echo - 保持此窗口打开 echo - Claude Code 会自动使用代理 echo - 按 CtrlC 停止代理 echo. set HEADROOM_REQUIRE_RUST_COREfalse set ANTHROPIC_TARGET_API_URLhttps://api.xiaomimimo.com/anthropic echo Starting Headroom proxy on port 8787... echo. D:\tools\headroom-venv\Scripts\headroom.exe proxy --port 8787 pause文档版本: 1.0最后更新: 2026-06-26

相关新闻

STM32短波接收机DIY:从硬件设计到软件实现

STM32短波接收机DIY:从硬件设计到软件实现

1. 项目概述这个STM32短波接收机项目是我最近完成的一个业余无线电爱好者的DIY作品。短波接收机作为无线电设备中的经典类型,能够接收3-30MHz频段的无线电信号,这个频段特别适合远距离通信。使用STM32作为主控芯片,不仅成本低廉,而…

2026/6/27 14:20:44阅读更多 →
职业教育实践培训:智能交通与新能源汽车技术解析

职业教育实践培训:智能交通与新能源汽车技术解析

1. 项目背景与意义武汉交通职业学院作为湖北省重点职业院校,在交通运输领域人才培养方面具有重要地位。本次实践培训是继首次成功举办后的第二次探索,旨在深化产教融合、强化学生实操能力。作为参与过多次职业教育实践项目的一线教师,我认为这…

2026/6/27 14:20:44阅读更多 →
模拟电路实验板设计与教学实践解析

模拟电路实验板设计与教学实践解析

1. 模拟电路实验板的设计初衷与教学价值在电子工程专业的实验教学中,模拟电路实验板作为基础训练平台,其重要性不言而喻。济南大学电子实验室自主研发的这套实验装置,正是针对模电教学中"理论抽象、实践脱节"的痛点而设计的。相比市…

2026/6/27 14:15:43阅读更多 →
天猛星扩展板设计:电赛E题硬件方案解析

天猛星扩展板设计:电赛E题硬件方案解析

1. 项目概述:天猛星扩展板设计解析 作为一名参加过三届电赛的老队员,看到这个天猛星扩展板的设计让我眼前一亮。这个专为2025年全国大学生电子设计竞赛E题"简易自行瞄准装置"打造的扩展板,完美解决了我们在往届比赛中遇到的几个核心…

2026/6/27 16:01:20阅读更多 →
SU-03T 变量控制音乐播放指南:实现切歌与播放列表管理

SU-03T 变量控制音乐播放指南:实现切歌与播放列表管理

前言 在使用 SU-03T 离线语音模组开发语音控制音乐播放功能时,一个常见的需求是:通过语音命令实现"上一首"、"下一首"等切歌功能。很多开发者初次接触时会疑惑——能否不借助外部 MP3 模块,直接在 SU-03T 内部实现这个功…

2026/6/27 16:01:20阅读更多 →
向量库索引HNSW和IVF怎么选

向量库索引HNSW和IVF怎么选

先把结论甩前面:数据量在百万级以内、内存不抠门、追召回精度,选 HNSW;数据量上千万、内存吃紧、能接受先训练再用,选 IVF(或 IVFPQ)。 我自己踩过坑,下面是实测对比表加一点真实账。 两种索引,各维度怎么打分 我手头一个客服知识库,大概 80 万条切片,向量维度 768(BAAI 那个…

2026/6/27 16:01:20阅读更多 →
TI MSPM0与STM32双核电机控制方案设计

TI MSPM0与STM32双核电机控制方案设计

1. 项目背景与设计思路 作为一名参加过多次电子设计竞赛的老队员,我深知赛前准备的重要性。2025年江苏省电赛E题明确限制使用TI芯片,这让我们团队在初期就确定了控制类题目的方向。在众多TI开发板中,我们首先选择了嘉立创开源的MSPM0G3507开发…

2026/6/27 16:01:20阅读更多 →
CW32L010充电检测仪开发板测评与功能解析

CW32L010充电检测仪开发板测评与功能解析

1. CW32L010开发板测评:一款多功能充电检测仪拿到CW32充电检测仪的第一印象是它的双显示设计非常巧妙——同一块板子上集成了数码管和LCD两种显示方案。作为一名电子工程师,我经常需要测试各种充电设备的性能参数,这款基于CW32L010F8U6单片机…

2026/6/27 16:01:20阅读更多 →
RA4M2微控制器在物联网中的低功耗与安全设计实践

RA4M2微控制器在物联网中的低功耗与安全设计实践

1. RA4M2系列芯片概述瑞萨电子推出的RA4M2系列微控制器,是专为物联网边缘设备设计的高性能低功耗解决方案。这个系列基于Arm Cortex-M33内核,运行频率高达48MHz,在保持出色运算能力的同时实现了业界领先的功耗表现。我在最近的一个智能农业传…

2026/6/27 15:56:20阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/27 11:20:40阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 5:46:02阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/27 11:20:39阅读更多 →
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声&#xff1a;Retrieval-based-Voice-Conversion-WebUI完整指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:03阅读更多 →
Layerdivider:3分钟AI智能分层,彻底告别手动抠图时代

Layerdivider:3分钟AI智能分层,彻底告别手动抠图时代

Layerdivider&#xff1a;3分钟AI智能分层&#xff0c;彻底告别手动抠图时代 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 还在为复杂的图像分层工作烦…

2026/6/27 0:04:03阅读更多 →
Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践

Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践

1. 项目概述&#xff1a;为什么X-Frame-Options是Web安全的“防盗门”&#xff1f;最近在排查一个老项目的安全审计报告时&#xff0c;又被提到了“点击劫持”风险&#xff0c;矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了&#xff0c;很多开发团队&#xff0c;尤…

2026/6/27 0:04:03阅读更多 →