博客 | HuanCode Docs

让 AI Coding Agent 真正理解你的代码库：分层上下文工程实践

大型仓库中，AI Agent 每次都要重新读文件"了解架构"，浪费 token 又不准确。本文分享一套分层 CLAUDE.md + 按需加载的实践方案，让 Agent 只读它需要的上下文。

两个问题花了一块四：AI Agent 的使用成本到底有多离谱？

一天烧掉 451 美元，超过一个高级工程师的日薪。从真实账单出发，聊聊 AI Agent 时代的 Token 经济学。

Anthropic发布神话模型Mythos，却不让你用

Anthropic 发布了 Claude Mythos Preview 模型，它能自主发现藏了 27 年的系统漏洞，却因能力过于危险而拒绝公开。联合 12 家科技巨头发起玻璃翼计划，投入 1 亿美元抢在攻击者之前修复全球软件漏洞。

国内开发者到底是怎么用上 Claude API 的？

Anthropic 官网写着「中国大陆不在服务范围内」，但身边用 Claude 的人越来越多。企业怎么采购？个人开发者走哪条路？中转站为什么能这么便宜？一篇把结构讲清楚的文章。

拆解 Claude Code 的 Agent 提示词：为什么发一句 hello 要花 2 元

打开 Claude Code 什么都没做，只发一句 hello，账单就划走 2 元左右。这不是 Bug，是官方把一套完整的"行为控制系统"塞进了每一次对话的上下文里。本文从这张账单出发，聚焦 Agent 工具的提示词，拆开看看一个顶级 CLI Agent 是怎么写系统提示词的。

国内使用 Claude Code 完整配置指南（微信支付）

3 分钟配好 Claude Code 国内直连。无访问IP限制，无需境外信用卡，支持 Claude / GPT / DeepSeek，微信支付按量充值。

Claude Code 模型配置完全指南：从别名到代理，一文讲透

详解 Claude Code 中 model 参数的所有配置方式、别名解析机制、优先级规则和环境变量，附代理商自定义模型实战示例。

Claude Code 内置 Tools 提示词拆解

从 Claude Code v2.1.116 (Opus 4.6) 的真实 API 请求中抓取的 9 个内置工具的完整提示词与参数定义。

Claude Code 完整系统提示词拆解：Anthropic 是怎么调教 AI 编程助手的

通过 LiteLLM 代理抓包，完整还原 Claude Code v2.1.x 的系统提示词。逐段拆解 Anthropic 如何设计角色定义、工具使用、安全边界、代码风格、Git 工作流等关键指令。

Opus 4.7 + Claude Code 最佳实践

Anthropic 官方博客解读：Opus 4.7 引入自适应思考、xhigh 努力等级、更精准的响应长度校准，本文详解升级要点和实战配置建议。

在中国使用 Cline：配置 HuanCode API 告别网络烦恼

手把手教你在 VSCode Cline 插件中接入 HuanCode API，国内直连 Claude/GPT/DeepSeek，微信支付。

在国内使用 Cursor？用 HuanCode 一键接入 Claude / GPT

手把手教你配置 Cursor 使用 HuanCode API，国内直连，微信支付，支持 Claude、GPT-5、DeepSeek 等主流模型。

Claude Code 配置大全：一个仓库搞定所有

Everything Claude Code 开源项目详解，38个代理+156个技能一键安装

Harness实战：从零搭建Agent Loop

Agent的核心不是模型，而是循环。用50行Python搭建最小Agent Loop，从纯对话到工具调用，拆解每一次request和response，看懂Agent到底怎么"自己干活"。

Harness实战：Agent Teams——从单兵到团队协作

之前的Agent都是单打独斗——一个主Agent加若干一次性子Agent。这篇把Agent变成团队：持久化的命名队友、JSONL收件箱通信、关机握手和计划审批协议。从9个工具扩展到17个，从独狼进化为有编制的团队。

Harness实战：给Agent装上文件操作工具

只有Bash的Agent像只有锤子的工人。给Agent加上read_file、write_file、edit_file三把精细工具，用路径安全函数守住工作区边界，再用分发表让循环自动路由——从"能跑命令"进化到"能操作代码"。

Harness实战：Autonomous Agents——从等指令到自驱动

上一篇 Agent 有了团队，但队友还是"被动接活"。这篇让队友变成自治单元：任务看板 + WORK/IDLE 双阶段循环 + 自动认领 + 身份重注入。队友做完手头活，自己去看板找新任务，60秒没活自动关机。从17个工具扩展到19个，从"等指令"进化为"自驱动"。

Harness实战：后台任务——Fire-and-Forget，Agent不等了

并行任务解决了"多个子任务同时跑"的问题，但父Agent还是得等所有结果回来才能继续。后台任务让Agent提交长耗时工作后立即返回，继续和用户对话，随时用check_task查看进度。

Harness实战：上下文压缩——三层策略让Agent永不断档

Agent工作越久，messages越胖。一个1000行的cat输出占4000 token，模型早就看过了，后续每轮还在为它付费。三层压缩策略——micro_compact静默替换旧结果、auto_compact在token超阈值时LLM摘要、compact工具让模型主动触发——让上下文永远可控。

Harness Engineering：开发者的下一个必修课

当 AI Agent 写了 100 万行代码后，真正决定成败的不是模型，而是 Harness。深入解析 2026 年最重要的工程新范式。

Harness实战：从API调用到Function Calling

Agent 工程的第一步不是写循环，而是搞清楚怎么调大模型。一篇讲透 OpenAI、Claude、DeepSeek 三大 API 的异同，从基础调用到多轮对话到工具调用。

Harness实战：并行调度——拓扑排序让Subagent飞起来

串行的Subagent太慢？用拓扑排序把任务分层，同层并行执行，有依赖的自动等待。模型负责声明"做什么、什么依赖什么"，代码负责"怎么做最快"。

Harness实战：Plan模式——让Agent先想清楚再动手

Agent收到任务就立刻开干，简单任务没问题，复杂任务容易走弯路。一个技巧：第一次API调用不传tools，强制模型只输出计划文本；用户确认后再带tools执行。用一次额外调用换取执行方向的确定性。

Harness实战：Subagent——大任务拆小，上下文隔离

Agent工作越久，上下文越臃肿。Subagent机制把子任务放到独立messages[]中执行，只把精炼摘要带回父Agent。结合Plan模式，计划阶段列步骤，执行阶段委派subagent，上下文始终干净。

Harness实战：Worktree Isolation——让每个任务各干各的

上一篇Agent能自治循环了，但所有Agent共享一个工作目录——两个Agent同时改同一个文件就互相污染。这篇用git worktree给每个任务创建独立工作目录，加上TaskBoard任务看板和事件流，实现双平面架构（控制面+执行面）、双状态机联动、崩溃恢复。从17个工具扩展到25个，从"共享空间"进化为"各干各的"。

Hermes Agent 接入 HuanCode 配置指南（国内直连，无需梯子）

在 Hermes Agent 中配置 HuanCode 作为 LLM Provider，国内直连，支持 Claude / GPT / DeepSeek，微信支付按量充值。

Hermes Agent开发实战：从API调用到Tool Use

Agent 工程的第一步不是写循环，而是搞清楚怎么调大模型。一篇讲透 OpenAI、Claude、DeepSeek 三大主流厂商的 API 的异同，从基础调用到多轮对话再到工具调用。

Hermes Agent 是如何越用越聪明的

没有梯度更新，没有微调，Hermes 靠三个互相配合的持久化系统实现跨会话的知识积累——Memory、Skills、Session Search，加上一个后台自动复盘机制，让 Agent 真正做到"用得越多，懂得越多"。

我用 LiteLLM 接了 AWS Bedrock 做了个 Claude API 平台，现在找种子用户，V2EX 用户专属 100 元无门槛优惠券

国内开发者自建的 Claude API 平台，LiteLLM 对接 AWS Bedrock，人民币计费，不是 CC 中转。刚上线，寻找有真实开发需求的种子用户，V2EX 专属赠送 100 元体验额度。

12课拆解Claude Code架构：从零掌握Agent Harness工程

Learn Claude Code 开源教程深度解析，12 个递进式课程带你从一个 while 循环走到多 Agent 团队协作与 Worktree 隔离执行。

base_url 到底要不要带 /v1？源码级解析

用 OpenAI SDK 对接第三方 API 时，base_url 带不带 /v1 都能跑通？深入 Python 和 Node.js SDK 源码，彻底搞清楚 base_url 的拼接机制。

OpenClaw 接入 HuanCode 配置指南（国内直连，无需梯子）

在 OpenClaw AI Agent 框架中配置 HuanCode 作为 LLM 网关，国内直连，支持 Claude / GPT / DeepSeek，微信支付按量充值。

Playwright 浏览器安装慢？一文搞定国内加速方案

npx playwright install chromium 下载龟速甚至超时？本文给出手动下载离线安装方案，彻底解决国内网络下 Playwright 浏览器安装慢的问题。

第1课：用20行Python造出你的第一个AI Agent

一个 while 循环 + 一个 Bash 工具，就是所有 AI Agent 的骨架。从零手写一个能操作真实世界的 Agent。

第2课：给Agent加工具 —— dispatch map模式详解

从1个Bash工具扩展到4个专用工具，核心是一个dispatch map字典。新增工具只需注册一个handler，循环一行不改。

第3课：TodoWrite —— 让Agent先想后做：规划系统

多步任务中模型会丢失进度、跳步、跑偏。TodoManager 用一个带状态的待办列表 + nag reminder，让 Agent 从"走哪算哪"变成"按计划推进"。

第4课：Subagent —— 拆解大任务，上下文隔离

父Agent把大任务拆成子任务，每个子任务用独立上下文执行，只有最终结果返回。用30行Python实现Claude Code的子Agent隔离机制。

第5课：按需加载领域知识——Skill机制

10个Skill每个2000 token就是20000 token，大部分跟当前任务无关。两层注入架构让Agent只在需要时才加载对应知识。用40行Python实现Claude Code的Skill加载机制。

第6课：无限对话——上下文压缩三层策略

上下文窗口有限，但Agent任务无限。三层压缩策略——micro_compact静默裁剪、auto_compact自动摘要、compact工具手动触发——让Agent在大项目中永不断档。

第7课：任务持久化——文件级DAG任务图

s03的TodoManager只是内存扁平清单——没有顺序、没有依赖、压缩后就没了。TaskManager用文件级DAG把任务图写入磁盘，支持依赖解锁和三状态流转，成为后续所有机制的协调骨架。

第8课：后台执行——异步任务与通知队列

慢操作丢后台，Agent继续想下一步。用线程安全的通知队列让Agent不再干等npm install跑完。

第9课：Agent Teams——多Agent协作：团队与邮箱系统

一个Agent干不完的事，交给一支团队。用TeammateManager+JSONL邮箱，让多个持久Agent各司其职、异步通信。

第10课：团队协议——状态机驱动的协商

队友能干活能通信，但缺结构化协调。用request-response模式+共享FSM，让关机有握手、计划有审批，一个状态机套两种协议。

第11课：自治Agent——自组织任务认领

队友自己看看板，有活就认领。WORK-IDLE双阶段循环+身份重注入，让多Agent团队从手动指派走向自组织协作。

第12课：终极隔离——Worktree并行执行

到s11所有任务共享一个目录，两个Agent同时改同一个文件就互相污染。Worktree给每个任务一个独立的git目录，控制面与执行面彻底分离。

微信公众号草稿箱 API：新增草稿 (draft/add)

微信公众号 draft/add 接口的参数、调用方式与返回值说明，覆盖订阅号与服务号。

为什么 AI Agent 都选了终端？

从 Claude Code 到 Codex CLI，为什么最强的 AI 编程工具都选择了命令行界面。本文从 Unix 哲学、LLM 本质、成本优势和架构适配四个维度解析 CLI 成为 Agent 原生界面的深层逻辑。

在中国用 Windsurf？接入 HuanCode API 告别网络烦恼

手把手教你在 Windsurf IDE 中配置 HuanCode 自定义 API，国内直连，微信支付，无需外币信用卡，畅用 Claude、GPT、DeepSeek 全系模型。