重度 AI 编程用户的 Token 省钱工作流:别再让最贵的模型反复读文件、跑命令、试错和写进度。
Languages: 中文 | English | 日本語 | 한국어
如果你每天用 Codex、Claude Code、Cursor、DeepSeek、Kimi、GLM、Qwen 等 AI 工具写代码,最大的浪费通常不是“模型不会写”,而是:最贵的模型一直在做低价值体力活。
你可能已经遇到过这些问题:
- 账单/额度烧得快:高价模型把大量 token 花在读仓库、看日志、反复 debug 上。
- 上下文越来越脏:同一个聊天越做越长,需求、错误尝试、无关文件混在一起。
- 模型自改自审不可靠:一个模型既写代码又宣布自己成功,review 成本反而变高。
Token Saver Loop 的做法很直接:
强 reviewer 模型:只负责规划、设边界、验收证据
低成本 worker 模型:负责读文件、改代码、跑测试、写报告
结果是:贵模型少读长上下文,便宜模型承担执行噪音,最终仍由 reviewer 决定 pass/fix/stop。
可信边界:
- 本地文件工作流:没有服务器、没有账号、没有 API key 要配置。
- 复制即用:把
portable/token-saver-kit/放进项目根目录即可。 - 证据优先:worker 必须输出改动文件、命令结果、风险和验证状态。
- 验收不外包:低成本 worker 不拥有最终通过权。
- 已测试:当前 Python 测试
95个通过,项目 MIT 开源。
Reviewer 规划 -> Worker 执行 -> Worker 写证据 -> Reviewer 决定 pass/fix/stop -> 下一轮 worker
- 把
portable/token-saver-kit/复制进目标项目。 - 对 reviewer 模型说:
Read token-saver-kit/START_HERE.md and act as reviewer only.
- 对 worker 模型说:
Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.
- worker 完成后,把结果交回 reviewer:
Review the latest worker evidence in token-saver-kit and decide the next step.
第一次安全试跑可以看 examples/minimal-task.md。完整新手路径看 docs/BEGINNER_GUIDE.md。
更多案例:
- Codex worker round:有边界的代码修改和命令证据。
- Bugfix loop:一次聚焦修复尝试和 reviewer 升级决策。
- Docs and i18n loop:重复文档/本地化草稿,reviewer 只检查一致性和风险。
Token Saver Loop 是 portable-only 工具,不需要运行安装器。
-
把本仓库的
portable/token-saver-kit复制到你的项目根目录。或者在你的项目根目录打开 CMD,直接复制运行。
最新
master版本:rmdir /S /Q "%TEMP%\token-saver-loop-kit" 2>NUL & git clone --depth 1 https://github.com/ningbo00/token-saver-loop.git "%TEMP%\token-saver-loop-kit" && xcopy "%TEMP%\token-saver-loop-kit\portable\token-saver-kit" "token-saver-kit" /E /I /Y && rmdir /S /Q "%TEMP%\token-saver-loop-kit"
固定
v1.08版本:rmdir /S /Q "%TEMP%\token-saver-loop-kit" 2>NUL & git clone --depth 1 --branch v1.08 https://github.com/ningbo00/token-saver-loop.git "%TEMP%\token-saver-loop-kit" && xcopy "%TEMP%\token-saver-loop-kit\portable\token-saver-kit" "token-saver-kit" /E /I /Y && rmdir /S /Q "%TEMP%\token-saver-loop-kit"
想体验最新改进,用最新版命令;想保证项目可复现,使用固定版本命令。
后续移除方式:项目做完后,或者你不再需要这个工作流时,直接删除项目根目录里的
token-saver-kit文件夹即可。 -
把这段固定话术发给 reviewer 模型:
Read token-saver-kit/START_HERE.md and act as reviewer only.
- 把这段固定话术发给 worker 模型:
Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.
- worker 完成后,把这段固定话术发回 reviewer 模型:
Review the latest worker evidence in token-saver-kit and decide the next step.
Token Saver Loop 是一个 portable-only 的 AI 协作工作流套件,用来把高价 reviewer 工作和低成本执行工作分开。
当前能力:
- 复制即用、删除即走:把
token-saver-kit/放进项目根目录,用完直接删除。 - reviewer / worker 分工:reviewer 负责规划和验收,worker 负责修改、测试和报告证据。
- 固定短话术:worker 读取
LATEST_WORKER_PROMPT.md,用户不需要手动找 round 路径。 - 证据裁决:工具输出
PASS、FIX_SAME_TIER、DOWNGRADE、STOP,但不替代 reviewer 最终验收。 - 结构化项目记忆:
.ai/project_memory/保存当前目标、架构笔记、已验收事项、风险和最新证据。 - 低摩擦检查:检查缺失报告、验证失败、超范围、生成文件污染、危险 git 命令等关键问题。
- 模型无关:任何能读文件并遵守 handoff 的 reviewer/worker 模型或 CLI 都可以使用。
使用主流高价通用大模型做代码迭代、仓库梳理、文档编撰时,几乎都会遇到三类无解问题:
-
账单失控:70%以上高价Token消耗在文件检索、反复调试、进度汇报等低价值体力环节,决策只占极少开销
-
任务发散:单模型自给自足,对话上下文越长,越容易偏离原始需求、过度修改代码
-
经验流失:会话记忆临时且脆弱,项目审查标准、踩坑记录无法跨会话复用,每次使用都要重复交底
核心底层逻辑:不是减少AI工作量,而是不让最贵的模型做体力活,硬性压低高价Token账单
所有其他能力均为附带增益,不属于项目核心定位
| 核心收益 | 落地效果 |
|---|---|
| 高价Token大幅降本 | 把高价模型90%的无效Token消耗转移给低价模型,常规AI开发任务直接降低75%高价账单 |
以常规代码优化任务为例,原单高价模型全流程消耗8000Token,改造后开销对比如下:
| 工作内容 | 传统单模型(高价Token) | Token Saver Loop(高价Token) |
|---|---|---|
| 任务规划、风险判定、最终验收 | 2000 | 2000 |
| 仓库检索、批量读取源码 | 2400 | 0(低成本执行模型承接) |
| 代码修改、bug重试、测试跑通 | 2800 | 0(低成本执行模型承接) |
| 过程日志、进度汇报 | 800 | 0(本地文件系统承接) |
| 高价Token总计 | 8000 | 2000(降幅75%) |
收益边界:执行工作量越大、审查只抽查核心结果,降本越明显;一次性极简短任务几乎无收益
| 任务场景 | 降本原理 |
|---|---|
| 大型仓库源码探索、依赖梳理 | 低价模型遍历百级文件,高价模型仅查看最终梳理结论 |
| 全局批量命名、注释统一 | 低价模型批量执行固定模式,高价模型抽查diff风险 |
| 接口联调、循环debug | 低价模型承接反复重试,高价模型只复盘最终报错 |
| 多语言文档初稿、长文档编撰 | 低价模型填充内容,高价模型校验结构、专业术语 |
-
需要分离执行、审查双模型,规避AI改错代码
-
同时维护多个代码仓库,想要统一AI开发规范
-
厌倦超长聊天上下文,希望用本地文件永久留存任务记录
-
需要严格限制AI修改文件数量、禁止越权改动核心配置
-
一次性简短问答、单文件微小修改,一轮对话即可完成
-
无降本、风险管控、经验复用需求
框架完全模型无关、无绑定、无部署依赖。通俗角色划分:我们只需要两类大模型,无需绑定特定产品: 1. 低成本通用模型或 CLI(执行端) 2. 高阶推理模型(审查端)
-
执行模型(Worker):纯体力执行。文件检索、代码编辑、测试运行、报错重试、产出日志diff,无最终决策权
-
审查模型(Reviewer):纯决策管控。拆分细粒度任务、划定操作边界、核查改动结果、给出最终裁决
-
本地文件系统:永久记忆载体。存储任务工单、改动diff、审查日志、项目规则,替代易丢失聊天上下文
一句话使用原理:不用安装软件、不用写代码、不用配置密钥。仅复制项目内一个文件夹,打开两个AI网页,分别粘贴一句固定话术,即可完成整套循环。全程本地文件流转,不改动原有代码。
-
步骤1(本地准备):将仓库内
portable/token-saver-kit文件夹,复制粘贴到你自己的项目根目录 -
步骤2(审查模型下发任务):打开高阶推理大模型,粘贴下面的 reviewer 启动话术。它只允许规划,不允许修改项目源码。
-
步骤3(执行模型干活):打开 worker 模型,粘贴 reviewer 准备好的 worker handoff prompt。
-
步骤4(审查模型验收):切回高阶推理大模型,粘贴下面的 reviewer 审查话术。
reviewer 启动:
Read token-saver-kit/START_HERE.md and act as reviewer only.
worker 执行:
Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.
reviewer 审查:
Review the latest worker evidence in token-saver-kit and decide the next step.
套件状态独立存储,默认不会主动修改项目原有代码
| 文件路径 | 核心用途 |
|---|---|
START_HERE.md |
双模型统一入口,定义基础使用约束 |
WORKER_NEXT_TASK.md |
当前轮次下发给执行模型的具体任务 |
REVIEWER_CONTINUE.md |
新建审查会话时的上下文引导文件 |
.ai/active_task/ |
本地存储轮次日志、改动diff、裁决结果 |
tools/ |
任务初始化、批量审查辅助脚本 |
流程简述:审查拆分任务→文件交接→执行落地→产出结果包→审查四向裁决→循环迭代
%%{init: {"theme": "base", "themeVariables": {"background": "transparent", "primaryColor": "#1f6feb", "primaryTextColor": "#ffffff", "primaryBorderColor": "#58a6ff", "lineColor": "#8b949e", "secondaryColor": "#238636", "tertiaryColor": "#30363d"}}}%%
flowchart TD
A[审查模型规划一个小任务]
B[任务交接文件]
C[执行模型执行一轮受限工作]
D[结果包报告 + 差异 + 日志 + 测试]
E[审查模型检查结果]
F{裁决}
G[通过开始下一个任务]
H[修复用相同限制重试]
I[降级用更严格限制重试]
J[停止人类决定]
A --> B --> C --> D --> E --> F
F --> G --> A
F --> H --> B
F --> I --> B
F --> J
classDef reviewer fill:#1f6feb,stroke:#58a6ff,color:#ffffff
classDef worker fill:#238636,stroke:#3fb950,color:#ffffff
classDef file fill:#6e40c9,stroke:#a371f7,color:#ffffff
classDef verdict fill:#d29922,stroke:#f2cc60,color:#000000
classDef outcome fill:#30363d,stroke:#8b949e,color:#ffffff
class A,E reviewer
class C worker
class B,D file
class F verdict
class G,H,I,J outcome
裁决分支说明:通过/同级修复/收紧权限降级/人工终止,四类闭环无遗漏
用户在降本之外最关心4个隐性顾虑:降本会不会牺牲代码质量?会不会任务跑偏?经验能不能复用?能不能多项目通用。以下为全套附带保障,无需额外付费、不增加Token消耗:
-
避免任务失控(防跑偏):每轮任务限定文件修改范围、操作权限,阻断模型无边界自由发挥,解决长对话需求偏离问题
-
消除自审盲区(保质量):执行、审查模型物理分离,规避单模型自改自审、忽略漏洞、自我美化的通病
-
长期复利提效(附带降本增益):随着使用,项目会沉淀AI调用规则、踩坑标准,后续无需重复向模型交底,进一步隐性减少无效Token消耗
-
零成本跨项目复用:无框架依赖,复制便携套件即可接入任意仓库,统一全仓库AI开发标准
原有独立安全风控条目精简合并,和质量顾虑打通,避免内容割裂:
-
权限分离与防误改:执行模型无最终决策权,所有改动必须审查核验,默认禁止自动Git提交
-
四级权限兜底:从只读T0起步,逐级放开修改权限,杜绝越权改动核心配置
-
结果导向核验:只校验代码diff、测试日志,不采信模型口头汇报,规避话术造假
-
便携删除:运行状态保存在
token-saver-kit/内部,移除循环只需要删除这个文件夹。
查看 examples/minimal-task.md,提供零代码改动的T0仓库巡检任务,适合首次测试验证流程
Python 包里保留了可选的诊断和指标辅助能力,主要给贡献者使用。普通用户使用 portable workflow 时不需要这些命令。
-
Q:必须用某个特定 worker + reviewer 模型组合吗? A:完全不需要。套件只是默认举例,任意「低价执行模型+高价审查模型」都能替换,不用改动套件内部文件
-
Q:会不会污染原有项目文件? A:所有运行数据存在套件内部.ai目录,默认仅读取源码,不主动写入项目业务文件
-
Q:看不懂流程去哪里学习? A:纯新手直接阅读 docs/BEGINNER_GUIDE.md,图文分步教学
| 功能 | 状态 |
|---|---|
| 免安装便携套件 | 已完成(portable目录) |
| 新手图文指南、最小示例 | 已完成 |
| Python CLI doctor、Token指标统计 | 已完成 |
| 跨模型通用模板、任务诊断命令 | 规划中 |
MIT License,允许自由商用、二次修改分发
(注:文档部分内容可能由 AI 生成)
