Skip to content

ningbo00/token-saver-loop

Repository files navigation

Token Saver Loop

重度 AI 编程用户的 Token 省钱工作流:别再让最贵的模型反复读文件、跑命令、试错和写进度。

Languages: 中文 | English | 日本語 | 한국어

License: MIT Version Workflow

如果你每天用 Codex、Claude Code、Cursor、DeepSeek、Kimi、GLM、Qwen 等 AI 工具写代码,最大的浪费通常不是“模型不会写”,而是:最贵的模型一直在做低价值体力活

Token Saver Loop 动图演示

30 秒看懂

你可能已经遇到过这些问题:

  • 账单/额度烧得快:高价模型把大量 token 花在读仓库、看日志、反复 debug 上。
  • 上下文越来越脏:同一个聊天越做越长,需求、错误尝试、无关文件混在一起。
  • 模型自改自审不可靠:一个模型既写代码又宣布自己成功,review 成本反而变高。

Token Saver Loop 的做法很直接:

强 reviewer 模型:只负责规划、设边界、验收证据
低成本 worker 模型:负责读文件、改代码、跑测试、写报告

结果是:贵模型少读长上下文,便宜模型承担执行噪音,最终仍由 reviewer 决定 pass/fix/stop。

可信边界:

  • 本地文件工作流:没有服务器、没有账号、没有 API key 要配置。
  • 复制即用:把 portable/token-saver-kit/ 放进项目根目录即可。
  • 证据优先:worker 必须输出改动文件、命令结果、风险和验证状态。
  • 验收不外包:低成本 worker 不拥有最终通过权。
  • 已测试:当前 Python 测试 95 个通过,项目 MIT 开源。

5 分钟试用

Reviewer 规划 -> Worker 执行 -> Worker 写证据 -> Reviewer 决定 pass/fix/stop -> 下一轮 worker
  1. portable/token-saver-kit/ 复制进目标项目。
  2. 对 reviewer 模型说:
Read token-saver-kit/START_HERE.md and act as reviewer only.
  1. 对 worker 模型说:
Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.
  1. worker 完成后,把结果交回 reviewer:
Review the latest worker evidence in token-saver-kit and decide the next step.

第一次安全试跑可以看 examples/minimal-task.md。完整新手路径看 docs/BEGINNER_GUIDE.md

更多案例:


快速开始(Portable,无需安装)

Token Saver Loop 是 portable-only 工具,不需要运行安装器。

  1. 把本仓库的 portable/token-saver-kit 复制到你的项目根目录。

    或者在你的项目根目录打开 CMD,直接复制运行。

    最新 master 版本:

    rmdir /S /Q "%TEMP%\token-saver-loop-kit" 2>NUL & git clone --depth 1 https://github.com/ningbo00/token-saver-loop.git "%TEMP%\token-saver-loop-kit" && xcopy "%TEMP%\token-saver-loop-kit\portable\token-saver-kit" "token-saver-kit" /E /I /Y && rmdir /S /Q "%TEMP%\token-saver-loop-kit"

    固定 v1.08 版本:

    rmdir /S /Q "%TEMP%\token-saver-loop-kit" 2>NUL & git clone --depth 1 --branch v1.08 https://github.com/ningbo00/token-saver-loop.git "%TEMP%\token-saver-loop-kit" && xcopy "%TEMP%\token-saver-loop-kit\portable\token-saver-kit" "token-saver-kit" /E /I /Y && rmdir /S /Q "%TEMP%\token-saver-loop-kit"

    想体验最新改进,用最新版命令;想保证项目可复现,使用固定版本命令。

    后续移除方式:项目做完后,或者你不再需要这个工作流时,直接删除项目根目录里的 token-saver-kit 文件夹即可。

  2. 把这段固定话术发给 reviewer 模型:

Read token-saver-kit/START_HERE.md and act as reviewer only.
  1. 把这段固定话术发给 worker 模型:
Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.
  1. worker 完成后,把这段固定话术发回 reviewer 模型:
Review the latest worker evidence in token-saver-kit and decide the next step.

功能简介

Token Saver Loop 是一个 portable-only 的 AI 协作工作流套件,用来把高价 reviewer 工作和低成本执行工作分开。

当前能力:

  • 复制即用、删除即走:把 token-saver-kit/ 放进项目根目录,用完直接删除。
  • reviewer / worker 分工:reviewer 负责规划和验收,worker 负责修改、测试和报告证据。
  • 固定短话术:worker 读取 LATEST_WORKER_PROMPT.md,用户不需要手动找 round 路径。
  • 证据裁决:工具输出 PASSFIX_SAME_TIERDOWNGRADESTOP,但不替代 reviewer 最终验收。
  • 结构化项目记忆.ai/project_memory/ 保存当前目标、架构笔记、已验收事项、风险和最新证据。
  • 低摩擦检查:检查缺失报告、验证失败、超范围、生成文件污染、危险 git 命令等关键问题。
  • 模型无关:任何能读文件并遵守 handoff 的 reviewer/worker 模型或 CLI 都可以使用。

一、用户核心痛点

使用主流高价通用大模型做代码迭代、仓库梳理、文档编撰时,几乎都会遇到三类无解问题:

  1. 账单失控:70%以上高价Token消耗在文件检索、反复调试、进度汇报等低价值体力环节,决策只占极少开销

  2. 任务发散:单模型自给自足,对话上下文越长,越容易偏离原始需求、过度修改代码

  3. 经验流失:会话记忆临时且脆弱,项目审查标准、踩坑记录无法跨会话复用,每次使用都要重复交底


二、核心收益(唯一主收益:降低高价模型Token消耗)

核心底层逻辑:不是减少AI工作量,而是不让最贵的模型做体力活,硬性压低高价Token账单

所有其他能力均为附带增益,不属于项目核心定位

核心收益 落地效果
高价Token大幅降本 把高价模型90%的无效Token消耗转移给低价模型,常规AI开发任务直接降低75%高价账单

三、真实降本数据测算

3.1 同任务开销对比

以常规代码优化任务为例,原单高价模型全流程消耗8000Token,改造后开销对比如下:

工作内容 传统单模型(高价Token) Token Saver Loop(高价Token)
任务规划、风险判定、最终验收 2000 2000
仓库检索、批量读取源码 2400 0(低成本执行模型承接)
代码修改、bug重试、测试跑通 2800 0(低成本执行模型承接)
过程日志、进度汇报 800 0(本地文件系统承接)
高价Token总计 8000 2000(降幅75%)

收益边界:执行工作量越大、审查只抽查核心结果,降本越明显;一次性极简短任务几乎无收益

3.2 高适配任务清单(优先使用)

任务场景 降本原理
大型仓库源码探索、依赖梳理 低价模型遍历百级文件,高价模型仅查看最终梳理结论
全局批量命名、注释统一 低价模型批量执行固定模式,高价模型抽查diff风险
接口联调、循环debug 低价模型承接反复重试,高价模型只复盘最终报错
多语言文档初稿、长文档编撰 低价模型填充内容,高价模型校验结构、专业术语

四、适配/不适配场景(快速自我判断)

✅ 适合使用

  • 需要分离执行、审查双模型,规避AI改错代码

  • 同时维护多个代码仓库,想要统一AI开发规范

  • 厌倦超长聊天上下文,希望用本地文件永久留存任务记录

  • 需要严格限制AI修改文件数量、禁止越权改动核心配置

❌ 无需使用

  • 一次性简短问答、单文件微小修改,一轮对话即可完成

  • 无降本、风险管控、经验复用需求


五、三方角色极简分工

框架完全模型无关、无绑定、无部署依赖。通俗角色划分:我们只需要两类大模型,无需绑定特定产品: 1. 低成本通用模型或 CLI(执行端) 2. 高阶推理模型(审查端)

  • 执行模型(Worker):纯体力执行。文件检索、代码编辑、测试运行、报错重试、产出日志diff,无最终决策权

  • 审查模型(Reviewer):纯决策管控。拆分细粒度任务、划定操作边界、核查改动结果、给出最终裁决

  • 本地文件系统:永久记忆载体。存储任务工单、改动diff、审查日志、项目规则,替代易丢失聊天上下文


六、60秒零门槛上手(直白说明:普通人怎么用)

一句话使用原理:不用安装软件、不用写代码、不用配置密钥。仅复制项目内一个文件夹,打开两个AI网页,分别粘贴一句固定话术,即可完成整套循环。全程本地文件流转,不改动原有代码。

极简4步上手(人话+复制指令二合一,无需来回切换)

  1. 步骤1(本地准备):将仓库内 portable/token-saver-kit 文件夹,复制粘贴到你自己的项目根目录

  2. 步骤2(审查模型下发任务):打开高阶推理大模型,粘贴下面的 reviewer 启动话术。它只允许规划,不允许修改项目源码。

  3. 步骤3(执行模型干活):打开 worker 模型,粘贴 reviewer 准备好的 worker handoff prompt。

  4. 步骤4(审查模型验收):切回高阶推理大模型,粘贴下面的 reviewer 审查话术。

可重复使用的固定话术

reviewer 启动:

Read token-saver-kit/START_HERE.md and act as reviewer only.

worker 执行:

Read token-saver-kit/LATEST_WORKER_PROMPT.md and execute it.

reviewer 审查:

Review the latest worker evidence in token-saver-kit and decide the next step.

七、套件核心文件说明

套件状态独立存储,默认不会主动修改项目原有代码

文件路径 核心用途
START_HERE.md 双模型统一入口,定义基础使用约束
WORKER_NEXT_TASK.md 当前轮次下发给执行模型的具体任务
REVIEWER_CONTINUE.md 新建审查会话时的上下文引导文件
.ai/active_task/ 本地存储轮次日志、改动diff、裁决结果
tools/ 任务初始化、批量审查辅助脚本

八、完整闭环工作流(看懂即可,无需手动操作)

流程简述:审查拆分任务→文件交接→执行落地→产出结果包→审查四向裁决→循环迭代

%%{init: {"theme": "base", "themeVariables": {"background": "transparent", "primaryColor": "#1f6feb", "primaryTextColor": "#ffffff", "primaryBorderColor": "#58a6ff", "lineColor": "#8b949e", "secondaryColor": "#238636", "tertiaryColor": "#30363d"}}}%%
flowchart TD
    A[审查模型规划一个小任务]
    B[任务交接文件]
    C[执行模型执行一轮受限工作]
    D[结果包报告 + 差异 + 日志 + 测试]
    E[审查模型检查结果]
    F{裁决}
    G[通过开始下一个任务]
    H[修复用相同限制重试]
    I[降级用更严格限制重试]
    J[停止人类决定]

    A --> B --> C --> D --> E --> F
    F --> G --> A
    F --> H --> B
    F --> I --> B
    F --> J

    classDef reviewer fill:#1f6feb,stroke:#58a6ff,color:#ffffff
    classDef worker fill:#238636,stroke:#3fb950,color:#ffffff
    classDef file fill:#6e40c9,stroke:#a371f7,color:#ffffff
    classDef verdict fill:#d29922,stroke:#f2cc60,color:#000000
    classDef outcome fill:#30363d,stroke:#8b949e,color:#ffffff
    class A,E reviewer
    class C worker
    class B,D file
    class F verdict
    class G,H,I,J outcome
Loading

裁决分支说明:通过/同级修复/收紧权限降级/人工终止,四类闭环无遗漏


九、质量、风险与长期顾虑解答

用户在降本之外最关心4个隐性顾虑:降本会不会牺牲代码质量?会不会任务跑偏?经验能不能复用?能不能多项目通用。以下为全套附带保障,无需额外付费、不增加Token消耗:

  1. 避免任务失控(防跑偏):每轮任务限定文件修改范围、操作权限,阻断模型无边界自由发挥,解决长对话需求偏离问题

  2. 消除自审盲区(保质量):执行、审查模型物理分离,规避单模型自改自审、忽略漏洞、自我美化的通病

  3. 长期复利提效(附带降本增益):随着使用,项目会沉淀AI调用规则、踩坑标准,后续无需重复向模型交底,进一步隐性减少无效Token消耗

  4. 零成本跨项目复用:无框架依赖,复制便携套件即可接入任意仓库,统一全仓库AI开发标准

原有独立安全风控条目精简合并,和质量顾虑打通,避免内容割裂:

  1. 权限分离与防误改:执行模型无最终决策权,所有改动必须审查核验,默认禁止自动Git提交

  2. 四级权限兜底:从只读T0起步,逐级放开修改权限,杜绝越权改动核心配置

  3. 结果导向核验:只校验代码diff、测试日志,不采信模型口头汇报,规避话术造假

  4. 便携删除:运行状态保存在 token-saver-kit/ 内部,移除循环只需要删除这个文件夹。


十、进阶用法(新手99%用不到,直接跳过)

10.1 最小安全示例

查看 examples/minimal-task.md,提供零代码改动的T0仓库巡检任务,适合首次测试验证流程

10.2 开发者辅助工具

Python 包里保留了可选的诊断和指标辅助能力,主要给贡献者使用。普通用户使用 portable workflow 时不需要这些命令。


十一、新手高频FAQ

  • Q:必须用某个特定 worker + reviewer 模型组合吗? A:完全不需要。套件只是默认举例,任意「低价执行模型+高价审查模型」都能替换,不用改动套件内部文件

  • Q:会不会污染原有项目文件? A:所有运行数据存在套件内部.ai目录,默认仅读取源码,不主动写入项目业务文件

  • Q:看不懂流程去哪里学习? A:纯新手直接阅读 docs/BEGINNER_GUIDE.md,图文分步教学


十二、项目状态与开源许可

12.1 功能进度

功能 状态
免安装便携套件 已完成(portable目录)
新手图文指南、最小示例 已完成
Python CLI doctor、Token指标统计 已完成
跨模型通用模板、任务诊断命令 规划中

12.2 许可

MIT License,允许自由商用、二次修改分发

(注:文档部分内容可能由 AI 生成)

About

Portable reviewer/worker workflow kit for AI coding agents. Reduce premium model context waste by moving execution, retries, and evidence collection to bounded worker rounds.

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Packages

 
 
 

Contributors