Files
document_analyzer/docs/GLOBAL_STATE.md
T
pzhang_zywl fb05ee6045
CI / test (pull_request) Successful in 8s
docs: QE-Agent session 收尾更新 GLOBAL_STATE + 合并 Dev-Agent 日间更新 - Closes #82
合并 Dev-Agent (v4 流程规范) + QE-Agent (15 Issue 基础设施) 的全局状态更新
A: 4 ERROR→PASS, B: 63%→98.1%, 90% 闭环率

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-06-02 20:07:14 +08:00

5.3 KiB
Raw Blame History

项目全局状态(截至 2026-06-02 20:00

参考章程

详见 PROJECT_CHARTER.md。章程中定义的长期目标与原则是当前决策的最高依据。

当前阶段目标

核心目标(对齐章程):IR 功能覆盖率 ≥ 70%Layer A+B+C 全部通过

本日迭代成果15+ Issue 关闭,核心成果:

  • IR 覆盖率 57.4% → 98.1%Layer B PASS,最高 98.1%
  • _normalize_rule 防御层建立:处理 6 种 LLM 输出变异
  • Agent 基础设施完善:label 体系 / agent_poller 增强 / bypass 全自动 / session 收尾规范
  • DEV_AGENT.md 流程规范完整建立(v4:修复类型、批处理、关闭规范、禁止模式)

Pipeline 架构

input/*.docx → doc_parser → _parsed.json
                           ↓
              step1_semantic_index → semantic_index.json
                           ↓
              step2_ir_extraction → ir_fragments.json
                           ↓
              step2_5_branch_coverage → ir_autocomplete_fragments.json
                           ↓
              step3_merge_and_audit → ir_final.json + ir_audit_report.md

核心模块:

  • skills/doc_parser_skill/ — 文档解析(文本、表格、图片、冲突检测)
  • skills/ir_generation_skill/ — IR 生成(step1/2/2.5/3
  • tests/acceptance/ — 验收测试(Layer A Schema / Layer B Coverage / Layer C QE Audit
  • scripts/agent_poller.py — Gitea Issue/PR 操作工具

已探索方向 & 结论

方向 状态 结论摘要 关联 Issue
零内容维度均分 bug 已闭合 _measure_coverage: 0/0 维度 rate 1.0 + 排除出 overall 均分 #21
LLM 输出防御层 已闭合 _normalize_rule 处理 6 种变异:null trigger/conditions, 缺失 section, 非法 type, 空 sources, section=list, null row #53, #64, #69, #73
覆盖反馈重试优化 已闭合 重试 1→3 次 + 质量门控(仅采纳提升覆盖率的 retry+ ensemble 3→4 temps #54, #75
step2 prompt 完整性 已闭合 新增规则 #9:强制覆盖所有表格行和文字描述 #75
Dev-Agent 流程规范 已闭合 修复类型区分、批处理策略、关闭规范、研究型修复、禁止模式 #67, #79
QE Agent 基础设施 已闭合 label 体系统一 (test-code/product-code), agent_poller 7 项增强 (create-issue/reopen/blocked-check/auto-unblock/_req_safe), bypass 全自动配置 #40, #43, #47, #49, #51, #58, #61
conftest 防御降级 已闭合 ir_data fixture: list-section flatten + normalize 异常回退 raw rule #70
QE 全天轮询实战 已闭合 7 轮 e2e, 15 Issue, A: 4 ERROR→PASS, B: 63%→98.1%, C: 持续 REJECT #18, #66
多 Agent 协作闭环 已闭合 Dev+QE 通过 Gitea Issues 协同迭代 #15

已知问题清单

  • [P0] IR 结构化覆盖率不足(#21) — 98.1%Layer B PASS
  • 表格行覆盖率统计(#34 — 已合入 main
  • source 缺失 section#53 — _normalize_rule 防御
  • QE Audit 80%#54 — 重试 + 质量门控
  • 覆盖率回归 63%#57 — ir_data fixture normalize
  • 空 sources#64 — 补充 text source
  • section 为 list#69 — flatten to first
  • null row#73 — row=0
  • Layer C QE Audit 持续 REJECT#75)— 多次代码改动已合入,待 pipeline 验证
  • 缺少完整 e2e 测试(#18test-codeQE 域)

当前打开 Issue(非纯测试)

# 标题 优先级 状态
#18 [test] 再运行一次完整的e2e测试 中(A+B PASS
#75 Layer C QE Audit REJECT 质量级 多轮代码改动已合入,待 pipeline 验证
#67 Dev-Agent PR 前必须跑完整 e2e
#79 [product] 系统性的分析和反思项目开发流程 高(Dev-Agent 自我反思)

下次启动推荐起点

  1. 读取 docs/PROJECT_CHARTER.mddocs/GLOBAL_STATE.md
  2. 运行 python scripts/agent_poller.py --action list 获取最新 Issue
  3. #75 如仍 open:跑 pipeline + e2e 验证 Layer C
  4. 严格遵守 Issue 关闭规范和禁止模式清单

最近变更日志

日期 变更 原因
2026-06-02 QE session 收尾:15 Issue, 90% 闭环率, A 4 ERROR→PASS, B 63%→98.1% QE-Agent 全天轮询
2026-06-02 DEV_AGENT.md v4Issue 关闭规范 + 研究型修复 + 禁止模式 + 修复类型区分 - Closes #79 #75 3 轮重开暴露流程缺陷
2026-06-02 agent_poller 大幅增强:create-issue/reopen/blocked-check/auto-unblock/_req_safe QE session 累积 7 项改进
2026-06-02 Agent 文档更新:label 体系/blocked 处理/完整流程/bypass 配置 QE session 规范化
2026-06-02 step2 prompt 增加功能完整性要求 + ensemble 温度 3→4 - Closes #75 R1-3 提高覆盖质量
2026-06-02 step3 _normalize_rule 防御层建立 (5 次迭代) - Closes #53, #64, #69, #73 LLM 输出变异防御
2026-06-02 PR 前 e2e 验收流程 - Closes #67 防止修复回归
2026-06-02 _measure_coverage 零内容维度不拉低 overall - Closes #21 0/0=0%→1.0+排除均分
2026-06-02 agent 配置纳入版本管理 + docs/ - Closes #37 项目章程与全局状态
2026-06-01 test: _extract_content_units 仅统计功能章节表格行 - Closes #33 修复表格覆盖率误计