Files
document_analyzer/docs/GLOBAL_STATE.md
T

4.7 KiB
Raw Blame History

项目全局状态(截至 2026-06-02 19:00

参考章程

详见 PROJECT_CHARTER.md。章程中定义的长期目标与原则是当前决策的最高依据。

当前阶段目标

核心目标(对齐章程):IR 功能覆盖率 ≥ 70%Layer A+B+C 全部通过

本日迭代成果:13 个 Issue 关闭,核心成果:

  • IR 覆盖率 57.4% → 86.1%Layer B PASS
  • _normalize_rule 防御层建立:处理 6 种 LLM 输出变异
  • DEV_AGENT.md 流程规范完整建立

Pipeline 架构

input/*.docx → doc_parser → _parsed.json
                           ↓
              step1_semantic_index → semantic_index.json
                           ↓
              step2_ir_extraction → ir_fragments.json
                           ↓
              step2_5_branch_coverage → ir_autocomplete_fragments.json
                           ↓
              step3_merge_and_audit → ir_final.json + ir_audit_report.md

核心模块:

  • skills/doc_parser_skill/ — 文档解析(文本、表格、图片、冲突检测)
  • skills/ir_generation_skill/ — IR 生成(step1/2/2.5/3
  • tests/acceptance/ — 验收测试(Layer A Schema / Layer B Coverage / Layer C QE Audit
  • scripts/agent_poller.py — Gitea Issue/PR 操作工具

已探索方向 & 结论

方向 状态 结论摘要 关联 Issue
零内容维度均分 bug 已闭合 _measure_coverage: 0/0 维度 rate 1.0 + 排除出 overall 均分 #21
LLM 输出防御层 已闭合 _normalize_rule 处理 6 种变异:null trigger/conditions, 缺失 section, 非法 type, 空 sources, section=list, null row #53, #64, #69, #73
覆盖反馈重试优化 已闭合 重试 1→3 次 + 质量门控(仅采纳提升覆盖率的 retry+ ensemble 3→4 temps #54, #75
step2 prompt 完整性 已闭合 新增规则 #9:强制覆盖所有表格行和文字描述 #75
Dev-Agent 流程规范 已闭合 修复类型区分、批处理策略、关闭规范、研究型修复、禁止模式 #67, #79
QE Agent 基础设施 已闭合 label 体系统一 (test-code/product-code), agent_poller 增强 (create-issue/reopen/blocked-check/auto-unblock/_req_safe), bypass 配置 #40, #43, #47, #49, #51, #58, #61
conftest 防御降级 已闭合 ir_data fixture: list-section flatten + normalize 异常回退 raw rule #70
QE 全天轮询实战 已闭合 7 轮 e2e, 15 个 Issue 处理, Layer A 归零→PASS, Layer B 63%→98.1% #18, #66
多 Agent 协作闭环 已闭合 Dev+QE 通过 Gitea Issues 协同迭代 #15

已知问题清单

  • [P0] IR 结构化覆盖率不足(#21) — 86.1%Layer B PASS
  • 表格行覆盖率统计(#34 — 已合入 main
  • source 缺失 section#53 — _normalize_rule 防御
  • QE Audit 80%#54 — 重试 + 质量门控
  • 覆盖率回归 63%#57 — ir_data fixture normalize
  • 空 sources#64 — 补充 text source
  • section 为 list#69 — _clean_section()
  • null row#73 — row=0
  • Layer C QE Audit 持续 REJECT#75)— 质量级修复,需 pipeline 验证后关闭
  • 缺少完整 e2e 测试(#18test-codeQE 域)

当前打开 Issue(非纯测试)

# 标题 优先级 状态
#75 Layer C QE Audit REJECT 质量级 多轮代码改动已合入,待 pipeline 验证

下次启动推荐起点

  1. 读取 docs/PROJECT_CHARTER.mddocs/GLOBAL_STATE.md
  2. 运行 python scripts/agent_poller.py --action list 获取最新 Issue
  3. #75 如仍 open:按质量级修复流程,跑 pipeline + e2e 验证,不关 Issue 直到验证通过
  4. 如 QE Agent 有新的 product-code Issue:先判断类型再走对应流程
  5. 严格遵守 Issue 关闭规范和禁止模式清单

最近变更日志

日期 变更 原因
2026-06-02 DEV_AGENT.md v4Issue 关闭规范 + 研究型修复 + 禁止模式 + 修复类型区分 - Closes #79 #75 3 轮重开暴露流程缺陷
2026-06-02 step2 prompt 增加功能完整性要求 - Closes #75 R3 强调覆盖所有表格行
2026-06-02 ensemble 温度 3→4 - Closes #75 R2 增加多样性
2026-06-02 重试 2→3 + 放宽质量门控 - Closes #75 R1 更多补全机会
2026-06-02 step3 _normalize_rule 防御层建立 (5 次迭代) - Closes #53, #64, #69, #73 LLM 输出变异防御
2026-06-02 PR 前 e2e 验收流程 - Closes #67 防止修复回归
2026-06-02 _measure_coverage 零内容维度不拉低 overall - Closes #21 0/0=0%→1.0+排除均分
2026-06-02 agent 配置纳入版本管理 + docs/ - Closes #37 项目章程与全局状态