Files
document_analyzer/docs/GLOBAL_STATE.md
T
pzhang_zywl 9050d7dea4
CI / test (pull_request) Successful in 8s
docs: Session da-0603-1426 收尾更新 GLOBAL_STATE.md - Closes #93
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-06-03 15:35:36 +08:00

6.6 KiB
Raw Blame History

项目全局状态(截至 2026-06-03 15:30

参考章程

详见 PROJECT_CHARTER.md。章程中定义的长期目标与原则是当前决策的最高依据。

当前阶段目标

核心目标(对齐章程):IR 功能覆盖率 ≥ 70%Layer A+B+C 全部通过

本日迭代成果15+ Issue 关闭,核心成果:

  • IR 覆盖率 57.4% → 98.1%Layer B PASS,最高 98.1%
  • _normalize_rule 防御层建立:处理 6 种 LLM 输出变异
  • Agent 基础设施完善:label 体系 / agent_poller 增强 / bypass 全自动 / session 收尾规范
  • DEV_AGENT.md 流程规范完整建立(v4:修复类型、批处理、关闭规范、禁止模式)

Pipeline 架构

input/*.docx → doc_parser → _parsed.json
                           ↓
              step1_semantic_index → semantic_index.json
                           ↓
              step2_ir_extraction → ir_fragments.json
                           ↓
              step2_5_branch_coverage → ir_autocomplete_fragments.json
                           ↓
              step3_merge_and_audit → ir_final.json + ir_audit_report.md

核心模块:

  • skills/doc_parser_skill/ — 文档解析(文本、表格、图片、冲突检测)
  • skills/ir_generation_skill/ — IR 生成(step1/2/2.5/3
  • tests/acceptance/ — 验收测试(Layer A Schema / Layer B Coverage / Layer C QE Audit
  • scripts/agent_poller.py — Gitea Issue/PR 操作工具

已探索方向 & 结论

方向 状态 结论摘要 关联 Issue
零内容维度均分 bug 已闭合 _measure_coverage: 0/0 维度 rate 1.0 + 排除出 overall 均分 #21
LLM 输出防御层 已闭合 _normalize_rule 处理 7 种变异:+ precondition 字段缺失(screen_type/geo 默认值) #53, #64, #69, #73, #86
覆盖反馈重试优化 已闭合 重试 1→3 次 + 质量门控(仅采纳提升覆盖率的 retry+ ensemble 3→4 temps #54, #75
step2 prompt 完整性 已闭合 新增规则 #9:强制覆盖所有表格行和文字描述 #75
Dev-Agent 流程规范 已闭合 修复类型区分、批处理策略、关闭规范、研究型修复、禁止模式、阻塞设置原子操作 #67, #79, #91
QE Agent 基础设施 已闭合 label 体系统一 (test-code/product-code), agent_poller 7 项增强 #40, #43, #47, #49, #51, #58, #61
conftest 防御降级 已闭合 ir_data fixture: list-section flatten + normalize 异常回退 raw rule #70
QE 全天轮询实战 已闭合 7 轮 e2e, 15 Issue, A: 4 ERROR→PASS, B: 63%→98.1%, C: 持续 REJECT #18, #66
多 Agent 协作闭环 已闭合 Dev+QE 通过 Gitea Issues 协同迭代 #15
图像模型切换 已闭合 qwen3-vl-plus → qwen3.6-flash,恢复 pipeline 可用性 #88
Windows GBK subprocess 编码 已闭合 run_pipeline.py subprocess.run 添加 encoding='utf-8',修复 stdout=None 崩溃 #84
_normalize_rule precondition 防御 已闭合 screen_type 缺失→"any"geo 缺失→"global"precondition=None→{} #86

已知问题清单

  • [P0] IR 结构化覆盖率不足(#21) — 98.1%Layer B PASS
  • 表格行覆盖率统计(#34 — 已合入 main
  • source 缺失 section#53 — _normalize_rule 防御
  • QE Audit 80%#54 — 重试 + 质量门控
  • 覆盖率回归 63%#57 — ir_data fixture normalize
  • 空 sources#64 — 补充 text source
  • section 为 list#69 — flatten to first
  • null row#73 — row=0
  • Windows GBK subprocess 编码(#84 — encoding='utf-8'
  • precondition 字段缺失(#86 — _normalize_rule 防御层扩展
  • 图像模型欠费(#88 — qwen3-vl-plus → qwen3.6-flash
  • Layer C QE Audit 持续 REJECT#75)— blocked by #90Dev 侧工作完成,等 QE-Agent 升级审计模型
  • Layer C 审计模型升级(#90test-codeQE 域)
  • 缺少完整 e2e 测试(#18test-codeQE 域)

当前打开 Issue(非纯测试)

# 标题 优先级 状态
#75 Layer C QE Audit REJECT 质量级 blocked by #90Dev 侧已闭合,Layer B 94.4% PASS
#90 [test] 审计模型升级 QE 域 test-code,委托 QE-Agent
#18 [test] e2e 测试 QE 域 test-code

下次启动推荐起点

  1. 读取 docs/PROJECT_CHARTER.mddocs/GLOBAL_STATE.md
  2. 运行 python scripts/agent_poller.py --action list + --action blocked-check
  3. #75 如 #90 已关闭:跑 pipeline + e2e 验证 Layer C--parsed-path output/车机娱乐系统禁止功能文档_脱敏 v1.0_parsed.json
  4. 注意:不要直接改 tests/acceptance/,测试变更委托 test-code Issue 给 QE-Agent
  5. 创建委托/研究 Issue 时必须立即设置 blocked 标签(原子操作)

最近变更日志

日期 变更 原因
2026-06-03 Dev session: 4 Issue 闭环 (#84 #86 #88 #91), Layer B 94.4% PASS Dev-Agent da-0603-1426 轮询
2026-06-03 图像模型 qwen3-vl-plus → qwen3.6-flash - Closes #88 API 欠费,切换模型
2026-06-03 _normalize_rule precondition 防御层扩展 - Closes #86 screen_type/geo 缺失兜底
2026-06-03 run_pipeline.py subprocess encoding='utf-8' - Closes #84 Windows GBK stdout=None 崩溃
2026-06-03 DEV_AGENT.md 阻塞设置原子操作规则 - Closes #91 #75→#90 阻塞关系事后补的教训
2026-06-02 QE session 收尾:15 Issue, 90% 闭环率, A 4 ERROR→PASS, B 63%→98.1% QE-Agent 全天轮询
2026-06-02 DEV_AGENT.md v4Issue 关闭规范 + 研究型修复 + 禁止模式 + 修复类型区分 - Closes #79 #75 3 轮重开暴露流程缺陷
2026-06-02 agent_poller 大幅增强:create-issue/reopen/blocked-check/auto-unblock/_req_safe QE session 累积 7 项改进
2026-06-02 Agent 文档更新:label 体系/blocked 处理/完整流程/bypass 配置 QE session 规范化
2026-06-02 step2 prompt 增加功能完整性要求 + ensemble 温度 3→4 - Closes #75 R1-3 提高覆盖质量
2026-06-02 step3 _normalize_rule 防御层建立 (5 次迭代) - Closes #53, #64, #69, #73 LLM 输出变异防御
2026-06-02 PR 前 e2e 验收流程 - Closes #67 防止修复回归
2026-06-02 _measure_coverage 零内容维度不拉低 overall - Closes #21 0/0=0%→1.0+排除均分
2026-06-02 agent 配置纳入版本管理 + docs/ - Closes #37 项目章程与全局状态
2026-06-01 test: _extract_content_units 仅统计功能章节表格行 - Closes #33 修复表格覆盖率误计