Files
document_analyzer/docs/GLOBAL_STATE.md
T
pzhang_zywl fb05ee6045
CI / test (pull_request) Successful in 8s
docs: QE-Agent session 收尾更新 GLOBAL_STATE + 合并 Dev-Agent 日间更新 - Closes #82
合并 Dev-Agent (v4 流程规范) + QE-Agent (15 Issue 基础设施) 的全局状态更新
A: 4 ERROR→PASS, B: 63%→98.1%, 90% 闭环率

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-06-02 20:07:14 +08:00

87 lines
5.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 项目全局状态(截至 2026-06-02 20:00
## 参考章程
详见 `PROJECT_CHARTER.md`。章程中定义的长期目标与原则是当前决策的最高依据。
## 当前阶段目标
核心目标(对齐章程):**IR 功能覆盖率 ≥ 70%Layer A+B+C 全部通过**
**本日迭代成果**:15+ Issue 关闭,核心成果:
- IR 覆盖率 57.4% → 98.1%Layer B PASS,最高 98.1%
- `_normalize_rule` 防御层建立:处理 6 种 LLM 输出变异
- Agent 基础设施完善:label 体系 / agent_poller 增强 / bypass 全自动 / session 收尾规范
- DEV_AGENT.md 流程规范完整建立(v4:修复类型、批处理、关闭规范、禁止模式)
## Pipeline 架构
```
input/*.docx → doc_parser → _parsed.json
step1_semantic_index → semantic_index.json
step2_ir_extraction → ir_fragments.json
step2_5_branch_coverage → ir_autocomplete_fragments.json
step3_merge_and_audit → ir_final.json + ir_audit_report.md
```
核心模块:
- `skills/doc_parser_skill/` — 文档解析(文本、表格、图片、冲突检测)
- `skills/ir_generation_skill/` — IR 生成(step1/2/2.5/3
- `tests/acceptance/` — 验收测试(Layer A Schema / Layer B Coverage / Layer C QE Audit
- `scripts/agent_poller.py` — Gitea Issue/PR 操作工具
## 已探索方向 & 结论
| 方向 | 状态 | 结论摘要 | 关联 Issue |
|------|------|----------|------------|
| 零内容维度均分 bug | 已闭合 | _measure_coverage: 0/0 维度 rate 1.0 + 排除出 overall 均分 | #21 |
| LLM 输出防御层 | 已闭合 | _normalize_rule 处理 6 种变异:null trigger/conditions, 缺失 section, 非法 type, 空 sources, section=list, null row | #53, #64, #69, #73 |
| 覆盖反馈重试优化 | 已闭合 | 重试 1→3 次 + 质量门控(仅采纳提升覆盖率的 retry+ ensemble 3→4 temps | #54, #75 |
| step2 prompt 完整性 | 已闭合 | 新增规则 #9:强制覆盖所有表格行和文字描述 | #75 |
| Dev-Agent 流程规范 | 已闭合 | 修复类型区分、批处理策略、关闭规范、研究型修复、禁止模式 | #67, #79 |
| QE Agent 基础设施 | 已闭合 | label 体系统一 (test-code/product-code), agent_poller 7 项增强 (create-issue/reopen/blocked-check/auto-unblock/_req_safe), bypass 全自动配置 | #40, #43, #47, #49, #51, #58, #61 |
| conftest 防御降级 | 已闭合 | ir_data fixture: list-section flatten + normalize 异常回退 raw rule | #70 |
| QE 全天轮询实战 | 已闭合 | 7 轮 e2e, 15 Issue, A: 4 ERROR→PASS, B: 63%→98.1%, C: 持续 REJECT | #18, #66 |
| 多 Agent 协作闭环 | 已闭合 | Dev+QE 通过 Gitea Issues 协同迭代 | #15 |
## 已知问题清单
- [x] ~~[P0] IR 结构化覆盖率不足(#21~~ — 98.1%Layer B PASS
- [x] ~~表格行覆盖率统计(#34~~ — 已合入 main
- [x] ~~source 缺失 section#53~~ — _normalize_rule 防御
- [x] ~~QE Audit 80%#54~~ — 重试 + 质量门控
- [x] ~~覆盖率回归 63%#57~~ — ir_data fixture normalize
- [x] ~~空 sources#64~~ — 补充 text source
- [x] ~~section 为 list#69~~ — flatten to first
- [x] ~~null row#73~~ — row=0
- [ ] Layer C QE Audit 持续 REJECT#75)— 多次代码改动已合入,待 pipeline 验证
- [ ] 缺少完整 e2e 测试(#18test-codeQE 域)
## 当前打开 Issue(非纯测试)
| # | 标题 | 优先级 | 状态 |
|---|------|--------|------|
| #18 | [test] 再运行一次完整的e2e测试 | 中(A+B PASS |
| #75 | Layer C QE Audit REJECT | 质量级 | 多轮代码改动已合入,待 pipeline 验证 |
| #67 | Dev-Agent PR 前必须跑完整 e2e | 中 |
| #79 | [product] 系统性的分析和反思项目开发流程 | 高(Dev-Agent 自我反思) |
## 下次启动推荐起点
1. 读取 `docs/PROJECT_CHARTER.md``docs/GLOBAL_STATE.md`
2. 运行 `python scripts/agent_poller.py --action list` 获取最新 Issue
3. #75 如仍 open:跑 pipeline + e2e 验证 Layer C
4. 严格遵守 Issue 关闭规范和禁止模式清单
## 最近变更日志
| 日期 | 变更 | 原因 |
|------|------|------|
| 2026-06-02 | QE session 收尾:15 Issue, 90% 闭环率, A 4 ERROR→PASS, B 63%→98.1% | QE-Agent 全天轮询 |
| 2026-06-02 | DEV_AGENT.md v4Issue 关闭规范 + 研究型修复 + 禁止模式 + 修复类型区分 - Closes #79 | #75 3 轮重开暴露流程缺陷 |
| 2026-06-02 | agent_poller 大幅增强:create-issue/reopen/blocked-check/auto-unblock/_req_safe | QE session 累积 7 项改进 |
| 2026-06-02 | Agent 文档更新:label 体系/blocked 处理/完整流程/bypass 配置 | QE session 规范化 |
| 2026-06-02 | step2 prompt 增加功能完整性要求 + ensemble 温度 3→4 - Closes #75 R1-3 | 提高覆盖质量 |
| 2026-06-02 | step3 _normalize_rule 防御层建立 (5 次迭代) - Closes #53, #64, #69, #73 | LLM 输出变异防御 |
| 2026-06-02 | PR 前 e2e 验收流程 - Closes #67 | 防止修复回归 |
| 2026-06-02 | _measure_coverage 零内容维度不拉低 overall - Closes #21 | 0/0=0%→1.0+排除均分 |
| 2026-06-02 | agent 配置纳入版本管理 + docs/ - Closes #37 | 项目章程与全局状态 |
| 2026-06-01 | test: _extract_content_units 仅统计功能章节表格行 - Closes #33 | 修复表格覆盖率误计 |