Files
document_analyzer/docs/GLOBAL_STATE.md
T

82 lines
4.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 项目全局状态(截至 2026-06-02 19:00
## 参考章程
详见 `PROJECT_CHARTER.md`。章程中定义的长期目标与原则是当前决策的最高依据。
## 当前阶段目标
核心目标(对齐章程):**IR 功能覆盖率 ≥ 70%Layer A+B+C 全部通过**
**本日迭代成果**:13 个 Issue 关闭,核心成果:
- IR 覆盖率 57.4% → 86.1%Layer B PASS
- `_normalize_rule` 防御层建立:处理 6 种 LLM 输出变异
- DEV_AGENT.md 流程规范完整建立
## Pipeline 架构
```
input/*.docx → doc_parser → _parsed.json
step1_semantic_index → semantic_index.json
step2_ir_extraction → ir_fragments.json
step2_5_branch_coverage → ir_autocomplete_fragments.json
step3_merge_and_audit → ir_final.json + ir_audit_report.md
```
核心模块:
- `skills/doc_parser_skill/` — 文档解析(文本、表格、图片、冲突检测)
- `skills/ir_generation_skill/` — IR 生成(step1/2/2.5/3
- `tests/acceptance/` — 验收测试(Layer A Schema / Layer B Coverage / Layer C QE Audit
- `scripts/agent_poller.py` — Gitea Issue/PR 操作工具
## 已探索方向 & 结论
| 方向 | 状态 | 结论摘要 | 关联 Issue |
|------|------|----------|------------|
| 零内容维度均分 bug | 已闭合 | _measure_coverage: 0/0 维度 rate 1.0 + 排除出 overall 均分 | #21 |
| LLM 输出防御层 | 已闭合 | _normalize_rule 处理 6 种变异:null trigger/conditions, 缺失 section, 非法 type, 空 sources, section=list, null row | #53, #64, #69, #73 |
| 覆盖反馈重试优化 | 已闭合 | 重试 1→3 次 + 质量门控(仅采纳提升覆盖率的 retry+ ensemble 3→4 temps | #54, #75 |
| step2 prompt 完整性 | 已闭合 | 新增规则 #9:强制覆盖所有表格行和文字描述 | #75 |
| Dev-Agent 流程规范 | 已闭合 | 修复类型区分、批处理策略、关闭规范、研究型修复、禁止模式 | #67, #79 |
| QE Agent 基础设施 | 已闭合 | label 体系统一 (test-code/product-code), agent_poller 增强 (create-issue/reopen/blocked-check/auto-unblock/_req_safe), bypass 配置 | #40, #43, #47, #49, #51, #58, #61 |
| conftest 防御降级 | 已闭合 | ir_data fixture: list-section flatten + normalize 异常回退 raw rule | #70 |
| QE 全天轮询实战 | 已闭合 | 7 轮 e2e, 15 个 Issue 处理, Layer A 归零→PASS, Layer B 63%→98.1% | #18, #66 |
| 多 Agent 协作闭环 | 已闭合 | Dev+QE 通过 Gitea Issues 协同迭代 | #15 |
## 已知问题清单
- [x] ~~[P0] IR 结构化覆盖率不足(#21~~ — 86.1%Layer B PASS
- [x] ~~表格行覆盖率统计(#34~~ — 已合入 main
- [x] ~~source 缺失 section#53~~ — _normalize_rule 防御
- [x] ~~QE Audit 80%#54~~ — 重试 + 质量门控
- [x] ~~覆盖率回归 63%#57~~ — ir_data fixture normalize
- [x] ~~空 sources#64~~ — 补充 text source
- [x] ~~section 为 list#69~~ — _clean_section()
- [x] ~~null row#73~~ — row=0
- [ ] Layer C QE Audit 持续 REJECT#75)— 质量级修复,需 pipeline 验证后关闭
- [ ] 缺少完整 e2e 测试(#18test-codeQE 域)
## 当前打开 Issue(非纯测试)
| # | 标题 | 优先级 | 状态 |
|---|------|--------|------|
| #75 | Layer C QE Audit REJECT | 质量级 | 多轮代码改动已合入,待 pipeline 验证 |
## 下次启动推荐起点
1. 读取 `docs/PROJECT_CHARTER.md``docs/GLOBAL_STATE.md`
2. 运行 `python scripts/agent_poller.py --action list` 获取最新 Issue
3. #75 如仍 open:按质量级修复流程,跑 pipeline + e2e 验证,不关 Issue 直到验证通过
4. 如 QE Agent 有新的 product-code Issue:先判断类型再走对应流程
5. 严格遵守 Issue 关闭规范和禁止模式清单
## 最近变更日志
| 日期 | 变更 | 原因 |
|------|------|------|
| 2026-06-02 | DEV_AGENT.md v4Issue 关闭规范 + 研究型修复 + 禁止模式 + 修复类型区分 - Closes #79 | #75 3 轮重开暴露流程缺陷 |
| 2026-06-02 | step2 prompt 增加功能完整性要求 - Closes #75 R3 | 强调覆盖所有表格行 |
| 2026-06-02 | ensemble 温度 3→4 - Closes #75 R2 | 增加多样性 |
| 2026-06-02 | 重试 2→3 + 放宽质量门控 - Closes #75 R1 | 更多补全机会 |
| 2026-06-02 | step3 _normalize_rule 防御层建立 (5 次迭代) - Closes #53, #64, #69, #73 | LLM 输出变异防御 |
| 2026-06-02 | PR 前 e2e 验收流程 - Closes #67 | 防止修复回归 |
| 2026-06-02 | _measure_coverage 零内容维度不拉低 overall - Closes #21 | 0/0=0%→1.0+排除均分 |
| 2026-06-02 | agent 配置纳入版本管理 + docs/ - Closes #37 | 项目章程与全局状态 |