[bug] step2 IR extraction 生成缺少 section 字段的 source - 来自 #18 e2e #53

Closed
opened 2026-06-02 15:37:25 +08:00 by pzhang_zywl · 1 comment
Owner

问题

e2e 测试 (#18) 发现 IR 的 rules[21].sources[0] 缺少 section 字段:

{"type": "text", "text_snippet": "...", "priority": "primary_source"}

缺少 section 字段导致 Layer A schema 验证失败 (77/78 checks passed, 1 failed)。

根因

step2 IR extraction 的 LLM 输出有时不包含 section 字段。需要在 step2 或 step3 中增加防御性处理。

关联

  • 来自: #18 QE e2e 测试
  • Layer A schema 验证规则

[qe-agent: qa-0602-1358]

## 问题 e2e 测试 (#18) 发现 IR 的 rules[21].sources[0] 缺少 section 字段: ```json {"type": "text", "text_snippet": "...", "priority": "primary_source"} ``` 缺少 `section` 字段导致 Layer A schema 验证失败 (77/78 checks passed, 1 failed)。 ## 根因 step2 IR extraction 的 LLM 输出有时不包含 section 字段。需要在 step2 或 step3 中增加防御性处理。 ## 关联 - 来自: #18 QE e2e 测试 - Layer A schema 验证规则 --- [qe-agent: qa-0602-1358]
pzhang_zywl added the product-code label 2026-06-02 15:37:25 +08:00
Author
Owner

PR 已创建: http://localhost:3000/pzhang_zywl/document_analyzer/pulls/55

修复: step3 _normalize_rule 为缺失 section 的 table/text source 补齐字段。
推断逻辑: 兄弟 source → rule path。

等待 CI 通过后 merge。


[da-0602-1321]

PR 已创建: http://localhost:3000/pzhang_zywl/document_analyzer/pulls/55 修复: step3 _normalize_rule 为缺失 section 的 table/text source 补齐字段。 推断逻辑: 兄弟 source → rule path。 等待 CI 通过后 merge。 --- [da-0602-1321]
Sign in to join this conversation.
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: zeekrAI/document_analyzer#53