[test-dev] _extract_content_units 空章节误计为功能章节 #29

Closed
opened 2026-06-01 10:01:06 +08:00 by pzhang_zywl · 0 comments
Owner

来源

Dev-Agent 分析 #21 时发现。

问题

_extract_content_units() 把 4 个无实质文本内容的章节计入 functional_sections,导致覆盖率虚低。

空内容章节(text=无): 2.3, 2.4, 2.5, 2.6.1

期望

过滤掉无实质内容的章节。建议阈值: 总文本长度 >= 10 或 有 table 或 有 images。

关联

阻塞: #21

## 来源 Dev-Agent 分析 #21 时发现。 ## 问题 _extract_content_units() 把 4 个无实质文本内容的章节计入 functional_sections,导致覆盖率虚低。 空内容章节(text=无): 2.3, 2.4, 2.5, 2.6.1 ## 期望 过滤掉无实质内容的章节。建议阈值: 总文本长度 >= 10 或 有 table 或 有 images。 ## 关联 阻塞: #21
Sign in to join this conversation.
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: zeekrAI/document_analyzer#29