Skip to content

解决macos上传压缩包隐藏文件问题和遇到HTML表格时会把<table>/<tr>/<td>切在半截,所以前端MarkdownViewe…#9551

Closed
thx112 wants to merge 1 commit intojeecgboot:mainfrom
thx112:main
Closed

解决macos上传压缩包隐藏文件问题和遇到HTML表格时会把<table>/<tr>/<td>切在半截,所以前端MarkdownViewe…#9551
thx112 wants to merge 1 commit intojeecgboot:mainfrom
thx112:main

Conversation

@thx112
Copy link
Copy Markdown

@thx112 thx112 commented Apr 14, 2026

第一个是“文档库上传会出现错误的 .xxxx 文件”。根因是 zip 导入后端没有过滤 macOS 压缩包自带的隐藏文件,像 .、__MACOSX/、.DS_Store 也被当成正式文档入库了。我在 AiragKnowledgeDocServiceImpl.java (line 391) 增加了 zip 条目过滤逻辑。现在再上传文档库压缩包时,这类系统隐藏文件会直接跳过,不会再生成失败文档卡片。

第二个是“命中测试里段落详情显示 HTML 表格时出现多余 、表格不完整”。根因不是弹窗组件,而是后端向量化分段时把 HTML 表格标签切断了,命中详情展示的其实是一个被切坏的 chunk。我在 EmbeddingHandler.java (line 140) 和 EmbeddingHandler.java (line 212) 改成了“完整

...
块不拆分。这样新生成的 chunk 会保留完整表格结构,前端展示时就不会再出现裸标签和残缺表格。

@jeecgai
Copy link
Copy Markdown

jeecgai commented Apr 21, 2026

pr 已经验证并合并,待新版本发布

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants