FastGPT icon indicating copy to clipboard operation
FastGPT copied to clipboard

知识库导入,优化含表格文件分块功能

Open yibohub opened this issue 1 year ago • 3 comments

例行检查

  • [x] 我已确认目前没有类似 features
  • [x] 我已确认我已升级到最新版本
  • [x] 我已完整查看过项目 README,已确定现有版本无法满足需求
  • [x] 我理解并愿意跟进此 features,协助测试和提供反馈
  • [x] 我理解并认可上述内容,并理解项目维护者精力有限,不遵循规则的 features 可能会被无视或直接关闭

功能描述 现有的知识库导入在自动分块时,直接按字数分块,对表格文件如PDF含表格,EXCEL表格文件分块时直接按字数截断,同一行的信息位于不同的块中。建议优化为在满足字数要求的情况下按行截断,保证信息的完整性。 应用场景

相关示例

yibohub avatar Apr 11 '24 04:04 yibohub

同意 另外如果按行分块的话 建议补全表头

lijiajun1997 avatar Apr 12 '24 14:04 lijiajun1997

excel 已经按行补全表头了呢。

c121914yu avatar Apr 12 '24 16:04 c121914yu

excel 已经按行补全表头了呢。

的确已经按行补全表头了,这个就很好。 请问4.8.9,是在满足字数要求的情况下按行截断的吗?

goactiongo avatar Aug 21 '24 06:08 goactiongo