app-builder
app-builder copied to clipboard
DocParser没有返回表格数据
如题:
使用示例中的pdf和代码,返回的结果中表格和标题数据都是空,请问这是Bug吗?还是sdk版本不对?
安装的sdk版本是:appbuilder-sdk==0.9.1
经过debug发现是PageContent对象参数名不一致引起的,前面加上page_即可:
titles --> page_titles
tables --> page_tables
另外发现tables处理成Markdown结构时,此处不应该set来去重,set 数据结构是无序的,set集合会自动去除重复元素,但不保留原始列表的顺序,可能会导致转换后的表格元素错位。
源文档:
转成Markdown后: