table_structure_recognition icon indicating copy to clipboard operation
table_structure_recognition copied to clipboard

Results Convert to HTML format

Open yazheng0307 opened this issue 1 year ago • 5 comments

Can you convert the result to HTML?

yazheng0307 avatar Jul 03 '24 09:07 yazheng0307

I added cells_to_html to the notebook, and can you test it?

whn09 avatar Jul 03 '24 09:07 whn09

cells_to_html 可以用的,另外我试了几个表格,貌似识别的效果不是很好, 这是原图经过模型裁剪下来的结果: test.zip

这是识别结果渲染的图像: vis.zip

第一行的最后一行经常会漏掉,另外对合并单元格的表格识别效果不理想,是我测试的问题吗?

yazheng0307 avatar Jul 04 '24 08:07 yazheng0307

我看了下,修改pad会解决ca_table_118.png漏掉最后一行的问题;

x1 = max(0, int((min_x-w/2)*width)-20) # TODO expand 10px y1 = max(0, int((min_y-h/2)*height)-20) # TODO expand 10px x2 = min(width, int((min_x+w/2)*width)+20) # TODO expand 10px y2 = min(height, int((min_y+h/2)*height)+20) # TODO expand 10px

另一张图片有点特殊,原图边框是虚线的,并且部分边缘连虚线都没有,之前训练数据中这类数据比较少,导致没有识别出【账面金额】和【坏账准备】这两个cell,这倒不是合并单元格的问题,主要是表格边缘的问题。

whn09 avatar Jul 04 '24 09:07 whn09

谢谢你的耐心解答,我再研究研究,有问题再交流(^▽^)

yazheng0307 avatar Jul 05 '24 02:07 yazheng0307

win10怎么安装使用吗?

nissansz avatar Sep 29 '24 00:09 nissansz