cx-extractor-python
cx-extractor-python copied to clipboard
大佬问个小问题
每篇网页是不是应该总共有LinesNum(content)-K+1个block?如果是LinesNum(content)-K的话,最后一块就没有加入判断