TextAtAnyCost
TextAtAnyCost copied to clipboard
Old PHP scripts to read text content from different binary formats: PDF, DOC, PPT, RTF (not binary) etc.
На документе https://yadi.sk/d/FURIt9h5pBzKb падает c превышением памяти здесь ``` php $cp = array(); $i = 0; while (($cp[] = $this->getLong($i, $pieceTable)) != $lastCP) $i += 4; ```
Например "«", "»"
У меня распарсенный текст пишется в Postgres только после преобразования mb_convert_encoding(). Чувствую, что это не камильфо, не подскажете в чем тут соль? $doc = new doc(); $doc->read($this->filename); $text = $doc->parse();...
Поправил ошибку - возникал бесконечный цикл
Благодарю за библиотеку. Не предполагается ли поддержка docx?
Когда элемент стека отсутствует возникает notice, что критично в рамках symfony. По какой-то причине периодически j в #L219 становится = -2 что опять же вызывает notice.