opencorpora
opencorpora copied to clipboard
A web-based engine for creating and annotating textual corpora
Deployment of the OpenCorpora server with Docker Compose.
Ребята, не смог найти документацию к данным XML файла с размеченными текстами. Подскажите, пожалуйста, где искать. В первую очередь интересуют возможные значения тега `v` и их расшифровка (пример: `NOUN, inan,...
Added python script for parsing xml -> tsv or json. First argument: from (example - dict.xml) Second argument: to (example - dict.json) Third argument: mode (example - json). Sample format...
Пример: http://opencorpora.org/dict.php?act=edit&id=80532 Должна остаться только "делаемый - делаем".
``` 185502 НЕОХОТА NOUN,inan,femn,Sgtm sing,nomn,Hypo НЕОХОТЫ NOUN,inan,femn,Sgtm sing,gent НЕОХОТЕ NOUN,inan,femn,Sgtm sing,datv НЕОХОТУ NOUN,inan,femn,Sgtm sing,accs НЕОХОТОЙ NOUN,inan,femn,Sgtm sing,ablt НЕОХОТОЮ NOUN,inan,femn,Sgtm sing,ablt,V-oy НЕОХОТЕ NOUN,inan,femn,Sgtm sing,loct ```
Всего в корпусе 89 случаев: 1. [знаменный](http://opencorpora.org/dict.php?act=edit&id=115952) -- DONE (разделены на две лексемы) 2. [маркер](http://opencorpora.org/dict.php?act=edit&id=155284) -- DONE (разделены на две лексемы) 3. [недалеко](http://opencorpora.org/dict.php?act=edit&id=180627) 4. [орет](http://opencorpora.org/dict.php?act=edit&id=208714) -- DONE (была ошибка в...
Скрипты: https://github.com/grandsbor/opencorpora-junk/tree/master/wiktionary_import Описание скриптов: https://code.google.com/p/opencorpora/issues/detail?id=157#c46 Дамп Викисловаря можно взять тут: http://dumps.wikimedia.org/ruwiktionary/latest/
На странице tasks.php, когда доделал пул и написано "А если разметить ещё немного, то можно получить:", ачивка не кликается. В консоли: Пустая строка не может быть аргументом метода getElementById(). Яндекс.Браузер,...
[Лог](https://gist.github.com/grandsbor/38e17fe47c70a40a935994f42b912de5) - 4471 ошибка, включая 97 ожидающих словарных правок. подзадачи: - #890 - #891