corus
corus copied to clipboard
Links to Russian corpora + Python functions for loading and parsing
https://app.slack.com/client/T040HKJE3/C04N3UMSL/thread/C04N3UMSL-1607717401.453500 > Привет, распарсил дохулиард диаологовых данных на русском языке (пикабу и диалоги из книг). 80+ гигов данных, плюс минус 200 миллионов диалогов (сложно точно посчитать, потому что диалоги с...
https://t.me/danokhlopkov/395
https://github.com/IlyaGusev/PoetryCorpus/
https://www.kaggle.com/nigula/russian-sensitive-topics https://arxiv.org/abs/2103.05345
https://www.kaggle.com/nigula/russianinappropriatemessages
http://web-corpora.net/CoRST/search/?interface_language=ru&search_language=academrussian&contexts_output_language=academrussian
https://github.com/computational-humor/humor-recognition https://www.aclweb.org/anthology/P19-1394.pdf
https://github.com/fostroll/ru_corner/blob/master/doc/Coreference_Annotation_Guidelines_for_ru_corner.pdf
Здравствуйте! Посоветовали скинуть Вам мою сборку отзывов на смартфоны с яндекс.маркета. Небольшой json-файл, содержит около 50к отзывов на разные смартфоны. Структура {"model_1": [ {Рейтинг: "", "Достоинства": "", "Недостатки": "", "Комментарий":...