добавить поддержку белорусского языка
Словари: http://bnkorpus.info/download.html
Добрый день.
Скажите пожалуйста, есть ли способ самостоятельно генерировать словари для библиотеки? Какой формат используется?
@Ulitochka добрый день! Словари генерируются скриптами вот отсюда: https://github.com/kmike/pymorphy2-dicts. На входе - XML в формате OpenCorpora; у них есть документация вот тут: http://opencorpora.org/?page=export, но она не совсем актуальная. Можно еще пример посмотреть: https://github.com/kmike/pymorphy2/blob/master/dev_data/toy_dict.xml. Если словарь преобразовать в формат OpenCorpora, то можно использовать скрипты из pymorphy2-dicts, чтоб сгенерировать скомпилированную версию.
Формат упакованной версии описан тут: http://pymorphy2.readthedocs.io/en/latest/internals/dict.html.
Спасибо.
@kmike Hi, sorry for upping this old issue – is it still relevant to add support for Belarusian? If yes, please let me know, I'm interested in working on this.