pymorphy2 icon indicating copy to clipboard operation
pymorphy2 copied to clipboard

добавить поддержку белорусского языка

Open kmike opened this issue 10 years ago • 4 comments

Словари: http://bnkorpus.info/download.html

kmike avatar Mar 03 '15 11:03 kmike

Добрый день.

Скажите пожалуйста, есть ли способ самостоятельно генерировать словари для библиотеки? Какой формат используется?

Ulitochka avatar May 24 '16 09:05 Ulitochka

@Ulitochka добрый день! Словари генерируются скриптами вот отсюда: https://github.com/kmike/pymorphy2-dicts. На входе - XML в формате OpenCorpora; у них есть документация вот тут: http://opencorpora.org/?page=export, но она не совсем актуальная. Можно еще пример посмотреть: https://github.com/kmike/pymorphy2/blob/master/dev_data/toy_dict.xml. Если словарь преобразовать в формат OpenCorpora, то можно использовать скрипты из pymorphy2-dicts, чтоб сгенерировать скомпилированную версию.

Формат упакованной версии описан тут: http://pymorphy2.readthedocs.io/en/latest/internals/dict.html.

kmike avatar May 24 '16 09:05 kmike

Спасибо.

Ulitochka avatar May 24 '16 09:05 Ulitochka

@kmike Hi, sorry for upping this old issue – is it still relevant to add support for Belarusian? If yes, please let me know, I'm interested in working on this.

somerandomguyontheweb avatar Jul 26 '20 17:07 somerandomguyontheweb