Anna Potapenko

Results 11 comments of Anna Potapenko

Hi gundalav, For a short peptide I'd be hesitant to rely only on the AlphaFold prediction, even if its pLDDT is high. Firstly, it's not a structured domain, which makes...

Two answers: 1) The problem with the performance has been kindly solved by Murat's advice not to call tokens = model.score_tracker['Top100Tokens'].last_tokens[topic_name] for each topic, instead call it once tokens_for_topics =...

Можно начать со своего ноутбука и небольших коллекций. Задача - выработать рекомендации для параметров создания модели и метода fit_online(), уже реализованного в библиотеке. Следующая задача - перейти к более хитрым...

В оригинальной [статье Хоффмана](https://www.cs.princeton.edu/~blei/papers/HoffmanBleiBach2010b.pdf), из которой взяты текущие дефолты, значения tau=1024, kappa=0.7 подходят для очень маленьких батчей (десятки документов). Т.к. обычно в наших батчах 100-1000 документов, а между обновлениями обрабатываются...

@ofrei, напомни, пожалуйста, происходят ли какие-то перемасштабирования счетчиков перед тем, как к ним применяются decay_weight и apply_weight (которые в свою очередь могут выражаться через rho). Насколько я помню, в оригинальной...

@sashafrey Саша, спасибо за ответ! Кажется, это знание нам немного помогло и алгоритм стал дрессироваться лучше. Но возник вот такой еще более важный вопрос (+ @arti32lehtonen) **Что происходит со счетчиками...

Здесь перемешаны две идеи: 1. Онлайновая обработка текста в стиле word2vec для реализации BTM/WNTM моделей без предварительного построения матрицы совместной встречаемости слов. 2. Позиционные регуляризаторы, которые уже реализованы (действительно, с...

Работа заключается в доработке позиционного регуляризатора для ptdw и экспериментах с различными сценариями регуляризации (сглаживание с помощью аггрегированного профиля, использование только аггрегированного профиля, фильтрация слов общей лексики (фона), фиксированные окна...

Вопрос от Розы и не только: описаны ли где-то скоры, реализованные в библиотеке. Наверное, речь про вот это TODO: https://github.com/bigartm/bigartm/wiki/Implemented-scores

Не забыть поговорить с Дмитрием Ушановым по поводу распределенных алгоритмов.