artitw issues

Results 9 issues of


                                            artitw

Fine-tune crosslingual model for language detection

Two approaches to try: 1. Use crosslingual embeddings as input to MLP or tree-based model in transfer learning fashion 2. Fine-tune crosslingual translator with softmax output

Fine-tune cross-lingual translator for text2text generation

Fine-tune cross-lingual translator for text2text generation tasks, e.g. question generation, question answering, summarization, etc. to demonstrate cross-lingual alignment, zero-shot generation, etc. For example, can we demonstrate question generation or question...

Cross-lingual semantic retrieval

Perform a similar study to https://arxiv.org/pdf/1907.04307.pdf but expanding to support 100 languages using the [embeddings from the translator](https://github.com/artitw/text2text#embedding--vectorization). Possibly start with the paper's [code sample](https://www.tensorflow.org/hub/tutorials/cross_lingual_similarity_with_tf_hub_multilingual_universal_encoder).

artitw

Fine-tune crosslingual model for language detection

Fine-tune cross-lingual translator for text2text generation

Cross-lingual semantic retrieval

Fix pytorch-extension and re-integrate into text2text for improved performance

More detailed documentation

Add Python 3 style type checking

Write unit tests

Add integration tests

Multilingual Search with Subword TF-IDF