language-pretraining issues

Results 1 language-pretraining issues

Sort by recently updated

ipadic problem for 四半期連結会計期間末日満期手形

Thank you for releasing [bert-small-japanese-fin](https://huggingface.co/izumi-lab/bert-small-japanese-fin) and other Electra models for FinTech. But I've found they tokenize "四半期連結会計期間末日満期手形" in bad way: ``` >>> from transformers import AutoTokenizer >>> tokenizer=AutoTokenizer.from_pretrained("izumi-lab/bert-small-japanese-fin") >>> tokenizer.tokenize("四半期連結会計期間末日満期手形")...

KoichiYasuoka

bug

enhancement

language-pretraining
language-pretraining copied to clipboard

Metadata

ipadic problem for 四半期連結会計期間末日満期手形

← Metadata

Owner

Metadata

language-pretraining language-pretraining copied to clipboard

Metadata

ipadic problem for 四半期連結会計期間末日満期手形

← Metadata

Owner

Metadata

language-pretraining
language-pretraining copied to clipboard