Dialog-Datasets
Dialog-Datasets copied to clipboard
本项目收集目前对话系统论文中,已公开的,用于训练中(英)文的训练集。Datasets for training Dialog.
对话系统中英文语料
本项目收集目前论文中,已公开的,用于训练中(英)文对话系统的语料以及开源的对话模型。
部分开源模型 待整理…
常用
中文
Douban Conversation Corpus
Noah NRM Data
STC Data
英文
Ubuntu Dialogue Corpus v2
OpenSubtitles
Cornell Movie Dialogs Corpus
微博
Noah NRM Data
STC Data
NTCIR14 STC3 CECG
Personality Assignment Dataset
Chinese Dialogue Dataset with Sentence Function
豆瓣
Douban Conversation Corpus
电商
JD Customer Service Corpus
E-commerce Dialogue Corpus