NlpSummary
NlpSummary copied to clipboard
NLP笔记
项目说明
| 目录 | 说明 |
|---|---|
| /data | demo代码用的数据集(LCQMC、MRPC、THUCNews) |
| /data_augmentation | 数据增强工具 |
| /pandas | pandas常用方法(导入导出、func) |
| /paper | nlp相关论文 |
| /rank | 排序算法示例(pyltr_listwise 、xgboost、 sklearn_xgboost) |
| /similarity | 常用文本相似度计算方法(Jaccord、编辑距离) |
| /sklearn | sklearn常用方法(交叉验证、网格搜索、逻辑回归、svm等) |
| /tools | 其他python方法(协程、ac算法、文本生成) |
| /torchcode | 自己实现的部分pytorch模型(CNN/LSTM/Transformer文本分类、双塔网络等) |
| /xgboost | xgboost demo |
| /xmind | NLP领域知识总结 |
高质量git
北京航空航天大学大数据高精尖中心自然语言处理研究团队开展了智能问答的研究与应用总结
模型蒸馏
| 内容 | 类型 |
|---|---|
| BERT蒸馏完全指南 | 分享 |
| 哈工大模型蒸馏工具TextBrewer |
智能客服
| 内容 | 类型 |
|---|---|
| [美团]智变中的美团客服 | 分享 |
| [58]五八同城智能客服系统“帮帮”技术揭秘 | 分享 |
| [瓜子]对话机器人在瓜子的实践 | 分享 |
问答系统
| 内容 | 类型 |
|---|---|
| [美团]基于知识图谱的问答在美团智能交互场景中的应用和演进 | 分享 |
| [美团]美团对话理解技术及实践 | 分享 |
| [平安]智能问答系统 | 分享 |
| [平安]CCKS 2019 基于知识图谱的寿险问答系统 | 分享 |
| [阿里]通用领域对话问答 | 分享 |
| [阿里神马]阿里神马智能对话问答 | 分享 |
文本匹配
| 内容 | 类型 |
|---|---|
| [阿里RE2][ACL2019]Simple and Effective Text Matching with Richer Alignment Features | 论文 |
| 常用中文文本匹配数据集 | github |
搜索
| 内容 | 类型 |
|---|---|
| LTR信息检索评价指标 | 博客 |
| LTR及常用排序算法介绍 | 博客 |
| 百度2017:AI赋能的搜索和对话交互报告 | 分享 |
| 美团BERT的探索和实践 | 分享 |
| 知乎搜索排序模型的演进 | 分享 |
| 知乎搜索文本相关性与知识蒸馏 | 分享 |
排序(含搜索、广告、推荐)
| 内容 | 类型 |
|---|---|
| 阿里粗排技术体系及最新进展 | 分享 |
对话管理
| 内容 | 类型 |
|---|---|
| [阿里]任务导向型对话系统——对话管理模型研究最新进展 | 分享 |
| [平安]多轮人机对话与对话管理技术探索与实践 | 分享 |
| [阿里]A Survey on Dialog Management: Recent Advances and Challenges | 论文综述 |
| [清华微软][DSTC8]ConvLab: Multi-Domain End-to-End Dialog System Platform | 论文 |
| [清华][ACL2020]ConvLab-2: An Open-Source Toolkit for Building, Evaluating, and Diagnosing DialogueSystems | 论文 |
用户模拟器
| 内容 | 类型 |
|---|---|
| [阿里]最新综述:对话系统之用户模拟器 | 分享 |