TigerBot icon indicating copy to clipboard operation
TigerBot copied to clipboard

关于研报数据的整理

Open yonghanzhuce opened this issue 2 years ago • 2 comments

想请教一个问题,我看金融研报数据的内容,经常是一个小段落,甚至一句话就被划分为一条数据。 这样,模型很难理解到上下文的关联,对文章的全局做到较好的理解,而且好像其他语料数据,大部分都是较长的完成文本数据。 研报数据这么处理有什么意义吗。

yonghanzhuce avatar Jun 12 '23 01:06 yonghanzhuce

研报数据主要搜索插件使用,没有加入的训练数据

wsenWang avatar Jun 12 '23 07:06 wsenWang

原来如此,明白了,谢谢

yonghanzhuce avatar Jun 14 '23 01:06 yonghanzhuce