TigerBot
TigerBot copied to clipboard
关于研报数据的整理
想请教一个问题,我看金融研报数据的内容,经常是一个小段落,甚至一句话就被划分为一条数据。 这样,模型很难理解到上下文的关联,对文章的全局做到较好的理解,而且好像其他语料数据,大部分都是较长的完成文本数据。 研报数据这么处理有什么意义吗。
研报数据主要搜索插件使用,没有加入的训练数据
原来如此,明白了,谢谢