EntLM icon indicating copy to clipboard operation
EntLM copied to clipboard

unlabeled data

Open zdgithub opened this issue 3 years ago • 2 comments

你好!论文中提到搜索label words时借助了unlabeled data和lexicon-based annotation,但是我发现代码目录dataset/conll/distant_data里的数据好像就是conll03数据集的全量数据,并不是远程监督得到的数据,请问这点能解释下吗?

zdgithub avatar Aug 10 '22 08:08 zdgithub

你好,dataset/conll/distant_data下的就是远监督得到的数据呀。远监督数据的数据量和全量数据一样,但标注不同,因为是远程监督标注,存在噪音。你可以和全量数据的标注比对一下:)

rtmaww avatar Aug 12 '22 15:08 rtmaww

哇塞,北工大大佬,来西交找我玩呀,一起做prompt learning!

你好!论文中提到搜索label words时借助了unlabeled data和lexicon-based annotation,但是我发现代码目录dataset/conll/distant_data里的数据好像就是conll03数据集的全量数据,并不是远程监督得到的数据,请问这点能解释下吗?

albert-jin avatar Oct 13 '22 08:10 albert-jin