EntLM
EntLM copied to clipboard
unlabeled data
你好!论文中提到搜索label words时借助了unlabeled data和lexicon-based annotation,但是我发现代码目录dataset/conll/distant_data里的数据好像就是conll03数据集的全量数据,并不是远程监督得到的数据,请问这点能解释下吗?
你好,dataset/conll/distant_data下的就是远监督得到的数据呀。远监督数据的数据量和全量数据一样,但标注不同,因为是远程监督标注,存在噪音。你可以和全量数据的标注比对一下:)
哇塞,北工大大佬,来西交找我玩呀,一起做prompt learning!
你好!论文中提到搜索label words时借助了unlabeled data和lexicon-based annotation,但是我发现代码目录
dataset/conll/distant_data里的数据好像就是conll03数据集的全量数据,并不是远程监督得到的数据,请问这点能解释下吗?