CLUECorpus2020 issues

新闻语料 news2016zh_corpus 链接失效

1

新闻预料链接也失效了TT

ZiweiHe

社区互动-语料 webText2019zh_corpus 链接失效问题

2

您好，社区互动-语料 webText2019zh_corpus语料库百度网盘链接已失效

W2Q3Q1

压缩包无法解压

试了包括unzip在内的几款解压软件，要么报memory不够，要么报类似于校验错误的错误，有伙计提供一下解压方案不

unbreading

这个结果我咋复现不出来呢，ACC只有65

3

![image](https://user-images.githubusercontent.com/4702353/83238081-7ebbf600-a1c8-11ea-9b3f-73f91371782a.png) @brightmart 多谢！多谢！多谢！ `sequence_len`是512吗？只跑了125K step也就是12W step预训练？

guotong1988

small中的14G是这个100G数据的子集吗？

CLUECorpus2020里包含那个small的14G吗？

zywszr

百度网盘mirror?

1

Hi, I was having trouble downloading data from Baidu Wangpan (百度网盘.) It would be very useful if the data was also made available on another cloud service like GCS or...

noahtren