LEVEN icon indicating copy to clipboard operation
LEVEN copied to clipboard

### 请问中国判决文书的网站访问不是很流畅,怎么大规模获取到原始的判决文书数据集的呢?

Open guocxian opened this issue 3 years ago • 6 comments

guocxian avatar Nov 19 '22 07:11 guocxian

您好,我们也是从裁判文书网的公开渠道获得的数据。在数据集中,我们只关注案件的事实部分,规模其实也不是特别大(8k篇左右)。另外我们也用了一些CAIL2018的数据,这个是公开可以快速获取的,参见这里

yaof20 avatar Dec 06 '22 08:12 yaof20

您好 数据不打算开源吗

guantao18 avatar Feb 16 '23 10:02 guantao18

您好 数据不打算开源吗

您好,我们论文所使用的数据集已经开源,并且附有详细的文档说明,参见这里.

yaof20 avatar Feb 17 '23 08:02 yaof20

看到了谢谢

guantao18 avatar Feb 22 '23 07:02 guantao18

你好,数据集在清华云盘和google云端都无法下载无法下载

RRooggeerr avatar Mar 12 '23 09:03 RRooggeerr

你好,数据集在清华云盘和google云端都无法下载无法下载

你好,”无法下载“是否有报错提示?

清华云盘和Google Cloud我都测试过了,是可以正常下载的,你可以检查一下网络再试一下。

yaof20 avatar Mar 13 '23 11:03 yaof20