Skip to Main Content
Table 1: 

Statistics of datasets used in (Gururangan et al., 2020). Sources: ChemProt (Kringelum et al., 2016), RCT (Dernoncourt and Lee, 2017), ACL-ARC (Jurgens et al., 2018), SciERC (Luan et al., 2018), HyperPartisan (Kiesel et al., 2019), AGNews (Zhang et al., 2015), Helpfulness (McAuley et al., 2015), IMDB (Maas et al., 2011). This table is taken from (Gururangan et al., 2020).

DomainDatasetLabel TypeTrainDevTestClasses
BioMed ChemProt relation classification 4169 2427 3469 13 
 RCT abstract sent. roles 180040 30212 30135 
CS ACL-ARC citation intent 1688 114 139 
 SciERC relation classification 3219 455 974 
News HyperPartisan partisanship 515 65 65 
 AGNews topic 115000 5000 7600 
Reviews Helpfulness review helpfulness 115251 5000 25000 
 IMDB review sentiment 20000 5000 25000 
DomainDatasetLabel TypeTrainDevTestClasses
BioMed ChemProt relation classification 4169 2427 3469 13 
 RCT abstract sent. roles 180040 30212 30135 
CS ACL-ARC citation intent 1688 114 139 
 SciERC relation classification 3219 455 974 
News HyperPartisan partisanship 515 65 65 
 AGNews topic 115000 5000 7600 
Reviews Helpfulness review helpfulness 115251 5000 25000 
 IMDB review sentiment 20000 5000 25000 
Close Modal

or Create an Account

Close Modal
Close Modal