Skip to Main Content
Table 1: 
Data set statistics. #count is the number of documents, #words are the number of unique words in the vocabulary V, w-d and w-l are the average number of words per document and label, respectively.
Data setDocumentsLabels
abbrev.# count# wordsw-d# countw-l
BioASQ 11,705,534 528,156 214 26,104 35.0 
DW 598,304 884,272 436 5,637 2.3 
– en 112,816 110,971 516 1,385 2.1 
– de 132,709 261,280 424 1,176 1.8 
– es 75,827 130,661 412 843 4.7 
– pt 39,474 58,849 571 396 1.8 
– uk 35,423 105,240 342 288 1.7 
– ru 108,076 123,493 330 916 1.8 
– ar 57,697 58,922 357 435 2.4 
– fa 36,282 34,856 538 198 2.5 
Data setDocumentsLabels
abbrev.# count# wordsw-d# countw-l
BioASQ 11,705,534 528,156 214 26,104 35.0 
DW 598,304 884,272 436 5,637 2.3 
– en 112,816 110,971 516 1,385 2.1 
– de 132,709 261,280 424 1,176 1.8 
– es 75,827 130,661 412 843 4.7 
– pt 39,474 58,849 571 396 1.8 
– uk 35,423 105,240 342 288 1.7 
– ru 108,076 123,493 330 916 1.8 
– ar 57,697 58,922 357 435 2.4 
– fa 36,282 34,856 538 198 2.5 
Close Modal

or Create an Account

Close Modal
Close Modal