Skip to Main Content
Table 3 

The 11 L1 classes included in the Chinese NLI data set, and the numbers of raw documents and documents we generated for each class.

Native LanguageDocuments
rawgenerated
Burmese 408 349 
Filipino 293 415 
Indonesian 807 402 
Japanese 270 180 
Khmer 329 294 
Korean 566 330 
Laotian 398 366 
Mongolian 119 101 
Spanish 198 112 
Thai 806 400 
Vietnamese 806 267 
  
Total 5,000 3,216 
Native LanguageDocuments
rawgenerated
Burmese 408 349 
Filipino 293 415 
Indonesian 807 402 
Japanese 270 180 
Khmer 329 294 
Korean 566 330 
Laotian 398 366 
Mongolian 119 101 
Spanish 198 112 
Thai 806 400 
Vietnamese 806 267 
  
Total 5,000 3,216 
Close Modal

or Create an Account

Close Modal
Close Modal