Skip to Main Content
Table 6: 
Lexical overlap statistics for TyDiQA-GoldP, MLQA, and XQuAD showing the average number of tokens in common between the question and a 200-character window around the answer span. As expected, we observe substantially lower lexical overlap in TyDi QA.
TyDiQA-GoldPMLQAXQuAD
(English) 0.38 0.91 1.52 
Arabic 0.26 0.61 1.29 
Bengali 0.29 — — 
Finnish 0.23 — — 
Indonesian 0.41 — — 
Kiswahili 0.31 — — 
Korean 0.19 — — 
Russian 0.16 — 1.13 
Telugu 0.13 — — 
TyDiQA-GoldPMLQAXQuAD
(English) 0.38 0.91 1.52 
Arabic 0.26 0.61 1.29 
Bengali 0.29 — — 
Finnish 0.23 — — 
Indonesian 0.41 — — 
Kiswahili 0.31 — — 
Korean 0.19 — — 
Russian 0.16 — 1.13 
Telugu 0.13 — — 
Close Modal

or Create an Account

Close Modal
Close Modal