Skip to Main Content
Table 7: 

ROUGE-L scores under NarrativeQA summary setting. We list the best public extractive model BERT+Hard EM (Min et al., 2019) and the best generative model Masque (Nishida et al., 2019) for reference.

SystemFull DataEvent-Only
devtestdevtest
BERT+Hard EM 58.1 58.8 – – 
Masque – 54.7 – – 
BART Reader (ours) 66.9 66.9 55.1 55.0 
SystemFull DataEvent-Only
devtestdevtest
BERT+Hard EM 58.1 58.8 – – 
Masque – 54.7 – – 
BART Reader (ours) 66.9 66.9 55.1 55.0 
Close Modal

or Create an Account

Close Modal
Close Modal