Skip to Main Content
Table 3 
Statistics of the two data sets.
 Ubuntu CorpusDouban Corpus
trainvaltesttrainvaltest
# context-response pairs 1M 0.5M 0.5M 1M 50k 10k 
# candidates per context 10 10 10 
# positive candidates per context 1.18 
Min. # turns per context 
Max. # turns per context 19 19 19 98 91 45 
Avg. # turns per context 10.10 10.10 10.11 6.69 6.75 6.45 
Avg. # words per utterance 12.45 12.44 12.48 18.56 18.50 20.74 
 Ubuntu CorpusDouban Corpus
trainvaltesttrainvaltest
# context-response pairs 1M 0.5M 0.5M 1M 50k 10k 
# candidates per context 10 10 10 
# positive candidates per context 1.18 
Min. # turns per context 
Max. # turns per context 19 19 19 98 91 45 
Avg. # turns per context 10.10 10.10 10.11 6.69 6.75 6.45 
Avg. # words per utterance 12.45 12.44 12.48 18.56 18.50 20.74 
Close Modal

or Create an Account

Close Modal
Close Modal