Skip to Main Content
Table 2: 
For each language pair, we report the number of NMT systems trained on it, the oracle best BLEU we obtained, and its corresponding hyperparameter configuration.
Dataset#modelsBest BLEUbpe#layers#embed#hidden#att_headsinit_lr
zh-en 118 14.66 30k 512 1024 16 3e-4 
ru-en 176 20.23 10k 256 2048 3e-4 
ja-en 150 16.41 30k 512 2048 3e-4 
en-ja 168 20.74 10k 1024 2048 3e-4 
sw-en 767 26.09 1k 256 1024 6e-4 
so-en 604 11.23 8k 512 1024 3e-4 
Dataset#modelsBest BLEUbpe#layers#embed#hidden#att_headsinit_lr
zh-en 118 14.66 30k 512 1024 16 3e-4 
ru-en 176 20.23 10k 256 2048 3e-4 
ja-en 150 16.41 30k 512 2048 3e-4 
en-ja 168 20.74 10k 1024 2048 3e-4 
sw-en 767 26.09 1k 256 1024 6e-4 
so-en 604 11.23 8k 512 1024 3e-4 
Close Modal

or Create an Account

Close Modal
Close Modal