Skip to Main Content
Table 2 

Statistics of the bilingual corpora.


English–French
English–Hebrew
Sentences 30,000 30,000 19,626 19,626 
Tokens 834,707 895,632 271,787 280,508 
Types 22,787 27,880 14,142 12,555 
Bigram tokens 804,704 865,632 252,183 280,506 
Bigram types 218,108 225,660 128,987 149,688 

English–French
English–Hebrew
Sentences 30,000 30,000 19,626 19,626 
Tokens 834,707 895,632 271,787 280,508 
Types 22,787 27,880 14,142 12,555 
Bigram tokens 804,704 865,632 252,183 280,506 
Bigram types 218,108 225,660 128,987 149,688 
Close Modal

or Create an Account

Close Modal
Close Modal