Skip to Main Content
Table 2: 
Results on the AGENDA test set. #L and #H are the numbers of layers and the attention heads in each layer, respectively. When more than one, the values are for the global and local encoders, respectively. #P stands for the number of parameters in millions (node embeddings included).
Model#L#HBLEUMETEORCHRF++#P
Koncel-Kedziorski et al. (2019) 14.30±1.01 18.80±0.28 – – 
 
Global Encoder 15.44±0.25 20.76±0.194 43.95±0.40 54.4 
Local Encoder 16.03±0.19 21.12±0.32 44.70±0.29 54.0 
PGE 6, 3 8, 8 17.55±0.154 22.02±0.07 46.41±0.07 56.1 
CGE 6, 3 8, 8 17.82±0.134 22.23±0.09 46.47±0.10 61.5 
PGE-LW 8, 8 17.42±0.25 21.78±0.20 45.79±0.32 69.0 
CGE-LW 8, 8 18.01±0.14 22.34±0.07 46.69±0.17 69.8 
Model#L#HBLEUMETEORCHRF++#P
Koncel-Kedziorski et al. (2019) 14.30±1.01 18.80±0.28 – – 
 
Global Encoder 15.44±0.25 20.76±0.194 43.95±0.40 54.4 
Local Encoder 16.03±0.19 21.12±0.32 44.70±0.29 54.0 
PGE 6, 3 8, 8 17.55±0.154 22.02±0.07 46.41±0.07 56.1 
CGE 6, 3 8, 8 17.82±0.134 22.23±0.09 46.47±0.10 61.5 
PGE-LW 8, 8 17.42±0.25 21.78±0.20 45.79±0.32 69.0 
CGE-LW 8, 8 18.01±0.14 22.34±0.07 46.69±0.17 69.8 
Close Modal

or Create an Account

Close Modal
Close Modal