Skip to Main Content
Table 2: 

MLB results (test set); relation generation (RG) count (#) and precision (P%), content selection (CS) precision (P%), recall (R%), and F-measure (F%), content ordering (CO) as complement of normalized Damerau-Levenshtein distance (DLD%), and BLEU. Highest and s·e·c·o·n·d·h·i·g·h·e·s·t· generation models are highlighted.

MLBRGCSCOBLEU
#P%P%R%F%DLD%
Templ 62.3 99.9 21.6 55.2 31.0 11.0 4.12 
 
ED +CC 32.5 91.3 27.8 40.6 33.0 17.1 9.68 
NCP +CC 19.6 81.3 44.5 44.1 44.3 21.9 9.68 
ENT 23.8 81.1 40.9 49.5 44.8 20.7 11.50 
Macro 3·0·.·8· 9·4·.·4· 40.8 54.9 4·6·.·8· 2·1·.·8· 1·2·.·6·2· 
 +Bin 31.2 93.7 38.3 52.4 44.2 21.6 12.32 
 
SeqPlan 28.9 95.9 4·3·.·3· 5·3·.·5· 47.8 22.7 14.29 
 w Uniform 18.5 90.9 36.5 30.6 33.3 14.5 10.30 
 w Oracle 27.6 95.9 42.5 50.4 46.1 22.0 13.13 
 2-Stage 28.6 95.9 41.4 50.8 45.6 21.3 13.96 
MLBRGCSCOBLEU
#P%P%R%F%DLD%
Templ 62.3 99.9 21.6 55.2 31.0 11.0 4.12 
 
ED +CC 32.5 91.3 27.8 40.6 33.0 17.1 9.68 
NCP +CC 19.6 81.3 44.5 44.1 44.3 21.9 9.68 
ENT 23.8 81.1 40.9 49.5 44.8 20.7 11.50 
Macro 3·0·.·8· 9·4·.·4· 40.8 54.9 4·6·.·8· 2·1·.·8· 1·2·.·6·2· 
 +Bin 31.2 93.7 38.3 52.4 44.2 21.6 12.32 
 
SeqPlan 28.9 95.9 4·3·.·3· 5·3·.·5· 47.8 22.7 14.29 
 w Uniform 18.5 90.9 36.5 30.6 33.3 14.5 10.30 
 w Oracle 27.6 95.9 42.5 50.4 46.1 22.0 13.13 
 2-Stage 28.6 95.9 41.4 50.8 45.6 21.3 13.96 
Close Modal

or Create an Account

Close Modal
Close Modal