Table 8:
Cross-metric comparison on individual graph rankings. Percentage of cases where metrics differ in their preference for one parse over the other. metric$XY$: short for metric(X,Y). † indicates significance in score differences assigned to parse pairs at p<0.005.
$SmA,BG$$SmGA,B$$sbA,BG$$sbGA,B$$S2mA,BG$$S2mGA,B$
$SmA,BG$ 0.0 1.5 17.6 19.0 4.0 4.1
$SmGA,B$ – 0.0 17.9 19.5 3.9 4.0

$sbA,BG$ – – 0.0 8.1 18.4 19.2
$sbGA,B$ – – – 0.0 19.1 19.3

$S2mA,BG$ – – – – 0.0 1.2
$S2mGA,B$ – – – –  0.0
$SmA,BG$$SmGA,B$$sbA,BG$$sbGA,B$$S2mA,BG$$S2mGA,B$
$SmA,BG$ 0.0 1.5 17.6 19.0 4.0 4.1
$SmGA,B$ – 0.0 17.9 19.5 3.9 4.0

$sbA,BG$ – – 0.0 8.1 18.4 19.2
$sbGA,B$ – – – 0.0 19.1 19.3

$S2mA,BG$ – – – – 0.0 1.2
$S2mGA,B$ – – – –  0.0
Close Modal