Skip to Main Content
Table 1: 
Critical hyperparameters.
SimpleLogicalVerifyQuantiQuant CountCompComp CountWebQSP All
 5e−4 5e−4 1e−2 1e−2 5e−3 
Timesteps 3 to 5 
Entropy-Loss Wt. 5e−4 5e−4 5e−6 5e−3 5e−3 5e−2 5e−2 5e−3 
Feasible Program after iterations 1000 2000 500 1300 1300 1500 1500 50 
Beam Pruning after iterations 100 100 100 1300 1300 1300 1000 100 
Auxillary Reward till iterations 800 800 800 800 200 
Learning Rate 1e−5 1e−5 1e−5 1e−5 1e−5 1e−5 1e−5 1e−4 
SimpleLogicalVerifyQuantiQuant CountCompComp CountWebQSP All
 5e−4 5e−4 1e−2 1e−2 5e−3 
Timesteps 3 to 5 
Entropy-Loss Wt. 5e−4 5e−4 5e−6 5e−3 5e−3 5e−2 5e−2 5e−3 
Feasible Program after iterations 1000 2000 500 1300 1300 1500 1500 50 
Beam Pruning after iterations 100 100 100 1300 1300 1300 1000 100 
Auxillary Reward till iterations 800 800 800 800 200 
Learning Rate 1e−5 1e−5 1e−5 1e−5 1e−5 1e−5 1e−5 1e−4 
Close Modal

or Create an Account

Close Modal
Close Modal