Variance reduction techniques for gradient estimates in reinforcement learning

Greensmith, EvanBartlett, PeterBaxter, Jon2015-12-132015-12-13September0262042088http://hdl.handle.net/1885/75024Variance reduction techniques for gradient estimates in reinforcement learning20022015-12-11