env_step,episode_reward,step 1000.0,-225.65779314830192,1 2000.0,-65.71134993850737,2 3000.0,-41.108054659299256,3 4000.0,-40.52245734210465,4 5000.0,-84.95124858941983,5 6000.0,-153.0178005312033,6 7000.0,-41.1103979971679,7 8000.0,-40.91011476904204,8 9000.0,-75.36942845308116,9 10000.0,-83.824481430753,10 11000.0,-128.77248356820655,11 12000.0,-29.04632690877764,12 13000.0,-85.34865250158455,13 14000.0,-659.2772780052933,14 15000.0,-65.61216305984382,15