Kristian Hartikainen
13fb9fe3db
[rllib] Feature/soft actor critic v2 ( #5328 )
...
* Add base for Soft Actor-Critic
* Pick changes from old SAC branch
* Update sac.py
* First implementation of sac model
* Remove unnecessary SAC imports
* Prune unnecessary noise and exploration code
* Implement SAC model and use that in SAC policy
* runs but doesn't learn
* clear state
* fix batch size
* Add missing alpha grads and vars
* -200 by 2k timesteps
* doc
* lazy squash
* one file
* ignore tfp
* revert done
2019-08-01 23:37:36 -07:00
..
2017-02-27 21:14:31 -08:00
2018-04-10 00:51:44 -07:00
2019-05-05 00:04:13 -07:00
2019-04-03 17:05:09 -07:00
2018-07-01 00:05:08 -07:00
2019-05-26 11:27:53 -07:00
2018-12-06 17:39:05 -08:00
2018-01-01 13:02:05 -08:00
2019-01-23 13:30:02 -08:00
2019-08-01 23:37:36 -07:00
2019-01-23 13:30:02 -08:00
2018-11-03 18:48:32 -07:00
2019-07-22 15:45:05 -07:00
2019-07-11 13:17:19 +08:00
2019-06-01 21:39:22 -07:00
2018-07-01 00:05:08 -07:00
2019-06-14 17:22:36 -07:00
2018-02-22 11:15:03 -08:00
2019-01-01 12:01:27 +08:00
2017-07-16 22:19:33 -07:00
2019-03-20 18:47:12 -07:00
2019-02-05 22:00:54 -08:00
2018-12-04 17:36:06 -08:00
2017-08-29 21:37:53 -07:00
2017-07-16 22:19:33 -07:00
2017-11-27 21:38:35 -08:00
2018-11-01 11:52:05 -07:00
2018-11-19 20:55:27 -08:00
2019-07-22 15:47:10 -07:00
2019-01-12 14:05:28 -08:00
2019-04-02 22:17:33 -07:00
2019-07-12 17:27:03 -07:00
2019-05-24 13:44:39 -07:00
2018-07-01 00:05:08 -07:00
2019-02-13 16:25:05 -08:00
2018-07-06 00:16:22 -07:00
2019-04-09 20:59:17 -07:00
2018-08-24 17:02:54 -07:00
2018-07-01 00:05:08 -07:00
2018-11-13 17:48:33 -05:00
2018-01-25 16:39:00 -08:00
2017-11-23 11:31:59 -08:00
2017-11-23 11:31:59 -08:00
2018-11-01 10:50:56 -07:00
2019-08-01 23:37:36 -07:00
2019-08-01 13:03:59 -07:00
2018-01-19 10:08:45 -08:00
2019-08-01 13:03:59 -07:00
2019-06-03 06:49:24 +08:00
2019-05-05 00:04:13 -07:00
2019-08-01 23:37:36 -07:00
2019-01-23 21:27:26 -08:00
2019-08-01 13:03:59 -07:00
2019-07-27 02:08:16 -07:00
2019-05-20 16:46:05 -07:00
2019-06-07 16:45:36 -07:00
2019-01-15 16:25:25 -08:00
2019-08-01 23:37:36 -07:00
2019-08-01 23:37:36 -07:00
2019-08-01 13:03:59 -07:00
2018-10-16 22:48:30 -07:00
2017-07-16 22:19:33 -07:00
2018-11-10 21:52:20 -08:00
2019-02-28 11:05:28 -08:00
2019-05-05 16:06:15 -07:00
2018-07-01 00:05:08 -07:00
2017-12-20 12:54:25 -08:00
2019-04-26 13:22:26 -07:00
2019-06-05 09:04:36 -07:00
2019-05-05 00:04:13 -07:00
2019-05-02 13:16:48 -04:00
2019-05-04 02:51:26 -04:00
2019-06-02 22:13:40 -07:00
2019-05-27 13:23:17 -07:00
2019-07-10 01:58:26 -07:00
2019-05-12 15:08:47 -07:00
2019-05-17 13:34:14 +08:00
2019-05-26 11:27:53 -07:00
2019-04-03 17:05:09 -07:00
2017-07-16 22:19:33 -07:00
2019-02-24 14:26:46 -08:00