From 60d4d01d06343906c7fbaead0bdabf89c0b9d4dc Mon Sep 17 00:00:00 2001
From: Robert Nishihara <robertnishihara@gmail.com>
Date: Mon, 28 Aug 2017 23:01:29 -0700
Subject: [PATCH] Use observation filter in compute_action for PPO. (#884)

---
 python/ray/rllib/policy_gradient/policy_gradient.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/python/ray/rllib/policy_gradient/policy_gradient.py b/python/ray/rllib/policy_gradient/policy_gradient.py
index 0adb4f224..db6c2127e 100644
--- a/python/ray/rllib/policy_gradient/policy_gradient.py
+++ b/python/ray/rllib/policy_gradient/policy_gradient.py
@@ -266,4 +266,5 @@ class PolicyGradient(Algorithm):
                 for (a, o) in zip(self.agents, extra_data[4])])
 
     def compute_action(self, observation):
+        observation = self.model.observation_filter(observation)
         return self.model.common_policy.compute([observation])[0][0]