Move arguments to a separate file

2026-06-26 16:10:05 +08:00 · 2017-09-18 23:22:11 -04:00
parent ec47ca7ed9
commit 9e07584872
2 changed files with 63 additions and 55 deletions
@@ -0,0 +1,61 @@
+import argparse
+
+import torch
+
+
+def get_args():
+    parser = argparse.ArgumentParser(description='RL')
+    parser.add_argument('--algo', default='a2c',
+                        help='algorithm to use: a2c | ppo | acktr')
+    parser.add_argument('--lr', type=float, default=7e-4,
+                        help='learning rate (default: 7e-4)')
+    parser.add_argument('--eps', type=float, default=1e-5,
+                        help='RMSprop optimizer epsilon (default: 1e-5)')
+    parser.add_argument('--alpha', type=float, default=0.99,
+                        help='RMSprop optimizer apha (default: 0.99)')
+    parser.add_argument('--gamma', type=float, default=0.99,
+                        help='discount factor for rewards (default: 0.99)')
+    parser.add_argument('--use-gae', action='store_true', default=False,
+                        help='use generalized advantage estimation')
+    parser.add_argument('--tau', type=float, default=0.95,
+                        help='gae parameter (default: 0.95)')
+    parser.add_argument('--entropy-coef', type=float, default=0.01,
+                        help='entropy term coefficient (default: 0.01)')
+    parser.add_argument('--value-loss-coef', type=float, default=0.5,
+                        help='value loss coefficient (default: 0.5)')
+    parser.add_argument('--max-grad-norm', type=float, default=0.5,
+                        help='value loss coefficient (default: 0.5)')
+    parser.add_argument('--seed', type=int, default=1,
+                        help='random seed (default: 1)')
+    parser.add_argument('--num-processes', type=int, default=16,
+                        help='how many training CPU processes to use (default: 16)')
+    parser.add_argument('--num-steps', type=int, default=5,
+                        help='number of forward steps in A2C (default: 5)')
+    parser.add_argument('--ppo-epoch', type=int, default=4,
+                        help='number of ppo epochs (default: 4)')
+    parser.add_argument('--batch-size', type=int, default=64,
+                        help='ppo batch size (default: 64)')
+    parser.add_argument('--clip-param', type=float, default=0.2,
+                        help='ppo clip parameter (default: 0.2)')
+    parser.add_argument('--num-stack', type=int, default=4,
+                        help='number of frames to stack (default: 4)')
+    parser.add_argument('--log-interval', type=int, default=10,
+                        help='log interval, one log per n updates (default: 10)')
+    parser.add_argument('--vis-interval', type=int, default=100,
+                        help='vis interval, one log per n updates (default: 100)')
+    parser.add_argument('--num-frames', type=int, default=10e6,
+                        help='number of frames to train (default: 10e6)')
+    parser.add_argument('--env-name', default='PongNoFrameskip-v4',
+                        help='environment to train on (default: PongNoFrameskip-v4)')
+    parser.add_argument('--log-dir', default='/tmp/gym/',
+                        help='directory to save agent logs (default: /tmp/gym)')
+    parser.add_argument('--no-cuda', action='store_true', default=False,
+                        help='disables CUDA training')
+    parser.add_argument('--no-vis', action='store_true', default=False,
+                        help='disables visdom visualization')
+    args = parser.parse_args()
+
+    args.cuda = not args.no_cuda and torch.cuda.is_available()
+    args.vis = not args.no_vis
+
+    return args
@@ -1,4 +1,3 @@
-import argparse
 import glob
 import os

@@ -11,70 +10,18 @@ import torch.optim as optim
 from torch.autograd import Variable
 from torch.utils.data.sampler import BatchSampler, SubsetRandomSampler

+from arguments import get_args
 from baselines.common.vec_env.subproc_vec_env import SubprocVecEnv
 from envs import make_env
 from kfac import KFACOptimizer
 from model import ActorCritic
 from vizualize_atari import visdom_plot

-parser = argparse.ArgumentParser(description='RL')
-parser.add_argument('--algo', default='a2c',
-                    help='algorithm to use: a2c | ppo | acktr')
-parser.add_argument('--lr', type=float, default=7e-4,
-                    help='learning rate (default: 7e-4)')
-parser.add_argument('--eps', type=float, default=1e-5,
-                    help='RMSprop optimizer epsilon (default: 1e-5)')
-parser.add_argument('--alpha', type=float, default=0.99,
-                    help='RMSprop optimizer apha (default: 0.99)')
-parser.add_argument('--gamma', type=float, default=0.99,
-                    help='discount factor for rewards (default: 0.99)')
-parser.add_argument('--use-gae', action='store_true', default=False,
-                    help='use generalized advantage estimation')
-parser.add_argument('--tau', type=float, default=0.95,
-                    help='gae parameter (default: 0.95)')
-parser.add_argument('--entropy-coef', type=float, default=0.01,
-                    help='entropy term coefficient (default: 0.01)')
-parser.add_argument('--value-loss-coef', type=float, default=0.5,
-                    help='value loss coefficient (default: 0.5)')
-parser.add_argument('--max-grad-norm', type=float, default=0.5,
-                    help='value loss coefficient (default: 0.5)')
-parser.add_argument('--seed', type=int, default=1,
-                    help='random seed (default: 1)')
-parser.add_argument('--num-processes', type=int, default=16,
-                    help='how many training CPU processes to use (default: 16)')
-parser.add_argument('--num-steps', type=int, default=5,
-                    help='number of forward steps in A2C (default: 5)')
-parser.add_argument('--ppo-epoch', type=int, default=4,
-                    help='number of ppo epochs (default: 4)')
-parser.add_argument('--batch-size', type=int, default=64,
-                    help='ppo batch size (default: 64)')
-parser.add_argument('--clip-param', type=float, default=0.2,
-                    help='ppo clip parameter (default: 0.2)')
-parser.add_argument('--num-stack', type=int, default=4,
-                    help='number of frames to stack (default: 4)')
-parser.add_argument('--log-interval', type=int, default=10,
-                    help='log interval, one log per n updates (default: 10)')
-parser.add_argument('--vis-interval', type=int, default=100,
-                    help='vis interval, one log per n updates (default: 100)')
-parser.add_argument('--num-frames', type=int, default=10e6,
-                    help='number of frames to train (default: 10e6)')
-parser.add_argument('--env-name', default='PongNoFrameskip-v4',
-                    help='environment to train on (default: PongNoFrameskip-v4)')
-parser.add_argument('--log-dir', default='/tmp/gym/',
-                    help='directory to save agent logs (default: /tmp/gym)')
-parser.add_argument('--no-cuda', action='store_true', default=False,
-                    help='disables CUDA training')
-parser.add_argument('--no-vis', action='store_true', default=False,
-                    help='disables visdom visualization')
-
-
-args = parser.parse_args()
+args = get_args()

 assert args.algo in ['a2c', 'ppo', 'acktr']
 if args.algo == 'ppo':
    assert args.num_processes * args.num_steps % args.batch_size == 0
-args.cuda = not args.no_cuda and torch.cuda.is_available()
-args.vis = not args.no_vis

 num_updates = int(args.num_frames) // args.num_steps // args.num_processes