peter273431
/
van

 
			
							# Copyright 2021 Huawei Technologies Co., Ltd
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
# ============================================================================
"""global args for Visual Attention Network"""
import argparse
import ast
import os
import sys

import yaml

from src.configs import parser as _parser

args = None


def parse_arguments():
    """parse_arguments"""
    global args
    parser = argparse.ArgumentParser(description="MindSpore Visual Attention Network Training")

    parser.add_argument("-a", "--arch", metavar="ARCH", default="van_small_224",
                        help="model architecture")
    parser.add_argument("--accumulation_step", default=1, type=int, help="accumulation step")
    parser.add_argument("--amp_level", default="O2", choices=["O0", "O1", "O2", "O3"], help="AMP Level")
    parser.add_argument("--ape", default=False, type=ast.literal_eval, help="absolute position embedding")
    parser.add_argument("--dataset_sink_mode", type=ast.literal_eval, default=False, help="dataset sink mode")
    parser.add_argument("--batch-size", default=128, type=int, metavar="N",
                        help="mini-batch size (default: 256), this is the total "
                             "batch size of all GPUs on the current node when "
                             "using Data Parallel or Distributed Data Parallel")
    parser.add_argument("--beta", default=[0.9, 0.999], type=lambda x: [float(a) for a in x.split(",")],
                        help="beta for optimizer")
    parser.add_argument("--clip_global_norm_value", default=5., type=float, help="Clip grad value")
    parser.add_argument("--crop", default=True, type=ast.literal_eval, help="Crop when testing")
    parser.add_argument('--data_url', default="./data", help='Location of data.')
    parser.add_argument("--device_id", default=0, type=int, help="Device Id")
    parser.add_argument("--device_num", default=1, type=int, help="device num")
    parser.add_argument("--device_target", default="Ascend", choices=["GPU", "Ascend", "CPU"], type=str)
    parser.add_argument("--epochs", default=300, type=int, metavar="N", help="number of total epochs to run")
    parser.add_argument("--eps", default=1e-8, type=float)
    parser.add_argument("--file_format", type=str, choices=["AIR", "MINDIR"], default="MINDIR", help="file format")
    parser.add_argument("--in_channel", default=3, type=int)
    parser.add_argument("--is_dynamic_loss_scale", default=1, type=int, help="is_dynamic_loss_scale ")
    parser.add_argument("--keep_checkpoint_max", default=20, type=int, help="keep checkpoint max num")
    parser.add_argument("--optimizer", help="Which optimizer to use", default="sgd")
    parser.add_argument("--set", help="name of dataset", type=str, default="ImageNet")
    parser.add_argument("--graph_mode", default=0, type=int, help="graph mode with 0, python with 1")
    parser.add_argument("--mix_up", default=0., type=float, help="mix up")
    parser.add_argument("-j", "--num_parallel_workers", default=20, type=int, metavar="N",
                        help="number of data loading workers (default: 20)")
    parser.add_argument("--start_epoch", default=0, type=int, metavar="N",
                        help="manual epoch number (useful on restarts)")
    parser.add_argument("--warmup_length", default=0, type=int, help="Number of warmup iterations")
    parser.add_argument("--warmup_lr", default=5e-7, type=float, help="warm up learning rate")
    parser.add_argument("--wd", "--weight_decay", default=0.05, type=float, metavar="W",
                        help="weight decay (default: 1e-4)", dest="weight_decay")
    parser.add_argument("--loss_scale", default=1024, type=int, help="loss_scale")
    # parser.add_argument("--lr", "--learning_rate", default=5e-4, type=float, help="initial lr", dest="lr")
    parser.add_argument("--lr_scheduler", default="cosine_annealing", help="Schedule for the learning rate.")
    parser.add_argument("--lr_adjust", default=30, type=float, help="Interval to drop lr")
    parser.add_argument("--lr_gamma", default=0.97, type=int, help="Multistep multiplier")
    parser.add_argument("--momentum", default=0.9, type=float, metavar="M", help="momentum")
    parser.add_argument("--num_classes", default=1000, type=int)
    parser.add_argument("--pretrained", dest="pretrained", default=None, type=str, help="use pre-trained model")
    parser.add_argument("--config_file", help="Config file to use (see configs dir)", default='src/configs/van_small_224.yaml', required=False)
    parser.add_argument("--seed", default=0, type=int, help="seed for initializing training. ")
    parser.add_argument("--save_every", default=10, type=int, help="Save every ___ epochs(default:2)")
    parser.add_argument("--label_smoothing", type=float, help="Label smoothing to use, default 0.0", default=0.1)
    parser.add_argument("--image_size", default=224, help="Image Size.", type=int)
    parser.add_argument('--train_url', default="./", help='Location of training outputs.')
    parser.add_argument("--run_modelarts", type=ast.literal_eval, default=False, help="Whether run on modelarts")
    parser.add_argument("--run_openi", type=ast.literal_eval, default=True, help="Whether run on openi")
    args = parser.parse_args()

    # Allow for use from notebook without config file
    if len(sys.argv) > 1:
        get_config()


def get_config():
    """get_config"""
    global args
    override_args = _parser.argv_to_vars(sys.argv)
    # backup
    data_url = args.data_url
    train_url = args.train_url
    # load yaml file
    if args.run_modelarts:
        import moxing as mox
        if not args.config_file.startswith("obs:/"):
            args.config_file = "obs:/" + args.config_file
        with mox.file.File(args.config_file, 'r') as f:
            yaml_txt = f.read()
    if args.run_openi:
        current_path = os.path.abspath(__file__)
        src_dir = os.path.dirname(current_path)
        config_file_path = os.path.join(src_dir, "configs/{}.yaml".format(args.arch))
        if not os.path.exists(config_file_path):
            raise ValueError("model config file: {} not exists".format(config_file_path))
        yaml_txt = open(config_file_path).read()
    else:
        # yaml_txt = open(args.config_file).read()
        yaml_txt='# Architecture\narch: van_small_224\n\n# ===== Dataset ===== #\ndata_url: ./data/imagenet\nset: ImageNet\nnum_classes: 1000\nmix_up: 0.8\ncutmix: 1.0\nauto_augment: rand-m9-mstd0.5-inc1\ninterpolation: bicubic\nre_prob: 0.25 \nre_mode: pixel\nre_count: 1\nmixup_prob: 1.\nswitch_prob: 0.5\nmixup_mode: batch\n\n\n# ===== Learning Rate Policy ======== #\noptimizer: adamw\nbase_lr: 0.0005\nwarmup_lr: 0.00000007\nmin_lr: 0.000006\nlr_scheduler: cosine_lr\nwarmup_length: 20\n\n\n# ===== Network training config ===== #\namp_level: O1\nkeep_bn_fp32: True\nbeta: [ 0.9, 0.999 ]\nclip_global_norm_value: 5.\nis_dynamic_loss_scale: True\nepochs: 600\nlabel_smoothing: 0.1\nloss_scale: 1024\nweight_decay: 0.05\nmomentum: 0.9\nbatch_size: 128\n\n# ===== Hardware setup ===== #\nnum_parallel_workers: 32\ndevice_target: Ascend\n# ===== Model config ===== #\ndrop_path_rate: 0.1\nembed_dims: [64, 128, 320, 512]\nmlp_ratios: [8, 8, 4, 4]\ndepths: [2, 2, 4, 2]\nnum_stages: 4\nimage_size: 224'

    # override args
    loaded_yaml = yaml.load(yaml_txt, Loader=yaml.FullLoader)
    for v in override_args:
        loaded_yaml[v] = getattr(args, v)

    print(f"=> Reading YAML config from {args.config_file}")

    args.__dict__.update(loaded_yaml)
    # restore
    if args.run_openi:
        args.data_url = data_url
        args.train_url = train_url
    print(args)

    if "DEVICE_NUM" not in os.environ.keys():
        os.environ["DEVICE_NUM"] = str(args.device_num)
        os.environ["RANK_SIZE"] = str(args.device_num)


def run_args():
    """run and get args"""
    global args
    if args is None:
        parse_arguments()


run_args()