ZJUTER0126
/
CVPR2024_MaxQ

 
			
							import argparse
import ast

import torch

import models
import models.conv_type
from utils.net_utils import time_file_str


def parse_arguments():
    parser = argparse.ArgumentParser(description='PyTorch ImageNet Training')

    # misc
    parser.add_argument('--save_dir', type=str, default='./', help='folder to save checkpoints and log')
    parser.add_argument('--seed', default=42, type=int)
    parser.add_argument('--print-freq', '-p', default=100, type=int, metavar='N',
                        help='print frequency (default: 100)')
    # for model
    parser.add_argument('--arch', '-a', metavar='ARCH', default='resnet18', choices=models.__all__)
    parser.add_argument('--nonlinearity', type=str, default='relu', help='activation for model (default: relu)')
    parser.add_argument('--conv-bn-type', type=str, default='SoftMaxQConv2DBN',
                        choices=models.conv_type.__all__, help='convbn type for network (default: SoftMaxQConv2DBN)')

    # for datatset
    parser.add_argument('data', metavar='DIR', help='path to dataset')
    parser.add_argument('--set', default='ImageNet', type=str, choices=["ImageNet", "ImageNetDali"],
                        help='dataset (default: ImageNet)')
    parser.add_argument('-b', '--batch-size', default=256, type=int, metavar='N',
                        help='mini-batch size (default: 256)')
    parser.add_argument('-j', '--workers', default=12, type=int, metavar='N',
                        help='Number of data loading workers (default: 12)')

    # for epoch train
    parser.add_argument('--start-epoch', default=0, type=int, metavar='N',
                        help='Manual epoch number (useful on restarts)')
    parser.add_argument('--epochs', default=120, type=int, metavar='N',
                        help='Number of total epochs to run')

    # for learning rate
    parser.add_argument('--lr', '--learning-rate', default=0.1, type=float, metavar='LR',
                        help='initial learning rate')
    parser.add_argument('--lr-schedule', default='cos', choices=['step', 'cos'], type=str, help='lr scheduler')
    parser.add_argument('--lr-adjust', type=int, default=30, help='number of epochs that change learning rate')
    parser.add_argument('--warmup-length', type=int, default=0, help='number of epochs that warms up learning rate')

    # for optimizer
    parser.add_argument('--momentum', default=0.9, type=float, metavar='M', help='momentum')
    parser.add_argument('--weight-decay', '--wd', default=1e-4, type=float, metavar='W',
                        help='weight decay (default: 1e-4)')
    parser.add_argument('--nesterov', dest='nesterov', type=ast.literal_eval,
                        help='nesterov for SGD')
    parser.add_argument('--no-bn-decay', dest='no_bn_decay', type=ast.literal_eval,
                        help='not apply weight decay for bn layer')

    # for pretrain, resume or evaluate
    parser.add_argument('--use-pretrain', dest='use_pretrain', action='store_true',
                        help='use pre-trained model or not in torchvision')
    parser.add_argument('--resume', default='', type=str, metavar='PATH',
                        help='path to latest checkpoint (default: none)')
    parser.add_argument('--pretrained', default='', type=str, metavar='PATH',
                        help='path to pretrained checkpoint (default: none)')
    parser.add_argument('--evaluate', dest='evaluate', action='store_true',
                        help='evaluate model on validation set')

    # N:M sparsity
    parser.add_argument('--N', type=int, default=2, help='N for N:M sparsity (default: 2)')
    parser.add_argument('--M', type=int, default=4, help='M for N:M sparsity (default: 4)')
    parser.add_argument('--decay', type=float, default=0.0002, help='decay for SR-STE method')
    parser.add_argument('--decay-type', type=str, default='v1', help='decay type for conv type (default: v1)')

    # MaxQ
    parser.add_argument('--increase-start', default=0, type=int,
                        help='Start epoch to increase ratio of N:M blocks default: 0 ')
    parser.add_argument('--increase-end', default=90, type=int,
                        help='End epoch to increase ratio of N:M blocks default: 90 ')
    parser.add_argument('--tau', default=0.01, type=float, help='tau for MaxQ method')
    parser.add_argument('--prune-schedule', default='cubic', choices=['linear', 'exp', 'cos', 'cubic'],
                        type=str, help='prune scheduler for incremental sparsity in MaxQ method')

    args = parser.parse_args()
    args.use_cuda = torch.cuda.is_available()
    assert args.use_cuda, "torch.cuds is not available!"
    args.prefix = time_file_str()

    # check params
    if args.set.lower() == 'imagenet':
        assert args.nesterov is False
        assert args.no_bn_decay is True

    return args