OpenPointCloud
/
NGS_test

 
			
							import argparse
import numpy as np
import os
import torch
import datetime
import logging
from pathlib import Path
import sys
import importlib
import shutil
from dataset import Dataset
from torch import nn

BASE_DIR = os.path.dirname(os.path.abspath(__file__))
ROOT_DIR = BASE_DIR
sys.path.append(os.path.join(ROOT_DIR, 'models'))


def parse_args():
    '''PARAMETERS'''
    parser = argparse.ArgumentParser('point_based_PCGC')
    parser.add_argument('--batch_size', type=int, default=32, help='batch size in training [default: 32]')
    parser.add_argument('--model', default='NGS_PCC', help='model name')
    parser.add_argument('--epoch',  default=200, type=int, help='number of epoch in training [default: 100]') # 100
    parser.add_argument('--learning_rate', default=0.001, type=float, help='learning rate in training [default: 0.001]')
    parser.add_argument('--gpu', type=str, default='0', help='specify gpu device [default: 0]')
    parser.add_argument('--num_point', type=int, default=2048, help='Point Number [default: 2048]')
    parser.add_argument('--optimizer', type=str, default='Adam', help='optimizer for training [default: Adam]')
    parser.add_argument('--log_dir', type=str, default=None, help='experiment root')
    parser.add_argument('--decay_rate', type=float, default=1e-4, help='decay rate [default: 1e-4]')
    parser.add_argument('--normal', action='store_true', default=False, help='Whether to use normal information [default: False]')
    parser.add_argument('--lamb', default=1, type=int)
    parser.add_argument('--bottleneck_size', default=256, type=int) # 512
    parser.add_argument('--use_hyper', default=True, type=bool)
    parser.add_argument('--recon_points', default=2048, type=int)
    parser.add_argument('--cpu', default=False, type=bool)
    parser.add_argument('--multigpu', default=False, type=bool)
    parser.add_argument('--pretrained', default='', type=str)
    parser.add_argument('--dataset_path', type=str, default='dataset') # default: '../pointcloud_compression/PointCloudDatasets'
    return parser.parse_args()

def test(args, model, loader, criterion, global_epoch=None):
    mean_loss = []
    mean_bpp = []
    mean_cd = []
    length = len(loader)
    with torch.no_grad():
        for j, data in enumerate(loader):
            if j%100==0:
                print(j,'/',length)
 
            #points = data
            #points = points.cuda()
            points = data[0].cuda() # data[0] shape: [B, N, C] --> [32, 2048, 3]
            model.eval()
            bpp, pc_coor, cd = model(points) # pc_coor shape: [B, N, C] --> [32, 2048, 3]
            loss, cd, bpp = criterion(bpp, cd)
            mean_cd.append(cd.mean().item())
            mean_loss.append(loss.mean().item())
            mean_bpp.append(bpp.mean().item())
            
    return np.mean(mean_loss), np.mean(mean_bpp), np.mean(mean_cd)


def main(args):
    def log_string(str):
        logger.info(str)
        print(str)

    '''HYPER PARAMETER'''
    os.environ["CUDA_VISIBLE_DEVICES"] = args.gpu

    '''CREATE DIR'''
    experiment_name = str(args.lamb)+'_'+str(args.bottleneck_size)+'_'+str(args.recon_points)
    experiment_dir = Path('./log/')
    experiment_dir.mkdir(exist_ok=True)
    experiment_dir = experiment_dir.joinpath(args.model)
    experiment_dir.mkdir(exist_ok=True)
    if args.log_dir is None:
        experiment_dir = experiment_dir.joinpath(experiment_name)
    else:
        experiment_dir = experiment_dir.joinpath(args.log_dir)

    experiment_dir.mkdir(exist_ok=True)
    checkpoints_dir = experiment_dir.joinpath('checkpoints/')
    checkpoints_dir.mkdir(exist_ok=True)
    log_dir = experiment_dir.joinpath('logs/')
    log_dir.mkdir(exist_ok=True)

    '''LOG'''
    args = parse_args()
    logger = logging.getLogger("Model")
    logger.setLevel(logging.INFO)
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    file_handler = logging.FileHandler('%s/%s.txt' % (log_dir, args.model))
    file_handler.setLevel(logging.INFO)
    file_handler.setFormatter(formatter)
    logger.addHandler(file_handler)
    log_string('PARAMETER ...')
    log_string(args)

    '''DATA LOADING'''
    log_string('Load dataset ...')
    TRAIN_DATASET = Dataset(root=args.dataset_path, dataset_name = 'shapenetcorev2', num_points=2048,
                            split='train')
    VAL_DATASET = Dataset(root=args.dataset_path, dataset_name = 'shapenetcorev2', num_points=2048,
                          split='val')
    trainDataLoader = torch.utils.data.DataLoader(TRAIN_DATASET, batch_size=args.batch_size, shuffle=False, num_workers=4)
    valDataLoader = torch.utils.data.DataLoader(VAL_DATASET, batch_size=args.batch_size, shuffle=True, num_workers=4)

    '''MODEL LOADING'''
    MODEL = importlib.import_module(args.model)
    device = torch.device("cuda:0")
    shutil.copy('./models/%s.py' % args.model, str(experiment_dir))
    shutil.copy('models/utils.py', str(experiment_dir))

    if not args.cpu:
        print("cuda is available !")
        model = MODEL.get_model(use_hyperprior=args.use_hyper, bottleneck_size=args.bottleneck_size, recon_points=args.recon_points).cuda()
        #criterion = MODEL.get_loss(lam=args.lamb).cuda()
        criterion = MODEL.get_loss(lam=args.lamb).to(device)
        if args.multigpu:
            print('multiple gpu used')
            model = nn.DataParallel(model)
    else:
        model = MODEL.get_model(use_hyperprior=False, bottleneck_size=args.bottleneck_size, recon_points=args.recon_points)
        criterion = MODEL.get_loss(lam=args.lamb)

    '''pretrain or train from scratch'''
    try:
        checkpoint = torch.load(str(experiment_dir) + '/checkpoints/best_model.pth')
        start_epoch = checkpoint['epoch']
        model.load_state_dict(checkpoint['model_state_dict'])
        log_string('Use pretrain model')
    except:
        log_string('No existing model, starting training from scratch...')
        start_epoch = 0

    '''finetune'''
    try:
        checkpoint = torch.load(args.pretrained)
        start_epoch = 0
        model.load_state_dict(checkpoint['model_state_dict'])
        log_string('Finetuning')
    except:
        log_string('No pretrained model')

    if args.optimizer == 'Adam':
        optimizer = torch.optim.Adam(
            model.parameters(),
            lr=args.learning_rate,
            betas=(0.9, 0.999),
            eps=1e-08,
            weight_decay=args.decay_rate
        )

    else:
        optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
        log_string('Use pretrain optimizer')
    try:
        assert len(args.pretrained_model) == 0
        optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
        print(optimizer)
    except:
        log_string('No existing optimizer')

    scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=20, gamma=0.7)
    global_epoch = 0
    global_step = 0
    if args.log_dir:
        best_loss_test = checkpoint['loss']
    else:
        best_loss_test = 9999999


    '''TRANING'''
    logger.info('Start training...')
    for epoch in range(start_epoch,args.epoch):
        mean_loss = []
        mean_bpp_loss = []
        mean_cd_loss = []
        log_string('Epoch %d (%d/%s):' % (epoch + 1, epoch + 1, args.epoch))
        # scheduler.step() ## default
        length = len(trainDataLoader)
        print()
        print("Start training...")
        for batch_id, data in enumerate(trainDataLoader, 0):
            if batch_id%1000==0:
                print(batch_id,'/',length)
                
            # [B, N, C]
            points = data[0] # [B, N, C] B: Batchsize, like 32, N: nums of point clouds, like 2048, C: channel, like 3   
            # print("if train points is list or torch.Tensor", isinstance(points,list), isinstance(points, torch.Tensor))
            # print("train points dtype:", points.dtype, points)
            
            if not args.cpu:
                points = points.cuda()
            else:
                points = points
            optimizer.zero_grad()

            model.train()
            
            bpp, pc_coor, cd = model(points, global_step=global_step) # pc_coor shape:  [B, N, C]
            
            loss, cd, bpp = criterion(bpp, cd)
            if args.multigpu:
                loss = loss.mean()
                cd = cd.mean()
                bpp = bpp.mean()

            loss.backward()
            optimizer.step()
            mean_loss.append(loss.item())
            mean_bpp_loss.append(bpp.item())
            mean_cd_loss.append(cd.item())
            global_step += 1

        # adjustment based on the official website instance
        # Detected call of `lr_scheduler.step()` before `optimizer.step()`
        scheduler.step()  

        ml = np.mean(mean_loss)
        mbpp = np.mean(mean_bpp_loss)
        mcd = np.mean(mean_cd_loss)
        log_string('mean loss: %f' % ml)
        log_string('mean bpp: %f' % mbpp)
        log_string('mean chamfer distance: %f' % mcd)

        #break ## add
        
        if epoch%5==0:
            log_string('Start val...')
            with torch.no_grad():
                mean_loss_test, mean_bpp_test, mean_cd_test = test(args, model.eval(), valDataLoader, criterion, global_step)
                log_string('val loss: %f'% (mean_loss_test))
                log_string('val bpp: %f' % (mean_bpp_test))
                log_string('val cd: %f' % (mean_cd_test))

                if epoch%10==0:
                    savepath = str(checkpoints_dir) + '/'+str(epoch)+'.pth'
                    state = {
                        'epoch': epoch,
                        'loss': mean_loss_test,
                        'model_state_dict': model.state_dict(),
                        'optimizer_state_dict': optimizer.state_dict(),
                    }
                    torch.save(state, savepath)

                if (mean_loss_test < best_loss_test and epoch >= 30):
                    logger.info('Save model...')
                    best_loss_test = mean_loss_test
                    savepath = str(checkpoints_dir) + '/best_model.pth'
                    log_string('Saving at %s'% savepath)
                    state = {
                        'epoch': epoch,
                        'loss': mean_loss_test,
                        'model_state_dict': model.state_dict(),
                        'optimizer_state_dict': optimizer.state_dict(),
                    }
                    torch.save(state, savepath)

    logger.info('End of training...')

if __name__ == '__main__':
    args = parse_args()
    main(args)