ReLU
/
CFLOW-AD-2

 
			
							#import torch
#import torch.nn.functional as F
import mindspore
from mindspore import Tensor
import datetime
from tqdm import tqdm
from visualize import *
from custom_models.utils import *
from custom_datasets import *
from custom_models import *
from tools import *
from model import load_decoder_arch, load_new_decoder_arch, load_encoder_arch, positionalencoding2d, activation
import time
from sklearn.metrics import roc_auc_score, auc, precision_recall_curve
from skimage.measure import label, regionprops
from visualize import *
from typing import Iterable, Tuple, List
from mindspore.profiler import Profiler
import sys
import os
import json
# from pth2ckpt_lyf import pytorch2mindspore

OUT_DIR = './viz/'

gamma = 0.0
theta = mindspore.nn.Sigmoid()
log_theta = mindspore.nn.LogSigmoid()


def train_meta_epoch(c, epoch, dataset, encoder, cflow_decoders, optimizer, pool_layers, N, profiler,pool_dims):
    P = c.condition_vec
    L = c.pool_layers
    #decoders = [decoder.train() for decoder in decoders]
    encoder=encoder.set_grad(requires_grad=False)
    cflow_decoders = [decoder.set_train(mode=True) for decoder in cflow_decoders]
    I=dataset.get_dataset_size()
    # print('dataset_size: ', I)
    
    pro=0
    #iterator = iter(loader)
    
    for sub_epoch in range(c.sub_epochs):
        train_loss = 0.0
        train_count = 0
        train_loss_meansum=0.0
        train_loss_meancount=0
        #profiler.start()
        data_iter = dataset.create_tuple_iterator(num_epochs=-1)
        for i in range(I):

            image, _, _ = data_iter.__next__()
            activation = encoder(image)
            '''
            f=open("./test/image.txt","w")
            f.write(str(image.asnumpy()))
            for l, layer in enumerate(pool_layers):
                f=open("./test/activation"+str(l)+".txt","w")
                print(activation[l].shape)
                f.write(str(activation[l].asnumpy()))
            sys.exit()'''
            # train decoder
            e_list = list()
            c_list = list()
            for l, layer in enumerate(pool_layers):
                if 'vit' in c.enc_arch:
                    e = activation[l].transpose(0,2,1)[..., 1:]
                    e_hw = int(np.sqrt(e.size(2)))
                    e = e.reshape(-1, e.size(1), e_hw, e_hw)  # BxCxHxW
                else:
                    #e = activation[layer].detach()  # BxCxHxW
                    e = activation[l]
                B, C, H, W = e.shape
                print('(Test) e.shape:', e.shape, '||| N:', N)
                S = H * W
                E = B * S
                #
                #p = positionalencoding2d(P, H, W).to(c.device).unsqueeze(0).repeat(B, 1, 1, 1)
                p = positionalencoding2d(P, H, W).expand_dims(0).repeat(B,axis=0)
                c_r = p.reshape(B, P, S).transpose(0, 2, 1).reshape(E, P)  # BHWxP
                e_r = e.reshape(B, C, S).transpose(0, 2, 1).reshape(E, C)  # BHWxC
                #perm = torch.randperm(E).to(c.device)  # BHWSW
                perm = mindspore.ops.Randperm(E)(mindspore.Tensor([E],dtype=mindspore.int32))
                #decoder = decoders[l]
                #
                #print(e_r.shape)
                #print(e_r.dtype)
                print('(Test)', 'E: ',E, ', N: ', N)
                FIB = E // N  # number of fiber batches
                #SSprint(l)
                assert FIB > 0, 'MAKE SURE WE HAVE ENOUGH FIBERS, otherwise decrease N or batch-size!'
                for f in range(FIB):  # per-fiber processing
                    #idx = torch.arange(f * N, (f + 1) * N)
                    #idx = mindspore.numpy.arange(f * N, (f + 1) * N)
                    idx=np.arange(f * N, (f + 1) * N).tolist()
                    c_p = c_r[perm[idx]]  # NxP
                    e_p = e_r[perm[idx]]  # NxC
                    #print("c_p")
                    #print(c_p)
                    #print("e_p")
                    #print(e_p)
                    lossmean=cflow_decoders[l](e_p, c_p)
                    #print("datasize/dataid: {:d}/{:d}, layers/l:{:d}/{:d}, FIB/f: {:d}/{:d}".format(I,i,len(pool_layers),l,FIB,f))
                    #train_loss += t2np(loss.sum())
                    #train_count += len(loss)
                    #print(len(loss))
                    #print(lossmean)
                    #print(lossmean)
                    train_loss_meansum+=t2np(lossmean)
                    train_loss_meancount+=1

        #mean_train_loss = train_loss / train_count
        mean_train_loss_meansum = train_loss_meansum / train_loss_meancount
        if c.verbose:
            #print('Epoch: {:d}.{:d} \t train loss: {:.4f}\n'.format(epoch, sub_epoch, mean_train_loss))
            print('Epoch: {:d}.{:d} \t train loss mean : {:.4f} \n'.format(epoch, sub_epoch,mean_train_loss_meansum))
    #


def test_meta_epoch(c, epoch, dataset, encoder, decoders, pool_layers, N, pool_dims, profiler):
    # test
    if c.verbose:
        print('\nCompute loss and scores on test set:')
    #
    P = c.condition_vec
    #decoders = [decoder.eval() for decoder in decoders]
    encoder=encoder.set_grad(requires_grad=False)
    decoders = [decoder.set_train(False) for decoder in decoders]
    decoders = [decoder.set_grad(False) for decoder in decoders]
    '''
    cflow_decoders=[]
    flow_decoders=[]
    datasetlen=0;
    for k in range(len(decoders)):
        cflow_decoders.append(DecoderEvalOneStep(net=decoders[k],C=pool_dims[k],cflow=True))
        flow_decoders.append(DecoderEvalOneStep(net=decoders[k],C=pool_dims[k],cflow=False))
    '''
    height = list()
    width = list()
    image_list = list()
    gt_label_list = list()
    gt_mask_list = list()
    test_dist = [list() for layer in pool_layers]
    test_loss = 0.0
    test_count = 0
    start = time.time()
    #with torch.no_grad():
    datasetlen=0
    I=dataset.get_dataset_size()
    data_iter = dataset.create_tuple_iterator()
    #profiler.start()
    for i in range(I):
    #for i, (image, label, mask) in enumerate(tqdm(loader, disable=c.hide_tqdm_bar)):
        # save
        image, label, mask = data_iter.__next__()
        datasetlen+=label.shape[0]
        if c.viz:
            image_list.extend(t2np(image))
        gt_label_list.extend(t2np(label))
        gt_mask_list.extend(t2np(mask))
        # data
        #image = image.to(c.device)  # single scale
        #_ = encoder(image)  # BxCxHxW
        activation = encoder(image)
        # test decoder
        e_list = list()
        for l, layer in enumerate(pool_layers):
            if 'vit' in c.enc_arch:
                e = activation[l].transpose(1, 2)[..., 1:]
                e_hw = int(np.sqrt(e.size(2)))
                e = e.reshape(-1, e.size(1), e_hw, e_hw)  # BxCxHxW
            else:
                e = activation[l]  # BxCxHxW
            #
            #B, C, H, W = e.size()
            
            print("finish decoder")
            B, C, H, W = e.shape
            S = H * W
            E = B * S
            #
            if i == 0:  # get stats
                height.append(H)
                width.append(W)
            #
            #p = positionalencoding2d(P, H, W).to(c.device).unsqueeze(0).repeat(B, 1, 1, 1)
            p = positionalencoding2d(P, H, W).expand_dims(0).repeat(B, axis=0)
            c_r = p.reshape(B, P, S).transpose(0, 2, 1).reshape(E, P)  # BHWxP
            e_r = e.reshape(B, C, S).transpose(0, 2, 1).reshape(E, C)  # BHWxC
            #
            #m = F.interpolate(mask, size=(H, W), mode='nearest')
            m = mindspore.ops.ResizeNearestNeighbor(size=(H, W))(mask)
            m_r = m.reshape(B, 1, S).transpose(0, 2, 1).reshape(E, 1)  # BHWx1
            #
            #decoder = decoders[l]
            FIB = E // N + int(E % N > 0)  # number of fiber batches
            #FIB = E // N 
            for f in range(FIB):
                if f < (FIB - 1):
                    #idx = torch.arange(f * N, (f + 1) * N)
                    idx=mindspore.numpy.arange(f * N, (f + 1) * N)
                else:
                    #idx = torch.arange(f * N, E)
                    idx = mindspore.numpy.arange(f * N, E)
                #
                c_p = c_r[idx]  # NxP
                e_p = e_r[idx]  # NxC
                m_p = m_r[idx] > 0.5  # Nx1
                #
                #print("begindecoder")
                '''
                if 'cflow' in c.dec_arch:
                    #loss = decoders[l](e_p, [c_p, ])
                    log_prob = cflow_decoders[l](e_p, c_p)
                else:
                    #loss = decoders[l](e_p)
                    log_prob = flow_decoders[l](e_p)
                '''
                z, log_jac_det = decoders[l](e_p, c_p)
                
                #log_prob = cflow_decoders[l](e_p, c_p,train=False)
                #
                #print("finishdecoder")
                decoder_log_prob = get_logp(C, z, log_jac_det)
                log_prob = decoder_log_prob / C  # likelihood per dim
                loss = -log_theta(log_prob)
                test_loss += t2np(loss.sum())
                test_count += len(loss)
                #test_dist[l] = test_dist[l] + log_prob.detach().cpu().tolist()
                test_dist[l] = test_dist[l] + log_prob.asnumpy().tolist()
                #print("test datasize/dataid: {:d}/{:d}, layers/l:{:d}/{:d}, FIB/f: {:d}/{:d}".format(I,i,len(pool_layers),l,FIB,f))
                '''
                if f==100:
                    profiler.stop()
                    profiler.analyse()
                    break;
                    '''
            #break;
        #break;
    #
    #fps = len(loader.dataset) / (time.time() - start)
    fps = datasetlen / (time.time() - start)
    mean_test_loss = test_loss / test_count
    device_id = int(os.getenv('RANK_ID'))
    if c.verbose:
        print('(Device {}) Epoch: {:d} \t test_loss: {:.4f} and {:.2f} fps'.format(device_id, epoch, mean_test_loss, fps))
    #

    return height, width, image_list, test_dist, gt_label_list, gt_mask_list


def test_meta_fps(c, epoch, dataset, encoder, decoders, pool_layers, N):
    # test
    if c.verbose:
        print('\nCompute loss and scores on test set:')
    #
    P = c.condition_vec
    #decoders = [decoder.eval() for decoder in decoders]
    decoders = [decoder.set_train(False) for decoder in decoders]
    decoders = [decoder.set_grad(False) for decoder in decoders]
    encoder=encoder.set_grad(False)
    height = list()
    width = list()
    image_list = list()
    gt_label_list = list()
    gt_mask_list = list()
    test_dist = [list() for layer in pool_layers]
    test_loss = 0.0
    test_count = 0
    A = len(loader.dataset)
    #with torch.no_grad():
    # warm-up
    I=dataset.get_dataset_size()
    data_iter = dataset.create_tuple_iterator()
    for i in range(I):
    #for i, (image, label, mask) in enumerate(tqdm(loader, disable=c.hide_tqdm_bar)):
        # save
        image, _, _ = data_iter.__next__()
        # data
        #image = image.to(c.device)  # single scale
        _ = encoder(image)  # BxCxHxW
    # measure encoder only
    #torch.cuda.synchronize()
    start = time.time()
    I=dataset.get_dataset_size()
    data_iter = dataset.create_tuple_iterator()
    for i in range(I):
    #for i, (image, label, mask) in enumerate(tqdm(loader, disable=c.hide_tqdm_bar)):
        # save
        image, _, _ = data_iter.__next__()
        # data
        #image = image.to(c.device)  # single scale
        _ = encoder(image)  # BxCxHxW
    # measure encoder + decoder
    #torch.cuda.synchronize()
    time_enc = time.time() - start
    start = time.time()
    I=dataset.get_dataset_size()
    data_iter = dataset.create_tuple_iterator()
    for i in range(I):
    #for i, (image, label, mask) in enumerate(tqdm(loader, disable=c.hide_tqdm_bar)):
        # save
        image, _, _ = data_iter.__next__()
        # data
        #image = image.to(c.device)  # single scale
        activation = encoder(image)  # BxCxHxW
        # test decoder
        e_list = list()
        for l, layer in enumerate(pool_layers):
            if 'vit' in c.enc_arch:
                e = activation[l].transpose(0,2,1)[..., 1:]
                e_hw = int(np.sqrt(e.size(2)))
                e = e.reshape(-1, e.size(1), e_hw, e_hw)  # BxCxHxW
            else:
                e = activation[l]  # BxCxHxW
            #
            #B, C, H, W = e.size()
            B, C, H, W = e.shape
            S = H * W
            E = B * S
            #
            if i == 0:  # get stats
                height.append(H)
                width.append(W)
            #
            #p = positionalencoding2d(P, H, W).to(c.device).unsqueeze(0).repeat(B, 1, 1, 1)
            p = positionalencoding2d(P, H, W).expand_dims(0).repeat(B, axis=0)
            c_r = p.reshape(B, P, S).transpose(0, 2, 1).reshape(E, P)  # BHWxP
            e_r = e.reshape(B, C, S).transpose(0, 2, 1).reshape(E, C)  # BHWxC
            #
            decoder = decoders[l]
            FIB = E // N + int(E % N > 0)  # number of fiber batches
            for f in range(FIB):
                if f < (FIB - 1):
                    #idx = torch.arange(f * N, (f + 1) * N)
                    idx=mindspore.numpy.arange(f * N, (f + 1) * N)
                else:
                    #idx = torch.arange(f * N, E)
                    idx=mindspore.numpy.arange(f * N, E)
                #
                c_p = c_r[idx]  # NxP
                e_p = e_r[idx]  # NxC
                #
                '''
                if 'cflow' in c.dec_arch:
                    z, log_jac_det = decode(e_p, [c_p, ])
                else:
                    z, log_jac_det = decoder(e_p)
                '''
                
    #      
    #torch.cuda.synchronize()
    time_all = time.time() - start
    fps_enc = A / time_enc
    fps_all = A / time_all
    print('Encoder/All {:.2f}/{:.2f} fps'.format(fps_enc, fps_all))
    #
    return height, width, image_list, test_dist, gt_label_list, gt_mask_list


def train(c):
    run_date = datetime.datetime.now().strftime("%Y-%m-%d-%H:%M:%S")
    #profiler = Profiler(output_path = '/mass_store/dataset/MvtecProfile/',start_profile=False)
    L = c.pool_layers  # number of pooled layers
    print('Number of pool layers =', L)
    encoder, pool_layers, pool_dims = load_encoder_arch(c, L)
    #encoder = encoder.to(c.device).eval()
    encoder=encoder.set_train(False)
    # print(encoder)
    print("pool_dims------------------")
    print(pool_dims)
    print("pool_layers------------------")
    print(pool_layers)
    # NF decoder
    decoders = [load_decoder_arch(c, pool_dim) for pool_dim in pool_dims]
    #decoders = [load_new_decoder_arch(c, pool_dim) for pool_dim in pool_dims]
    #decoders = [decoder.to(c.device) for decoder in decoders]
    # data
    
    # pytorch2mindspore(encoder, decoders)
    # exit(0)
    
    '''
    kwargs = {'num_workers': c.workers, 'pin_memory': True} if c.use_cuda else {}
    # task data
    if c.dataset == 'mvtec':
        train_dataset = MVTecDataset(c, is_train=True)
        test_dataset = MVTecDataset(c, is_train=False)
    elif c.dataset == 'stc':
        train_dataset = StcDataset(c, is_train=True)
        test_dataset = StcDataset(c, is_train=False)
    else:
        raise NotImplementedError('{} is not supported dataset!'.format(c.dataset))
    #
    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=c.batch_size, shuffle=True, drop_last=True,
                                               **kwargs)
    test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=c.batch_size, shuffle=False, drop_last=False,
                                              **kwargs)
    '''
    N = c.n  # hyperparameter that increases batch size for the decoder model by N
    #print('train/test loader length', len(train_loader.dataset), len(test_loader.dataset))
    #print('train/test loader batches', len(train_loader), len(test_loader))
    # stats
    train_dataset = create_train_dataset(c,  repeat_num=1, batch_size=c.bs, target="Ascend")
    test_dataset = create_test_dataset(c, repeat_num=1, batch_size=c.bs, target="Ascend")
    
    params = list(decoders[0].trainable_params())
    for l in range(1, L):
        #params += list(decoders[l].parameters())
        params += list(decoders[l].trainable_params())
    # optimizer
    #optimizer = torch.optim.Adam(params, lr=c.lr)
    optimizers=[]
    learning_rate=[]
    for i in range(0,len(pool_layers)):
        #print('learning_rate layer:'+str(i))
        learning_rate=op_get_lr_list(c,c.meta_epochs,c.sub_epochs,train_dataset.get_dataset_size(),i+1,N)
        #print(learning_rate)
        optimizers.append(mindspore.nn.Adam(decoders[i].trainable_params(), learning_rate=learning_rate))
    #optimizer = mindspore.nn.Adam(decoders[0].trainable_params(), learning_rate=get_lr_list(c,c.meta_epochs,c.sub_epochs,train_dataset.get_dataset_size(),len(pool_layers),N))
    
    det_roc_obs = Score_Observer('DET_AUROC')
    seg_roc_obs = Score_Observer('SEG_AUROC')
    seg_pro_obs = Score_Observer('SEG_AUPRO')
    if c.action_type == 'norm-test':
        c.meta_epochs = 1
    #cflow_decoders=mindspore.nn.CellList()
    cflow_decoders=[]
    flow_decoders=[]
    for k in range(len(decoders)):
        cflow_decoders.append(DecoderOneStep(network=decoders[k],optimizer=optimizers[k],Cls=pool_dims[k],cflow=True))
        #flow_decoders.append(DecoderTrainOneStep(net=decoders[k],optimizer=optimizer,C=pool_dims[k],cflow=False))
    for epoch in range(c.meta_epochs):
        if c.action_type == 'norm-test' and c.train_path:
          '''
            #load_mindspore_weights(encoder, decoders, c.checkpoint_dir)
            encoderpath = ""
            decoderspathlist = []
            for file in os.listdir(c.checkpoint_dir):
                if file.startswith(c.encoder_ckpt_pre_dir):
                    encoderpath = os.path.join(c.checkpoint_dir,file)
                elif file.startswith(c.decoder_ckpt_pre_dir):
                    decoderspathlist.append(os.path.join(c.checkpoint_dir,file))
            load_weights(encoder, decoders, encoderpath, decoderspathlist)'''
        elif c.action_type == 'norm-train':
            print('Train meta epoch: {}'.format(epoch))
            train_meta_epoch(c, epoch, train_dataset, encoder, cflow_decoders, 0, pool_layers, N, 0,pool_dims)
        else:
            raise NotImplementedError('{} is not supported action type!'.format(c.action_type))

        # height, width, test_image_list, test_dist, gt_label_list, gt_mask_list = test_meta_fps(
        #    c, epoch, test_loader, encoder, decoders, pool_layers, N)
        
        test_decoders=[]
        
        for k in range(len(cflow_decoders)):
            test_decoders.append(DecoderEval(net=cflow_decoders[k].network))
        if c.action_type == 'norm-test' and c.train_path:
            #load_mindspore_weights(encoder, decoders, c.checkpoint_dir)
            encoderpath = ""
            decoderspathlist = []
            for file in os.listdir(c.train_path):
                if file.startswith(c.encoder_ckpt_pre_dir):
                    encoderpath = os.path.join(c.train_path,file)
                    print('(Test)Encoder path:', encoderpath, 'Device', device_id)
                elif file.startswith(c.decoder_ckpt_pre_dir):
                    decoderspathlist.append(os.path.join(c.train_path,file))
                    print('(Test)Decoder path:', decoderspathlist, 'Device', device_id)
            load_weights(encoder, test_decoders, encoderpath, decoderspathlist)
        
        height, width, test_image_list, test_dist, gt_label_list, gt_mask_list = test_meta_epoch(
            c, epoch, test_dataset, encoder, test_decoders, pool_layers, N,pool_dims,0)

        # PxEHW
        print('Heights/Widths', height, width)
        test_map = [list() for p in pool_layers]
        for l, p in enumerate(pool_layers):
            #test_norm = torch.tensor(test_dist[l], dtype=torch.double)  # EHWx1
            test_norm = mindspore.Tensor(test_dist[l], dtype=mindspore.float32)  # EHWx1
            #test_norm = mindspore.ops.Cast()(test_dist[l], mindspore.double)  # EHWx1
            #print(test_norm.shape)
            #print(test_norm.dtype)
            #print("---------------------------")
            #test_norm -= torch.max(test_norm)  # normalize likelihoods to (-Inf:0] by subtracting a constant
            #print(test_norm)
            test_norm -= mindspore.numpy.amax(test_norm)
            #test_prob = torch.exp(test_norm)  # convert to probs in range [0:1]
            test_prob = mindspore.numpy.exp(test_norm)
            test_mask = test_prob.reshape(-1, height[l], width[l])
            test_mask = test_prob.reshape(-1, height[l], width[l])
            # upsample
            #test_map[l] = F.interpolate(test_mask.unsqueeze(1),
            #                            size=c.crp_size, mode='bilinear', align_corners=True).squeeze().numpy()
            test_map[l]=mindspore.ops.ResizeBilinear(size=c.crp_size,align_corners=True)(test_mask.expand_dims(1)).squeeze().asnumpy()
        # score aggregation
        score_map = np.zeros_like(test_map[0])
        for l, p in enumerate(pool_layers):
            score_map += test_map[l]
        score_mask = score_map
        # invert probs to anomaly scores
        super_mask = score_mask.max() - score_mask
        # calculate detection AUROC
        score_label = np.max(super_mask, axis=(1, 2))
        gt_label = np.asarray(gt_label_list, dtype=np.bool)
        det_roc_auc = roc_auc_score(gt_label, score_label)
        _ = det_roc_obs.update(100.0 * det_roc_auc, epoch)
        # calculate segmentation AUROC
        gt_mask = np.squeeze(np.asarray(gt_mask_list, dtype=np.bool), axis=1)
        seg_roc_auc = roc_auc_score(gt_mask.flatten(), super_mask.flatten())
        save_best_seg_weights = seg_roc_obs.update(100.0 * seg_roc_auc, epoch)
        if save_best_seg_weights and c.action_type != 'norm-test':
            #save_mindspore_weights(encoder, decoders,c.class_name, c.model, run_date,epoch)  # avoid unnecessary saves
            save_weights(encoder, decoders, c.model, run_date, os.path.join(os.path.join(c.save_checkpoint_dir,c.class_name),run_date), epoch)
            print("finish save weight "+ str(epoch))
        # calculate segmentation AUPRO
        # from https://github.com/YoungGod/DFR:
        if c.pro and (epoch % 4 == 0):  # and (epoch % 4 == 0):  # AUPRO is expensive to compute
            print("pro" +str(epoch))
            max_step = 1000
            expect_fpr = 0.3  # default 30%
            max_th = super_mask.max()
            min_th = super_mask.min()
            delta = (max_th - min_th) / max_step
            ious_mean = []
            ious_std = []
            pros_mean = []
            pros_std = []
            threds = []
            fprs = []
            binary_score_maps = np.zeros_like(super_mask, dtype=np.bool)
            for step in range(max_step):
                thred = max_th - step * delta
                # segmentation
                binary_score_maps[super_mask <= thred] = 0
                binary_score_maps[super_mask > thred] = 1
                pro = []  # per region overlap
                iou = []  # per image iou
                # pro: find each connected gt region, compute the overlapped pixels between the gt region and predicted region
                # iou: for each image, compute the ratio, i.e. intersection/union between the gt and predicted binary map
                for i in range(len(binary_score_maps)):  # for i th image
                    # pro (per region level)
                    label_map = label(gt_mask[i], connectivity=2)
                    props = regionprops(label_map)
                    for prop in props:
                        x_min, y_min, x_max, y_max = prop.bbox  # find the bounding box of an anomaly region
                        cropped_pred_label = binary_score_maps[i][x_min:x_max, y_min:y_max]
                        # cropped_mask = gt_mask[i][x_min:x_max, y_min:y_max]   # bug!
                        cropped_mask = prop.filled_image  # corrected!
                        intersection = np.logical_and(cropped_pred_label, cropped_mask).astype(np.float32).sum()
                        pro.append(intersection / prop.area)
                    # iou (per image level)
                    intersection = np.logical_and(binary_score_maps[i], gt_mask[i]).astype(np.float32).sum()
                    union = np.logical_or(binary_score_maps[i], gt_mask[i]).astype(np.float32).sum()
                    if gt_mask[i].any() > 0:  # when the gt have no anomaly pixels, skip it
                        iou.append(intersection / union)
                # against steps and average metrics on the testing data
                ious_mean.append(np.array(iou).mean())
                # print("per image mean iou:", np.array(iou).mean())
                ious_std.append(np.array(iou).std())
                pros_mean.append(np.array(pro).mean())
                pros_std.append(np.array(pro).std())
                # fpr for pro-auc
                gt_masks_neg = ~gt_mask
                fpr = np.logical_and(gt_masks_neg, binary_score_maps).sum() / gt_masks_neg.sum()
                fprs.append(fpr)
                threds.append(thred)
            # as array
            threds = np.array(threds)
            pros_mean = np.array(pros_mean)
            pros_std = np.array(pros_std)
            fprs = np.array(fprs)
            ious_mean = np.array(ious_mean)
            ious_std = np.array(ious_std)
            # best per image iou
            best_miou = ious_mean.max()
            # print(f"Best IOU: {best_miou:.4f}")
            # default 30% fpr vs pro, pro_auc
            idx = fprs <= expect_fpr  # find the indexs of fprs that is less than expect_fpr (default 0.3)
            fprs_selected = fprs[idx]
            fprs_selected = rescale(fprs_selected)  # rescale fpr [0,0.3] -> [0, 1]
            pros_mean_selected = pros_mean[idx]
            seg_pro_auc = auc(fprs_selected, pros_mean_selected)
            _ = seg_pro_obs.update(100.0 * seg_pro_auc, epoch)
    #
    print("begin save result")
    save_results(det_roc_obs, seg_roc_obs, seg_pro_obs, c.model, c.class_name, run_date)
    print("finish save result")
    # export visualuzations
    if c.viz:
        precision, recall, thresholds = precision_recall_curve(gt_label, score_label)
        a = 2 * precision * recall
        b = precision + recall
        f1 = np.divide(a, b, out=np.zeros_like(a), where=b != 0)
        det_threshold = thresholds[np.argmax(f1)]
        print('Optimal DET Threshold: {:.2f}'.format(det_threshold))
        precision, recall, thresholds = precision_recall_curve(gt_mask.flatten(), super_mask.flatten())
        a = 2 * precision * recall
        b = precision + recall
        f1 = np.divide(a, b, out=np.zeros_like(a), where=b != 0)
        seg_threshold = thresholds[np.argmax(f1)]
        print('Optimal SEG Threshold: {:.2f}'.format(seg_threshold))
        export_groundtruth(c, test_image_list, gt_mask)
        export_scores(c, test_image_list, super_mask, seg_threshold)
        export_test_images(c, test_image_list, gt_mask, super_mask, seg_threshold)
        export_hist(c, gt_mask, super_mask, seg_threshold)