Mack189
/
svoice-main

 
			
							# import mindspore.nn as nn
# import mindspore.ops as ops
# import mindspore
# from mindspore import save_checkpoint
# import time
# import os

# class TrainOneStep(nn.TrainOneStepCell):
#     def __init__(self, network, optimizer, sens=1.0):
#         super(TrainOneStep, self).__init__(network, optimizer, sens)
#         self.network = network
#         # self._loss = loss_fn


#     def construct(self, padded_mixture, mixture_lengths, padded_source):
#     # def construct(self, epoch, data_loader, cross_valid=False):

#         # data_loader = data['tr_loader'] if not cross_valid else self.cv_loader
#         # step = data_loader.get_dataset_size()

#         # print("1111111111111111111111111111111111111")

#         loss = self.network(padded_mixture, mixture_lengths, padded_source)

#         # mixture_lengths = mixture_lengths.astype(mindspore.int32)
#         # padded_mixture = padded_mixture.astype(mindspore.float32)
#         # padded_source = padded_source.astype(mindspore.float32)
#         # estimate_source = self.network(padded_mixture)
#         # estimate_source = estimate_source.astype(mindspore.float32)
#         # loss = 0
#         # cnt = len(estimate_source)
#         # for c_idx, est_src in enumerate(estimate_source):
#         #     coeff = (c_idx+1)*(1.0/cnt)
#         #     sisnr_loss, snr, est_src, _ = self._loss(padded_source, est_src, mixture_lengths)
#         #     loss += (coeff * sisnr_loss)
#         # loss /= 6


#         sens = ops.Fill()(ops.DType()(loss), ops.Shape()(loss), self.sens)
#         # print("aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa")
#         grads = self.grad(self.network, self.weights)(padded_mixture, mixture_lengths, padded_source, sens)
#         # print("bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb")
#         grads = self.grad_reducer(grads)
#         # print("ccccccccccccccccccccccccccccccccccccccccc")
#         loss = ops.depend(loss, self.optimizer(grads))
#         # total_loss /= j
#         return loss


import mindspore.nn as nn
import mindspore.ops as ops
import mindspore
from mindspore import save_checkpoint
import time
import os
from mindspore import context
from mindspore.communication.management import get_group_size
from mindspore.context import ParallelMode
from mindspore.ops import composite as C
from mindspore.ops import operations as P
from mindspore.parallel._auto_parallel_context import auto_parallel_context

class TrainOneStep(nn.TrainOneStepCell):
    def __init__(self, network, optimizer, sens=1.0, use_global_norm=True, clip_global_norm_value=5.0):
        super(TrainOneStep, self).__init__(network, optimizer, sens)
        self.network = network
        # self._loss = loss_fn
        self.network.set_grad()
        self.weights = optimizer.parameters
        self.optimizer = optimizer
        self.grad = C.GradOperation(get_by_list=True, sens_param=True)
        self.sens = float(sens)
        self.reducer_flag = False
        self.grad_reducer = None
        self.use_global_norm = use_global_norm
        self.clip_global_norm_value = clip_global_norm_value
        self.parallel_mode = context.get_auto_parallel_context("parallel_mode")
        if self.parallel_mode in [ParallelMode.DATA_PARALLEL, ParallelMode.HYBRID_PARALLEL]:
            self.reducer_flag = True
        if self.reducer_flag:
            mean = context.get_auto_parallel_context("gradients_mean")
            if auto_parallel_context().get_device_num_is_set():
                degree = context.get_auto_parallel_context("device_num")
            else:
                degree = get_group_size()
            self.grad_reducer = nn.DistributedGradReducer(optimizer.parameters, mean, degree)


    def construct(self, padded_mixture, mixture_lengths, padded_source):
        loss = self.network(padded_mixture, mixture_lengths, padded_source)
        sens = P.Fill()(loss.dtype, loss.shape, self.sens)
        # print("aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa")
        grads = self.grad(self.network, self.weights)(padded_mixture, mixture_lengths, padded_source, sens)
        # print("bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb")
        # grads = self.grad_reducer(grads)
        if self.reducer_flag:
            grads = self.grad_reducer(grads)
        if self.use_global_norm:
            grads = C.clip_by_global_norm(grads, clip_norm=self.clip_global_norm_value)
        # print("ccccccccccccccccccccccccccccccccccccccccc")
        loss = ops.depend(loss, self.optimizer(grads))
        # total_loss /= j
        return loss