tjulitianyi
/
CycleGAN_MindSpore

 
			
							//
// Generated by NVIDIA NVVM Compiler
//
// Compiler Build ID: CL-26907403
// Cuda compilation tools, release 10.1, V10.1.243
// Based on LLVM 3.4svn
//

.version 6.4
.target sm_60
.address_size 64

	// .globl	Fused_Mul_Maximum_fusion_15384425620033139247_kernel0

.visible .entry Fused_Mul_Maximum_fusion_15384425620033139247_kernel0(
	.param .u64 Fused_Mul_Maximum_fusion_15384425620033139247_kernel0_param_0,
	.param .u64 Fused_Mul_Maximum_fusion_15384425620033139247_kernel0_param_1
)
{
	.reg .f32 	%f<33>;
	.reg .b32 	%r<6>;
	.reg .b64 	%rd<8>;


	ld.param.u64 	%rd1, [Fused_Mul_Maximum_fusion_15384425620033139247_kernel0_param_0];
	ld.param.u64 	%rd2, [Fused_Mul_Maximum_fusion_15384425620033139247_kernel0_param_1];
	cvta.to.global.u64 	%rd3, %rd2;
	cvta.to.global.u64 	%rd4, %rd1;
	mov.u32 	%r1, %ctaid.x;
	shl.b32 	%r2, %r1, 12;
	mov.u32 	%r3, %tid.x;
	shl.b32 	%r4, %r3, 2;
	add.s32 	%r5, %r2, %r4;
	mul.wide.s32 	%rd5, %r5, 4;
	add.s64 	%rd6, %rd4, %rd5;
	ld.global.nc.v4.f32 	{%f1, %f2, %f3, %f4}, [%rd6];
	mul.f32 	%f9, %f1, 0f3E4CCCCD;
	mul.f32 	%f10, %f2, 0f3E4CCCCD;
	mul.f32 	%f11, %f3, 0f3E4CCCCD;
	mul.f32 	%f12, %f4, 0f3E4CCCCD;
	add.s64 	%rd7, %rd3, %rd5;
	max.f32 	%f13, %f12, %f4;
	max.f32 	%f14, %f11, %f3;
	max.f32 	%f15, %f10, %f2;
	max.f32 	%f16, %f9, %f1;
	st.global.v4.f32 	[%rd7], {%f16, %f15, %f14, %f13};
	ld.global.nc.v4.f32 	{%f17, %f18, %f19, %f20}, [%rd6+8192];
	mul.f32 	%f25, %f17, 0f3E4CCCCD;
	mul.f32 	%f26, %f18, 0f3E4CCCCD;
	mul.f32 	%f27, %f19, 0f3E4CCCCD;
	mul.f32 	%f28, %f20, 0f3E4CCCCD;
	max.f32 	%f29, %f28, %f20;
	max.f32 	%f30, %f27, %f19;
	max.f32 	%f31, %f26, %f18;
	max.f32 	%f32, %f25, %f17;
	st.global.v4.f32 	[%rd7+8192], {%f32, %f31, %f30, %f29};
	ret;
}