关于GCU、沐曦GPGPU、MLU、0卡V100资源4月7日恢复上架的公告>>> 关于共建具身智能开源数据集的倡议>>> 关于云脑任务中统一路径访问方式的公告>>> 关于将启智集群GPU资源迁移至智算集群的公告>>>

Megatron 中文预训练模型

本模型使用Megatron代码训练，使用了清源公布的3万字词表，数据使用100G高质量中文语料

模型参数2.6B，模型采用GPT结构，使用了数据并行和张量并行并行方式，模型文件可以在数据集中下载。

模型的训练和推理与英伟达的Megatron代码一致，使用说明请参考NVIDIA-Megatron: https://github.com/NVIDIA/Megatron-LM

使用100G中文高质量语料，128张V100，训练的中文Megatron模型，参数量2.6B

Python C++ Shell Cuda TeX other

491377729@qq.com