Repositories

2000亿开源中文预训练语言模型「鹏程·盘古α」

Updated 1 day ago

本项目是群体化方法与技术的开源实现案例,在基于Gitea的基础上,进一步支持社交化的协同开发、协同学习、协同研究等群体创新实践服务,特别是针对新一代人工智能技术特点,重点支持项目管理、git代码管理、大数据集存储管理与智能计算平台接入。

Updated 2 days ago

启智章鱼项目(OPENI-OCTOPUS)是一个集群管理和资源调度系统,支持在GPU集群中运行AI任务作业(比如深度学习任务作业)。平台提供了一系列接口,能够支持主流的深度学习框架。

Updated 4 weeks ago

Updated 5 days ago

Updated 1 week ago

使用100G中文高质量语料,128张V100,训练的中文Megatron模型,参数量2.6B

Updated 5 days ago

基于BERT的对话通用理解模型 (DGU: Dialogue General Understanding), 可支持以下任务:udc、atis_intent、mrda、swda

Updated 1 month ago

中文长下文词语预测(Chinese WPLC)数据集

Updated 5 days ago

多任务学习框架

Updated 1 month ago

ELMo MindSpore version

Updated 1 month ago

天元(MegEngine)是旷视自主研发的开源深度学习框架,于2020年3月正式在 OpenI 启智社区开源,天元能够帮助开发者高效的完成深度学习算法的设计、训练、部署,有效提升AI研发工作效率。

Updated 2 weeks ago

将盘古α-13B/2.6B由8卡压缩到1卡上推理。

Updated 5 days ago

Updated 1 month ago

Updated 3 months ago

Updated 2 months ago

Updated 2 weeks ago

EBSNN datasets, 20-class websites identification task

Updated 3 months ago

navigations

Updated 3 months ago

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

Updated 4 months ago