Repositories

使用100G中文高质量语料,128张V100,训练的中文Megatron模型,参数量2.6B

Updated 1 week ago

使用100G中文高质量语料,128张V100,训练的中文Megatron模型,参数量2.6B

Updated 1 week ago

中文文本分类,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer, 基于pytorch,开箱即用。

Updated 1 year ago

中文长下文词语预测(Chinese WPLC)数据集

Updated 1 week ago

中文长下文词语预测(Chinese WPLC)数据集

Updated 1 week ago

chuxing

Updated 1 month ago

CIFAR-10数据集包含10个类别的60000个32x32彩色图像,每个类别6000个图像。 有50000张训练图像和10000张测试图像。http://www.cs.toronto.edu/~kriz/cifar.html?usg=alkjrhjqbhw2llxlo8emqns-tbk0at96jq

Updated 4 months ago

Updated 4 months ago

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

Updated 4 months ago

大型数据集,其中包含来自50个不同城市的街道场景中记录的各种立体声视频序列集,此外,还有较大的20000个弱注释帧集以及5000个帧的高质量像素级注释。 https://www.cityscapes-dataset.com/

Updated 4 months ago

ClarQ:一个用于生成澄清问题的大规模、多样的数据集

Updated 4 months ago

Updated 1 month ago

数据集包括图片和问题,以及对应回答问题标准的 Program https://cs.stanford.edu/people/jcjohns/clevr/

Updated 4 months ago

使用新闻文章进行问答研究的两个数据集。 每个数据集包含许多文档(每个90k和197k),每个文档平均约有4个问题。 https://cs.nyu.edu/~kcho/DMQA/

Updated 4 months ago

Updated 4 months ago

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

Updated 4 months ago

用于text2image任务的text相关数据

Updated 4 months ago

基于mscoc的大规模场景文本数据集。COCO Text V2.0包含63686个图像和239506个带注释的文本实例。分段掩码为每个单词添加了注释,允许精细的级别检测。 https://bgshih.github.io/cocotext/

Updated 4 months ago

Updated 4 months ago