仅显示平台推荐
GoEmotions
${starItems[0]}

情感类别包括钦佩、娱乐、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、不赞成、厌恶、尴尬、兴奋、恐惧、感激、悲伤、喜悦、爱、紧张、乐观、骄傲、实现、解脱、悔恨、悲伤、惊

2020-11-18 0 7
DBPediaAmazonYelpYahooSogouAG
${starItems[1]}

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

2021-01-04 5 8
SNLI
${starItems[2]}

SNLI语料库(1.0版)是一组570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,带有包含,矛盾和中立的标签,支持NLI(RTE)。https://nlp.stanford.edu/projects/snli/

2020-11-09 0 0
CNNandDailyMailSummarization
${starItems[3]}

使用新闻文章进行问答研究的两个数据集。 每个数据集包含许多文档(每个90k和197k),每个文档平均约有4个问题。 https://cs.nyu.edu/~kcho/DMQA/

2020-12-07 0 3
BillionWords
${starItems[4]}

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

2020-11-09 0 4
LargeMovieReviewDataset
${starItems[5]}

用于二进制情感分类的数据集,提供了25,000张极地电影评论供培训,25,000张用于测试也有其他未标记的数据可供使用。 http://ai.stanford.edu/~amaas/data/sentiment/

2020-11-02 0 2
StanfordSentimentTreebank
${starItems[6]}

用于情感分析的数据集,其中包含11855个句子的语法分析树中215154个短语的细粒度情感标签,并为情感组成提出了新挑战。https://nlp.stanford.edu/sentiment/code.html

2020-11-09 113 2
AVID
${starItems[7]}

AViD数据集:来自不同国家的匿名视频,AViD是一个大型视频数据集,包含467k个视频和887个动作类。所收集的视频具有知识共享许可证。 https://github.com/piergiaj/AViD

2020-10-27 1 4
DynaQuestions
${starItems[8]}

构建了面向军事领域的动态知识图谱 DynaBase,并发布了KBQA 数据集 DynaQuestions。DynaQuestions 包含了2829 条问答对, 其中针对动态知识的问题600条,每个问答对标注了问题类型、Cypher 语句以及答案,能够从新的复杂维度对问答系统的表现进行评价。DynaQuestions 中的问题类型更加多样,其中静态类型的问题能够评测传统问答模型。

2021-05-25 0 42
icdm2022
${starItems[9]}

icdm2022预测风险

2022-07-12 128 4
redata
${starItems[10]}

redata

2022-06-06 36 0
nothing
${starItems[11]}

nothing but for test

2022-09-14 26 1
icdm2022_pyg_data
${starItems[12]}

pyg的预处理数据集

2022-07-27 20 9
pyg_session1
${starItems[13]}

session1

2022-07-25 63 2
MAVEN-ACE2005
${starItems[14]}

公开的MAVEN数据集和私有的ACE2005数据集

2022-08-22 25 0
atd_data
${starItems[15]}

atd_data

2022-08-13 0 0
auto-Exploit
${starItems[16]}

自动化渗透测试数据集

2022-08-12 0 0
2022-08-11 0 0
icdm2022_session1
${starItems[18]}

session1初赛

2022-08-11 0 1
pretrain_model
${starItems[19]}

预训练模型文件

2022-07-20 116 6
Title
${starItems[20]}

学习强国

2022-07-06 0 2
news_softcup
${starItems[21]}

时政新闻

2022-07-01 28 1
盘古α
${starItems[22]}

2021-04-22 0 2277
documents_11-22
${starItems[23]}

support to learn AI

2022-05-29 0 5
KG_Datasets
${starItems[24]}

FB15K, FB15K-237, WN18, WN18RR, others

2022-05-22 5 1
SoftMask
${starItems[25]}

纠错训练

2022-09-27 2 1
IR_2021_Project
${starItems[26]}

IR数据集

2022-09-24 9 0
Seminar
${starItems[27]}

每次分享的PPT及相关资料

2022-07-25 0 2
PsyQA
${starItems[28]}

Chinese Mental Consultant Dataset

2022-09-19 0 0
win-system
${starItems[29]}

win-system

2022-09-20 0 3