You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.
kimxiaogen c45b2db8c3 【fix】增加启智平台代码 1 year ago
data 【data】enwik8数据集上传 2 years ago
script 【merge】同步GPU版本代码改动内容,并增加Ascend部分代码 2 years ago
src 【fix】增加启智平台代码 1 year ago
.gitignore 【fix】增加启智平台代码 1 year ago
README.md 【merge】同步GPU版本代码改动内容,并增加Ascend部分代码 2 years ago
README_CN.md 【merge】同步GPU版本代码改动内容,并增加Ascend部分代码 2 years ago
enwik8_base.yaml 【fix】删除多余代码,调通代码 1 year ago
eval.py 【fix】删除多余代码,调通代码 1 year ago
getdata.sh 【merge】同步GPU版本代码改动内容,并增加Ascend部分代码 2 years ago
hccl.sh 【fix】优化matmul算子,修复log计算时间问题 2 years ago
hccl_tools.py 【init】初始化Transformer-xl 2 years ago
lr_of_40w_steps.npy 【fix】针对ascend平台修改版 2 years ago
rank_table_8pcs.json 【done】同步代码 2 years ago
requirements.txt 【init】初始化Transformer-xl 2 years ago
static_lr.py 【fix】删除多余代码,调通代码 1 year ago
train.py 【fix】删除多余代码,调通代码 1 year ago

Transformer-XL是对Transformer的改进,主要是解决长序列的问题。

Text

Contributors (2)