BLOOM 176B 部署手册
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
本文档介绍如何在 MOFFETT AI加速卡上利用 SOLA 部署 BLOOM 176B 模型。
BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) 是在46种自然语言和13种编程语言上训练的1760亿参数语言模型,论文地址:https://arxiv.org/pdf/2211.05100.pdf。
num_layers: 24
num_heads: 112
hidden_size: 14336
vocab_size: 46152
batch_size: 1
token_num: 1
max_seq_len: 256
word embedding
alibi position embedding
gather_H_index
scatter_Gcb_index
scatter_W_index
至少 24 个 MOFFETT Antoum 芯片
支持 avx512f 的 CPU
部署模型分为四个步骤:下载、编译、运行、验证,每个步骤都提供了对应的默认脚本。
下载:prepare.sh
编译:build.sh
运行:run.sh
验证:verify.sh
你也可以参考以下步骤手动部署模型。
下载模型依赖
可以执行以下脚本下载模型依赖:
若脚本执行失败,也可以通过以下链接手动下载并解压:
编译部署代码
运行
可以执行以下脚本运行自动问答:
也可以手动运行,程序接受两个参数,第一个参数为模型路径,第二个参数为模式,模式是可选的:
可选模式有:
无参数时:问答模式
inf_mode
:无限问答模式
自动问答数据集(.txt
文件):自动问答模式
PPL测试数据集(.bin
文件):PPL验证模式
自动问答验证结果
测试环境:
2x Intel(R) Xeon(R) Platinum 8380 CPU @ 2.30GHz
16x 64GiB DDR4 3200 MHz
24x MOFFETT Antoum 芯片
38 tokens/s
26 ms/token