200字
昇腾910B4
2025-10-21
2025-11-10
AI

参考文档

1.NPU驱动安装步骤

2.gpu训练脚本迁移到NPU

3.对应版本pytorch插件安装

4.昇腾社区论坛

5.昇腾 910B 多机环境 Qwen3-235B-A22B.pdf

6.MindSpeed-LLM: 昇腾LLM分布式训练框架

附件:

1.NPU_Dependency_packages.tar(ubuntu系统deb包 与 Euler系统 rpm包)

gcc g++ make cmake unzip zlib1g-dev libffi-dev libssl-dev pciutils net-tools libsqlite3-dev liblapack-dev gfortran python3-dev python3-pip

系统及版本信息

名称

版本信息

操作系统

ubuntu-22.04.5-live-server-arm64.iso

NPU驱动

Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run

NPU固件

Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run

MindIE镜像

mindie-2.1.RC1-800I-A2-py311-openeuler24.03-lts.tar.gz

Docker版本

docker-24.0.9.tgz

基本命令

npu-smi info
 chmod 750 rank-table-file.json
 source /set_env.sh
 docker exec -it mindie bash

一、服务器初始化,制作Raid1系统

设置“SupportSPCR”的值为“Disabled”

步骤 1 进入BIOS界面
步骤 2 通过“←”、“→”方向键切换至“Advanced”界面
步骤 3 通过“↑”、“↓”方向键选择“MISCConfig”,按“Enter”。
进入“MISCConfig”界面
步骤 4 通过“↑”、“↓”方向键选择“SupportSPCR”,按“Enter”。
步骤 5 设置“SupportSPCR”的值为“Disabled”。
步骤 6 设置完成后,按“F10”
骤 7 选择“Yes”并按“Enter”保存设置。

分配逻辑卷

#1.列出所有块设备
[root@host ~]# lsblk
#2.查看磁盘大小
[root@host ~]# df -TH
#3.天假硬盘并分区更改为lvm格式
[root@host ~]# parted /dev/vdb
 GNU Parted 3.1
使用 /dev/vdb
 Welcome to GNU Parted! Type 'help' to view a list of commands.
 (parted) mklabel gpt               
创建一个新的分区表
(parted) mkpart primary 0% 100%    
创建一个新的分区
(parted) align-check optimal 1
 1 aligned
 (parted) print
 Model: Virtio Block Device (virtblk)
 Disk /dev/vdb: 3221GB
 Sector size (logical/physical): 512B/512B
 Partition Table: gpt
 Disk Flags:
 Number  Start   End     
  
(parted) quit
信息: You may need to update /etc/fstab.
# 4.列出所有块设备
[root@host ~]# lsblk

#5.新增硬盘初始化为物理卷
[root@host ~]# pvcreate /dev/vdb1
 WARNING: ext4 signature detected on /dev/vdb1 at offset 1080. Wipe it? [y/n]: y
 Wiping ext4 signature on /dev/vdb1.
 Physical volume "/dev/vdb1" successfully created.

#6.新增卷组并将新物理卷加入卷组
[root@host ~]# vgcreate vgdata /dev/vdb1
 Volume group "vgdata" successfully created
[root@host-10-128-4-96 ~]# vgs

#7.新增一个占全部卷组大小的lv,并指定名字为lv_data
[root@host ~]# lvcreate -l 100%FREE -n lv_data vgdata
 Logical volume "lv_data" created.
[root@host-10-128-4-96 ~]# lvs
#8.列出所有块设备
[root@host ~]# df -Th
#9.格式化逻辑卷
[root@host ~]# mkfs.ext4 /dev/mapper/vgdata-lv_data
 Allocating group tables: 完成                            
正在写入inode表: 完成                            
Creating journal (32768 blocks): 完成

#10.挂载
[root@host ~]# mkdir /data
[root@host ~]# vi /etc/fstab
 /dev/mapper/vgdata-lv_data /data                ext4    defaults        0 0
#可以使用uuid挂载
 [root@host ~]# mount -a
 [root@host ~]# mount -l
#11.查看磁盘大小
[root@host ~]# df -Th

二、昇腾NPU驱动及MindIE部署

驱动及固件安装

groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash


chmod +x Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run
chmod +x Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run
chmod +x Ascend-hdk-<chip_type>-npu-firmware_<version>.run
chmod +x Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run

#安装驱动和固件,软件包默认安装路径为“/usr/local/Ascend”。
#a 执行如下命令安装驱动。
./Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run --full --install-for-all
#执行安装命令时,会自动执行--check参数,校验软件包的一致性和完整性,出现如下回显信息,表示软件包校验成功。

Verifying archive integrity...  100%   SHA256 checksums are OK. All good.


#b 执行如下命令安装固件。
./Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run --full
#若系统出现如下关键回显信息,表示固件安装成功。

Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect

#查看npu信息
npu-smi info
#若返回驱动相关信息说明加载成功。

安装docker

【docker安装】

启动MindIE容器

方式三:容器部署方式

a.上传mindie_xxx.tar包(或 push)

b.启动MindIE

docker run -it -d --net=host --shm-size=500g \--privileged \--name qwen3-235b \--device=/dev/davinci_manager \--device=/dev/hisi_hdc \--device=/dev/devmm_svm \-v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \-v /usr/local/sbin:/usr/local/sbin:ro \-v /path-to-weights:/path-to-weights:ro \-v /data/qwen3:/model \
 qwen3-235B bash

三、测试url

curl -X POST 183.1.1.77:607/v1/chat/completions \-d '{
 "messages": [
 {"role": "system", "content": "你是一个哲学家,请从哲学的角度回答问题"},
 {"role": "user", "content": "人是活了365天,还是一天活了365遍"}
 ],
"max_tokens": 4096,
 "stream": false,
 "do_sample": true,
 "temperature": 0.6,
 "top_p": 0.95,
 "top_k": 20,
 "model": "Qwen3-235B-A22b"
 }'

昇腾910B4
作者
roche
发表于
2025-10-21
License
CC BY-NC-SA 4.0