参考文档
4.昇腾社区论坛
5.昇腾 910B 多机环境 Qwen3-235B-A22B.pdf
附件:
1.NPU_Dependency_packages.tar(ubuntu系统deb包 与 Euler系统 rpm包)
gcc g++ make cmake unzip zlib1g-dev libffi-dev libssl-dev pciutils net-tools libsqlite3-dev liblapack-dev gfortran python3-dev python3-pip
系统及版本信息
基本命令
npu-smi info
chmod 750 rank-table-file.json
source /set_env.sh
docker exec -it mindie bash一、服务器初始化,制作Raid1系统
设置“SupportSPCR”的值为“Disabled”
步骤 1 进入BIOS界面
步骤 2 通过“←”、“→”方向键切换至“Advanced”界面
步骤 3 通过“↑”、“↓”方向键选择“MISCConfig”,按“Enter”。
进入“MISCConfig”界面
步骤 4 通过“↑”、“↓”方向键选择“SupportSPCR”,按“Enter”。
步骤 5 设置“SupportSPCR”的值为“Disabled”。
步骤 6 设置完成后,按“F10”
骤 7 选择“Yes”并按“Enter”保存设置。分配逻辑卷
#1.列出所有块设备
[root@host ~]# lsblk
#2.查看磁盘大小
[root@host ~]# df -TH
#3.天假硬盘并分区更改为lvm格式
[root@host ~]# parted /dev/vdb
GNU Parted 3.1
使用 /dev/vdb
Welcome to GNU Parted! Type 'help' to view a list of commands.
(parted) mklabel gpt
创建一个新的分区表
(parted) mkpart primary 0% 100%
创建一个新的分区
(parted) align-check optimal 1
1 aligned
(parted) print
Model: Virtio Block Device (virtblk)
Disk /dev/vdb: 3221GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt
Disk Flags:
Number Start End
(parted) quit
信息: You may need to update /etc/fstab.
# 4.列出所有块设备
[root@host ~]# lsblk
#5.新增硬盘初始化为物理卷
[root@host ~]# pvcreate /dev/vdb1
WARNING: ext4 signature detected on /dev/vdb1 at offset 1080. Wipe it? [y/n]: y
Wiping ext4 signature on /dev/vdb1.
Physical volume "/dev/vdb1" successfully created.
#6.新增卷组并将新物理卷加入卷组
[root@host ~]# vgcreate vgdata /dev/vdb1
Volume group "vgdata" successfully created
[root@host-10-128-4-96 ~]# vgs
#7.新增一个占全部卷组大小的lv,并指定名字为lv_data
[root@host ~]# lvcreate -l 100%FREE -n lv_data vgdata
Logical volume "lv_data" created.
[root@host-10-128-4-96 ~]# lvs
#8.列出所有块设备
[root@host ~]# df -Th
#9.格式化逻辑卷
[root@host ~]# mkfs.ext4 /dev/mapper/vgdata-lv_data
Allocating group tables: 完成
正在写入inode表: 完成
Creating journal (32768 blocks): 完成
#10.挂载
[root@host ~]# mkdir /data
[root@host ~]# vi /etc/fstab
/dev/mapper/vgdata-lv_data /data ext4 defaults 0 0
#可以使用uuid挂载
[root@host ~]# mount -a
[root@host ~]# mount -l
#11.查看磁盘大小
[root@host ~]# df -Th二、昇腾NPU驱动及MindIE部署
驱动及固件安装
groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
chmod +x Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run
chmod +x Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run
chmod +x Ascend-hdk-<chip_type>-npu-firmware_<version>.run
chmod +x Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run
#安装驱动和固件,软件包默认安装路径为“/usr/local/Ascend”。
#a 执行如下命令安装驱动。
./Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run --full --install-for-all
#执行安装命令时,会自动执行--check参数,校验软件包的一致性和完整性,出现如下回显信息,表示软件包校验成功。
Verifying archive integrity... 100% SHA256 checksums are OK. All good.
#b 执行如下命令安装固件。
./Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run --full
#若系统出现如下关键回显信息,表示固件安装成功。
Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect
#查看npu信息
npu-smi info
#若返回驱动相关信息说明加载成功。安装docker
【docker安装】
启动MindIE容器
a.上传mindie_xxx.tar包(或 push)
b.启动MindIE
docker run -it -d --net=host --shm-size=500g \--privileged \--name qwen3-235b \--device=/dev/davinci_manager \--device=/dev/hisi_hdc \--device=/dev/devmm_svm \-v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \-v /usr/local/sbin:/usr/local/sbin:ro \-v /path-to-weights:/path-to-weights:ro \-v /data/qwen3:/model \
qwen3-235B bash三、测试url
curl -X POST 183.1.1.77:607/v1/chat/completions \-d '{
"messages": [
{"role": "system", "content": "你是一个哲学家,请从哲学的角度回答问题"},
{"role": "user", "content": "人是活了365天,还是一天活了365遍"}
],
"max_tokens": 4096,
"stream": false,
"do_sample": true,
"temperature": 0.6,
"top_p": 0.95,
"top_k": 20,
"model": "Qwen3-235B-A22b"
}'