当前位置: 首页 > web >正文

OpenHarmony-Risc-V上运行openBLAS中的benchmark

OpenHarmony-Risc-V上运行openBLAS中的benchmark


文章目录

  • OpenHarmony-Risc-V上运行openBLAS中的benchmark
  • 前言
  • 一、编译openBLAS
    • 1.源码下载
    • 2.工具链下载
    • 3.编译并安装openBLAS
  • 二、编译open BLAS中的benchmark
  • 三、上设备运行
  • 总结


前言

参考https://zhuanlan.zhihu.com/p/18825495043实现了在Risc-V架构设备上的OpenHarmony-5.0.0环境中运行openBlas的benchmark。


一、编译openBLAS

1.源码下载

自行扶墙或者使用github下载站。使用默认的develop分支。

git clone https://github.com/OpenMathLib/OpenBLAS.git

2.工具链下载

Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1

  • 获取玄铁支持rvv1.0的gcc工具链。
    参考原文中有一处描述错误,由于当时没仔细看,下载的是V2.10.2版本,该版本仅支持RISC-V Vector extension 0.7.1,导致编译OpenBLAS的x280时会有以下报错:
    在这里插入图片描述
    使用2.10.2版本编译open BLAS的C910V正常。
  • 解压后配置环境变量(以下命令根据自己环境对应的目录进行修改)

export PATH=/opt/liusai/github/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1/bin:$PATH

3.编译并安装openBLAS

  • 编译

cd OpenBLAS
make HOSTCC=gcc TARGET=x280 CC=riscv64-unknown-linux-gnu-gcc FC=riscv64-unknown-linux-gnu-gfortran

正常编译成功结算画面如下:
在这里插入图片描述
如产生编译错误,纠正后重新编译请使用“make clean”。

  • 安装

mkdir build
make PREFIX=./build install

产物如下:
在这里插入图片描述

二、编译open BLAS中的benchmark

以benchmark中的gemm.c为例

cd benchmark
…/…/…/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1/bin/riscv64-unknown-linux-gnu-gcc gemm.c -o gemm_test_3.0.1 -I …/ -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall
…/…/…/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V2.10.2/bin/riscv64-unknown-linux-gnu-gcc -o gemm_test_2.10.2 -I …/build/include -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall
/opt/liusai/musepaper-5.0.0/prebuilts/gcc/linux-x86/riscv64/spacemit-riscv-gcc/bin/riscv64-unknown-linux-gnu-gcc gemm.c -o gemm_test_spacemit -I …/ -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall

使用了三种工具链,编译出不同的gemm_test,可以在运行过程中进行比较。

三、上设备运行

使用的是进迭时空的musepaper,提前烧录OH-5.0.0版本。

  • 通过HDC将需要的文件拷至设备的/lib目录

hdc target mount
hdc file send .\openblas\spacemit\libpthread.so.0 /lib/
hdc file send .\openblas\ld-linux-riscv64-lp64d.so.1 /lib/
hdc file send .\openblas\gemm_test_3.0.1 /lib/
hdc file send .\openblas\libopenblas.so.0 /lib/
hdc file send .\openblas\libc.so.6 /lib/

注意:运行不同工具链编译的产物时,链接器ld-linux-riscv64-lp64d.so.1、libpthread.so.0、libc.so.6不可混用,否则会报错不可运行。这些均可以在工具链的安装目录中找到。

  • 配置环境变量

export LD_LIBRARY_PATH=/lib:$LD_LIBRARY_PATH

  • 运行

直接./gemm_test_3.0.1即可。

运行gemm_test_spacemit时有“./gemm_test_spacemit: /lib/libc.so.6: version ‘GLIBC_2.34’ not found (required by ./gemm_test_spacemit)”报错,请将对应工具链的libc.so.6拷贝至/lib下。
运行效果如下:
在这里插入图片描述


总结

  • 后续就是llama.cpp通过openBLAS提升运行效率。
  • ldd命令仅支持查看相同架构的可执行程序或者库文件,比如在X86_84的ubuntu环境中使用ldd查看risc-v架构的gemm_test会产生“not a dynamic executable”。
  • 使用patchelf命令也可以查看依赖。

patchelf gemm_test_spacemit --print-needed

在这里插入图片描述

http://www.xdnf.cn/news/102.html

相关文章:

  • 部署路线Ubuntu_MySQL_Django_绑定域名
  • 【Python3】Django 学习之路
  • 51单片机实验四:键盘检测原理及应用实现
  • 【科研绘图系列】R语言绘制多个气泡图组合图(bubble plot)
  • MATLAB脚本实现了一个转子系统的参数扫描和分岔分析
  • 华为仓颉智能体开发框架 Cangjie Magic深度解析
  • 城市街拍暗色电影胶片风格Lr调色教程,手机滤镜PS+Lightroom预设下载!
  • 【java 13天进阶Day05】数据结构,List,Set ,TreeSet集合,Collections工具类
  • 【C++深入系列】:模版详解(上)
  • 几个常用的快速处理服务器命令和故障排查
  • 使用VHD虚拟磁盘安装双系统,避免磁盘分区
  • 《Operating System Concepts》阅读笔记:p735-p737
  • SQL:聚合函数(Aggregate Functions)
  • 10-openwrt-one调整rootfs_data卷,新增fit2、log、plugins等卷
  • 【MySQL】MySQL表的增删改查(CRUD) —— 上篇
  • MCP 协议:AI 世界的 “USB-C 接口”,开启智能交互新时代
  • PyTorch 深度学习实战(37):分布式训练(DP/DDP/Deepspeed)实战
  • UE5编辑器静止状态下(非 Play 模式)睫毛和眼睛的渲染是正常的,而在 Play 模式下出现模糊
  • Thin-Agent服务(TAS)概述
  • 机器学习在催化剂设计中的应用理论加实操
  • 扫雷-C语言版
  • Linux系统编程学习 day4 进程
  • 深入理解 VMware 虚拟机网络模式:为虚拟化管理铺平道路
  • 【Python爬虫基础篇】--1.基础概念
  • 鸿蒙系统开发中路由使用详解
  • Unity URP Moblie AR示例工程,真机打包出来,没阴影
  • 秘密任务 2.0:如何利用 WebSockets + DTOs 设计实时操作
  • OpenHarmony Camera开发指导(五):相机预览功能(ArkTS)
  • 【JavaWeb】详细讲解 HTTP 协议
  • Linux,redis群集模式,主从复制,读写分离