QBLAS
🚀 qblas 是一个高性能矩阵乘法(GEMM)Rust 库,支持自动选择最佳的 CPU 指令集内核(如 AVX2),并可扩展支持多种数据精度(如 f32
、f16
、量化 Q8)。
✨ 特点
-
✅ 多指令集支持
支持CPU AVX2 等 SIMD 指令,优先使用最快内核。 -
✅ 多数据精度支持(可扩展)
已内置f32
实现,后续可支持f16
、量化 int8 / Q8。
📦 安装
🚀 qblas 是一个高性能矩阵乘法(GEMM)Rust 库,支持自动选择最佳的 CPU 指令集内核(如 AVX2),并可扩展支持多种数据精度(如 f32
、f16
、量化 Q8)。
✅ 多指令集支持
支持CPU AVX2 等 SIMD 指令,优先使用最快内核。
✅ 多数据精度支持(可扩展)
已内置 f32
实现,后续可支持 f16
、量化 int8 / Q8。