这是一个用于测试GPU矩阵运算性能的基准测试程序,主要测试不同精度下的计算能力。
天梯榜/统计数据:https://perf.svcfusion.com/
- 支持多种数值精度测试(FP32/FP16/BF16)
- 可配置矩阵大小和测试参数
- 自动进行GPU预热,确保测试准确性
- 提供TFLOPS性能指标
- 包含内存自动管理
- 矩阵大小:1024x1024~10240x10240
- 预热次数:6次
- 测试次数:30次
- GPU设备信息
- 各精度下的TFLOPS性能指标
您也可以通过提交PR的方式,添加您测试过的数据。
git clone https://github.com/zzc0721/torch-performence-test-data.git
cd torch-performence-test-data使用uv作为虚拟环境管理,使用以下命令安装:
uv sync使用最新的torch版本以及cudatoolkit,也可以参考以下方法安装:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu129使用uv运行
uv run test.py直接使用python运行
python test.py运行完之后如需提交数据可以直接将运行结果发在issue,或是按照 database.md 的格式向本仓库提交PR
- zzc0208
- KAl(SO₄)₂·12H₂O
- turning point (算法是他做的)