Python onnxruntime-gpu 指定 gpu 加载模型

本文最后更新于：2025年1月2日下午

在 onnxruntime python 库中可以加载在内存或者显存中，分别使用 cpu 和 gpu 进行推断运算，本文记录 onnxruntime 将模型加载到指定 gpu 的步骤。

安装

这里我们使用 1.18.0 的 onnx 库

1	`pip install onnxruntime-gpu==1.18.0`

指定 gpu 配置

将需要加载模型的 gpu id 填入 device_id，需要用字符串类型

import onnxruntime
model_path = 'test.onnx'
CUDAExecutionProvider = {
                "cudnn_conv_algo_search": "DEFAULT",
                "cudnn_conv_use_max_workspace": '1',
                "device_id": '1' 
            }
providers=[("CUDAExecutionProvider", CUDAExecutionProvider)]
session = onnxruntime.InferenceSession(model_path, providers)