Support pre-registered plug-in cuda execution provider library #1850

baijumeswani · 2025-10-30T07:57:12Z

Up until now, for the cuda execution provider, onnxruntime-genai tried using the built-in cuda ep using the legacy OrtCUDAProviderOptionsV2 and AppendExecutionProvider_CUDA_V2 API. These functions are designed to make use of the built-in cuda execution provider and are not compatible with the world of plug-in eps.

The changes in this pull-request now extend support to executing the model with a pre-registered (plugged-in) CUDAExecutionProvider.

In order to use the plug-in capabilities, application layer needs to do the following:

C++

#include "onnxruntime_cxx_api.h"
#include "ort_genai.h"

auto env = Ort::Env();
env.RegisterExecutionProviderLibrary("CUDAExecutionProvider", "path\to\onnxruntime_providers_cuda.dll");

auto model = OgaModel("path\to\model\directory");
...

Python

import onnxruntime_genai as og

og.register_execution_provider_library("CUDAExecutionProvider", "path\to\onnxruntime_providers_cuda.dll")

model = og.Model("path\to\model\directory")
...

C#

using Microsoft.ML.OnnxRuntime;
using Microsoft.ML.OnnxRuntimeGenAI;

var ortEnv = OrtEnv.Instance();
ortEnv.RegisterExecutionProviderLibrary("CUDAExecutionProvider", "path\to\onnxruntime_providers_cuda.dll");

using Model model = new Model("path\to\model\directory");
...

kunal-vaishnavi · 2025-10-30T17:39:43Z

Can we provide a direct API from ORT GenAI for registering a provider library for non-Python language bindings?

baijumeswani · 2025-10-30T17:49:40Z

Can we provide a direct API from ORT GenAI for registering a provider library for non-Python language bindings?

We do have a C API:

onnxruntime-genai/src/ort_genai_c.h

Lines 1071 to 1084 in 240fa1b

    
           /** 
        
            * \brief Registers an execution provider library with ONNXRuntime API. 
        
            * \param registration_name name for registration. 
        
            * \param path provider path. 
        
            * 
        
            */ 
        
           OGA_EXPORT void OGA_API_CALL OgaRegisterExecutionProviderLibrary(const char* registration_name, const char* library_path); 
        
           /** 
        
            * \brief Unregisters an execution provider library with ONNXRuntime API. 
        
            * \param registration_name name for registration. 
        
            * 
        
            */ 
        
           OGA_EXPORT void OGA_API_CALL OgaUnregisterExecutionProviderLibrary(const char* registration_name);

But people are probably more used to using the onnxruntime env since those APIs offer more control. onnxruntime-genai API fr library registration is needed for Python in particular because the onnxruntime python library is not the one we load from onnxruntime-genai's Python package.

baijumeswani added 3 commits October 30, 2025 00:51

Support pre-registered plug-in cuda execution provider library

11fb8aa

Fix build issue

aed9763

Fix build

630b5d7

baijumeswani marked this pull request as ready for review October 30, 2025 17:36

Remove unnecessary code

a2aa7b1

Change how onnxruntime-genai-cuda.dll is loaded

1a4c60c

kunal-vaishnavi approved these changes Oct 31, 2025

View reviewed changes

baijumeswani merged commit 6903a36 into main Oct 31, 2025
15 checks passed

baijumeswani deleted the baijumeswani/use-session-options-v2 branch October 31, 2025 16:15

anujj mentioned this pull request Nov 26, 2025

Support pre-registered plug-in NvTensorRtRtx execution provider library #1889

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Support pre-registered plug-in cuda execution provider library #1850

Support pre-registered plug-in cuda execution provider library #1850

Uh oh!

baijumeswani commented Oct 30, 2025 •

edited

Loading

Uh oh!

kunal-vaishnavi commented Oct 30, 2025

Uh oh!

baijumeswani commented Oct 30, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Support pre-registered plug-in cuda execution provider library #1850

Support pre-registered plug-in cuda execution provider library #1850

Uh oh!

Conversation

baijumeswani commented Oct 30, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

kunal-vaishnavi commented Oct 30, 2025

Uh oh!

baijumeswani commented Oct 30, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

baijumeswani commented Oct 30, 2025 •

edited

Loading