GRPO的生成式reward模型是否支持vllm预测 #4901

Open

Open

GRPO的生成式reward模型是否支持vllm预测#4901

Labels

GRPO的生成式reward模型是否支持vllm预测

给的例子使用的是 PtEngine，是否可以使用vllm、lmdeploy等推理引擎

Metadata

Assignees

No one assigned

Labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests