Haoxiang-Wang

Follow

Haoxiang Wang Haoxiang-Wang

Follow

NVIDIA Research Scientist

71 followers · 17 following

NVIDIA
United States
https://haoxiang-wang.github.io/
@Haoxiang__Wang
in/haoxiang-wang-071414ab
https://scholar.google.com/citations?user=bcInPlwAAAAJ&hl=en

Achievements

Achievements

Pinned Loading

RLHFlow/RLHF-Reward-Modeling RLHFlow/RLHF-Reward-Modeling Public

Recipes to train reward model for RLHF.

Python 1.5k 102
NVlabs/NFT NVlabs/NFT Public

Implementation of Negative-aware Finetuning (NFT) algorithm for "Bridging Supervised Learning and Reinforcement Learning in Math Reasoning"

Python 42 4