Xin Dong's picture

7 14 5

Xin Dong

SimonX

·

AI & ML interests

None yet

Recent Activity

commented on a paper 44 minutes ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper about 1 hour ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a collection about 1 month ago

Physics of Language Models: Part 4.2

View all activity

Organizations

SimonX 's datasets

None public yet