siyuanzhu's picture

siyuanzhu

siyuan-zhu

·

AI & ML interests

reinforcement learning

Recent Activity

liked a model 4 days ago

Musci-research/Musci-ASR-2.4B

upvoted a paper 9 days ago

GAGPO: Generalized Advantage Grouped Policy Optimization

authored a paper 9 days ago

GAGPO: Generalized Advantage Grouped Policy Optimization

View all activity

Organizations

Papers 2

arxiv:2605.13217

arxiv:2512.14465

models 0

None public yet

datasets 3

siyuan-zhu/gsm8k-python

Viewer • Updated May 28, 2025 • 1.2k • 45 • 1

siyuan-zhu/kk-difficulty

Viewer • Updated Mar 24, 2025 • 6.9k • 5 • 1

siyuan-zhu/gsm8k-doubao-lite-difficulties

Viewer • Updated Mar 24, 2025 • 8.79k • 8 • 1