5 21 6

Zichen

lkevinzc

https://lkevinzc.github.io/

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 months ago

Diffusion Language Models are Super Data Learners

upvoted a paper 2 months ago

Defeating the Training-Inference Mismatch via FP16

upvoted a paper 3 months ago

Imperceptible Jailbreaking against Large Language Models

View all activity

Organizations

upvoted 2 papers 2 months ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5, 2025 • 128

Defeating the Training-Inference Mismatch via FP16

Paper • 2510.26788 • Published Oct 30, 2025 • 29

upvoted 3 papers 3 months ago

authored 6 papers 3 months ago

EnvPool: A Highly Parallel Reinforcement Learning Environment Execution Engine

Paper • 2206.10558 • Published Jun 21, 2022 • 2

Efficient Process Reward Model Training via Active Learning

Paper • 2504.10559 • Published Apr 14, 2025 • 13

SynthRL: Scaling Visual Reasoning with Verifiable Data Synthesis

Paper • 2506.02096 • Published Jun 2, 2025 • 52

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26, 2025 • 70

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26, 2025 • 69

GEM: A Gym for Agentic LLMs

Paper • 2510.01051 • Published Oct 1, 2025 • 89

updated a dataset 3 months ago

lkevinzc/math-eval

Viewer • Updated Oct 1, 2025 • 1.56k • 278

published a dataset 3 months ago

lkevinzc/math-eval

Viewer • Updated Oct 1, 2025 • 1.56k • 278

updated a dataset 3 months ago

axon-rl/geometry3k

Viewer • Updated Sep 30, 2025 • 3k • 8

published a dataset 3 months ago

axon-rl/geometry3k

Viewer • Updated Sep 30, 2025 • 3k • 8

upvoted 2 papers 3 months ago

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26, 2025 • 70

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26, 2025 • 69

updated a dataset 5 months ago

lkevinzc/llama3-ultrafeedback

Viewer • Updated Jul 27, 2025 • 60.9k • 13

published a dataset 5 months ago

lkevinzc/llama3-ultrafeedback

Viewer • Updated Jul 27, 2025 • 60.9k • 13

updated a dataset 6 months ago

axon-rl/math-eval

Viewer • Updated Jul 17, 2025 • 1.59k • 82

Zichen

AI & ML interests

Recent Activity

Organizations

lkevinzc's activity