shisa-v2-research - a shisa-ai Collection

shisa-ai 's Collections

shisa-v2-research

Quantization Tests

shisa-v2-research

updated Apr 13, 2025

Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing

Paper • 2406.08464 • Published Jun 12, 2024 • 72
Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28, 2024 • 107
argilla/magpie-ultra-v1.0

Viewer • Updated Nov 26, 2024 • 3.22M • 785 • 50
simplescaling/s1K-1.1

Viewer • Updated Feb 27, 2025 • 1k • 2.1k • 155
GAIR/LIMO

Viewer • Updated Feb 10, 2025 • 817 • 1.48k • 177
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2, 2024 • 69
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Paper • 2404.03715 • Published Apr 4, 2024 • 62
Self-Boosting Large Language Models with Synthetic Preference Data

Paper • 2410.06961 • Published Oct 9, 2024 • 16
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models

Paper • 2412.11605 • Published Dec 16, 2024 • 18
Magpie-Align/Magpie-Reasoning-V1-150K-CoT-Deepseek-R1-Llama-70B

Viewer • Updated Jan 27, 2025 • 150k • 108 • 18
sbintuitions/modernbert-ja-130m

Fill-Mask • 0.1B • Updated May 1, 2025 • 8.71k • • 47
bespokelabs/Bespoke-Stratos-17k

Viewer • Updated Jan 31, 2025 • 16.7k • 7.78k • 341
SymNoise: Advancing Language Model Fine-tuning with Symmetric Noise

Paper • 2312.01523 • Published Dec 3, 2023
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training

Paper • 2411.15124 • Published Nov 22, 2024 • 67