Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2309.05463

Language Models - Essential Research Papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 108
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 18
LLaMA: Open and Efficient Foundation Language Models

Paper • 2302.13971 • Published Feb 27, 2023 • 20
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 248

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Synthetic Data Generation

Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
TinyStories: How Small Can Language Models Be and Still Speak Coherent English?

Paper • 2305.07759 • Published May 12, 2023 • 38
Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28, 2024 • 104

Phi-1 family of small language models.

microsoft/phi-1

Text Generation • 1B • Updated Nov 24, 2025 • 2.98k • 218
microsoft/phi-1_5

Text Generation • 1B • Updated Nov 24, 2025 • 41.9k • 1.35k
Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Dataset generation

Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Running on CPU Upgrade

Featured

329

GPT-OSS-120B on AMD MI300X

💻

329

gpt-oss-120b on AMD MI300X GPUs
Running on Zero

134

Phi-4

🤖

134

Chat with LLMs
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
Running

32

SimpleChatbot

📊

32

Chat with AI models to get answers

Running

3.05k

AnyCoder

🏆

3.05k

Generate code with AI
Running

Featured

274

Qwen2.5 Coder Artifacts

🐢

274

Generate code from natural language prompts
Running

Featured

923

QwQ-32B-Preview

🔍

923

QwQ-32B-Preview
Running on CPU Upgrade

13.8k

Open LLM Leaderboard

🏆

13.8k

Track, rank and evaluate open LLMs and chatbots

LLM Fundamental papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 108
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 18
GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints

Paper • 2305.13245 • Published May 22, 2023 • 6
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 248

Beginner's Mind

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
Neurons in Large Language Models: Dead, N-gram, Positional

Paper • 2309.04827 • Published Sep 9, 2023 • 17
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Paper • 2403.09629 • Published Mar 14, 2024 • 78

Synthetic Data Generation

A curated list of papers focusing on synthetic data generation

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20, 2024 • 50
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows

Paper • 2402.10379 • Published Feb 16, 2024 • 31
Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models

Paper • 2312.06585 • Published Dec 11, 2023 • 29

Language Models - Essential Research Papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 108
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 18
LLaMA: Open and Efficient Foundation Language Models

Paper • 2302.13971 • Published Feb 27, 2023 • 20
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 248

Running on CPU Upgrade

Featured

329

GPT-OSS-120B on AMD MI300X

💻

329

gpt-oss-120b on AMD MI300X GPUs
Running on Zero

134

Phi-4

🤖

134

Chat with LLMs
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
Running

32

SimpleChatbot

📊

32

Chat with AI models to get answers

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Running

3.05k

AnyCoder

🏆

3.05k

Generate code with AI
Running

Featured

274

Qwen2.5 Coder Artifacts

🐢

274

Generate code from natural language prompts
Running

Featured

923

QwQ-32B-Preview

🔍

923

QwQ-32B-Preview
Running on CPU Upgrade

13.8k

Open LLM Leaderboard

🏆

13.8k

Track, rank and evaluate open LLMs and chatbots

Synthetic Data Generation

Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
TinyStories: How Small Can Language Models Be and Still Speak Coherent English?

Paper • 2305.07759 • Published May 12, 2023 • 38
Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28, 2024 • 104

LLM Fundamental papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 108
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 18
GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints

Paper • 2305.13245 • Published May 22, 2023 • 6
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 248

Phi-1 family of small language models.

microsoft/phi-1

Text Generation • 1B • Updated Nov 24, 2025 • 2.98k • 218
microsoft/phi-1_5

Text Generation • 1B • Updated Nov 24, 2025 • 41.9k • 1.35k
Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Beginner's Mind

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
Neurons in Large Language Models: Dead, N-gram, Positional

Paper • 2309.04827 • Published Sep 9, 2023 • 17
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Paper • 2403.09629 • Published Mar 14, 2024 • 78

Dataset generation

Textbooks Are All You Need

Paper • 2306.11644 • Published Jun 20, 2023 • 152
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88

Synthetic Data Generation

A curated list of papers focusing on synthetic data generation

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20, 2024 • 50
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 88
DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows

Paper • 2402.10379 • Published Feb 16, 2024 • 31
Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models

Paper • 2312.06585 • Published Dec 11, 2023 • 29

Previous
1
2
3
...
5
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs