Building on HF

2 2 8

Pankaj Pandey

pankajpandey-dev

AI & ML interests

Natural Language Processing, Text Generation, Large Language Models, Quantization, Fine-Tuning, RLHF, Model Merging

Recent Activity

upvoted a collection 1 day ago

GGUF Quantizations

upvoted a collection 1 day ago

🇮🇳 Hindi LLM Series

repliedto their post 1 day ago

🇮🇳 Qwen3-4B Hindi Instruct v2 — a Hindi LLM that runs on your own machine Most strong Hindi-capable models are either huge or cloud-only. I wanted one that's small enough to run locally but actually follows instructions in Hindi — so I fine-tuned Qwen3-4B on 10K Hindi instruction pairs and shipped it with a full GGUF quant ladder. ✅ Fine-tune (16-bit): huggingface.co/pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2 ✅ GGUF (Q4/Q5/Q8): huggingface.co/pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2-GGUF Runs in Ollama, llama.cpp, and LM Studio. The Q4_K_M is just 2.5 GB — fits comfortably on a laptop, CPU or GPU. Part of my Hindi LLM Series — building openly-licensed Indic models for local and edge use. More coming (Gemma next). Feedback welcome 🙏 #Hindi #IndicNLP #GGUF #LocalLLM #Qwen

View all activity

Organizations

Posts 4

Post

14763

🇮🇳 Qwen3-4B Hindi Instruct v2 — a Hindi LLM that runs on your own machine
Most strong Hindi-capable models are either huge or cloud-only. I wanted one that's small enough to run locally but actually follows instructions in Hindi — so I fine-tuned Qwen3-4B on 10K Hindi instruction pairs and shipped it with a full GGUF quant ladder.
✅ Fine-tune (16-bit): huggingface.co/pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2
✅ GGUF (Q4/Q5/Q8): huggingface.co/pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2-GGUF
Runs in Ollama, llama.cpp, and LM Studio. The Q4_K_M is just 2.5 GB — fits comfortably on a laptop, CPU or GPU.
Part of my Hindi LLM Series — building openly-licensed Indic models for local and edge use. More coming (Gemma next). Feedback welcome 🙏
#Hindi #IndicNLP #GGUF #LocalLLM #Qwen

Post

669

🇮🇳 Just shipped: MiniCPM5-1B-Hindi-Instruct (+ GGUF quants)

First Hindi instruction-tuned fine-tune of OpenBMB's brand-new MiniCPM5-1B (released this week).

Trained with Unsloth + LoRA (r=32) on AI4Bharat's anudesh + dolly Hindi splits — ~4k high-quality examples, 2 epochs on a single T4 in 60 minutes.

🔗 Model (16-bit + LoRA adapter):
pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct

📦 GGUF quants for llama.cpp / Ollama / LM Studio:
pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct-v1-GGUF

5 quant levels — from Q3_K_M (~560 MB, runs on a Raspberry Pi) to Q8_0 (~1.2 GB, near-lossless). Q4_K_M is the recommended default.

Part of my ongoing 🇮🇳 Hindi LLM Series — bringing strong open-source LLMs to Indian languages.

#Hindi #IndicNLP #MiniCPM5 #LoRA #Unsloth #GGUF #llamacpp #Ollama #LocalLLM

View all Posts

Collections 2

models 7

Pankaj Pandey

AI & ML interests

Recent Activity

Organizations

Posts 4

Collections 2

pankajpandey-dev/Carbon-3B-GGUF

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct

pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2

pankajpandey-dev/Carbon-3B-GGUF

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct

pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2

models 7

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/Qwen3-0.6B-Hindi-Instruct-v1

pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2-GGUF

pankajpandey-dev/Qwen3-4B-Hindi-Instruct-v2

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct-v1-GGUF

pankajpandey-dev/Carbon-3B-GGUF

pankajpandey-dev/MiniCPM5-1B-Hindi-Instruct

datasets 1

pankajpandey-dev/hindi-instruct-10k-recipe

Pankaj Pandey

AI & ML interests

Recent Activity

Organizations

Posts 4

Collections 2

models 7 Sort: Recently updated

datasets 1

models 7