Compare Free LLM APIs Side by Side — Context, Rate Limits & Modality

0/6 selected

Pick models from the gallery below

OpenRouter 262K ctx

inclusionAI: Ring-2.6-1T

text

API

View Details

OpenRouter 131K ctx

Baidu Qianfan: CoBuddy (free)

text

API

View Details

OpenRouter 1.0M ctx

Owl Alpha

text

API

View Details

OpenRouter 256K ctx

NVIDIA: Nemotron 3 Nano Omni (free)

textimageaudio

API

View Details

OpenRouter 131K ctx

Poolside: Laguna XS.2 (free)

text

API

View Details

OpenRouter 131K ctx

Poolside: Laguna M.1 (free)

text

API

View Details

OpenRouter 1.0M ctx

DeepSeek: DeepSeek V4 Flash (free)

text

API

View Details

OpenRouter 66K ctx

Baidu: Qianfan-OCR-Fast

textimage

API

View Details

OpenRouter 262K ctx

Google: Gemma 4 26B A4B (free)

textimage

API

View Details

OpenRouter 262K ctx

Google: Gemma 4 31B (free)

textimage

API

View Details

OpenRouter 262K ctx

Arcee AI: Trinity Large Thinking (free)

textreasoning

API

View Details

OpenRouter 1.0M ctx

Google: Lyria 3 Pro Preview

textimage

API

View Details

OpenRouter 1.0M ctx

Google: Lyria 3 Clip Preview

textimage

API

View Details

OpenRouter 1.0M ctx

NVIDIA: Nemotron 3 Super (free)

text

API

View Details

OpenRouter 205K ctx

MiniMax: MiniMax M2.5 (free)

text

API

View Details

OpenRouter 200K ctx

Free Models Router

textimage

API

View Details

OpenRouter 33K ctx

LiquidAI: LFM2.5-1.2B-Thinking (free)

textreasoning

API

View Details

OpenRouter 33K ctx

LiquidAI: LFM2.5-1.2B-Instruct (free)

text

API

View Details

OpenRouter 256K ctx

NVIDIA: Nemotron 3 Nano 30B A3B (free)

text

API

View Details

OpenRouter 131K ctx

OpenAI: gpt-oss-safeguard-20b

text

API

View Details

OpenRouter 128K ctx

NVIDIA: Nemotron Nano 12B 2 VL (free)

textimage

API

View Details

OpenRouter 262K ctx

Qwen: Qwen3 Next 80B A3B Instruct (free)

text

API

View Details

OpenRouter 128K ctx

NVIDIA: Nemotron Nano 9B V2 (free)

text

API

View Details

OpenRouter 131K ctx

OpenAI: gpt-oss-120b (free)

text

API

View Details

OpenRouter 131K ctx

OpenAI: gpt-oss-20b (free)

text

API

View Details

OpenRouter 131K ctx

Z.ai: GLM 4.5 Air (free)

text

API

View Details

OpenRouter 1.0M ctx

Qwen: Qwen3 Coder 480B A35B (free)

textcode

API

View Details

OpenRouter 33K ctx

Venice: Uncensored (free)

text

API

View Details

OpenRouter 131K ctx

Meta: Llama 3.3 70B Instruct (free)

text

API

View Details

OpenRouter 131K ctx

Meta: Llama 3.2 3B Instruct (free)

text

API

View Details

OpenRouter 131K ctx

Nous: Hermes 3 405B Instruct (free)

text

API

View Details

Cohere 256K ctx

Command A (111B)

text

View Details

Cohere 128K ctx

Command R+

text

View Details

Cohere 128K ctx

Command R7B

text

View Details

Cohere 131K ctx

Embed 4

text

View Details

Cohere 131K ctx

Rerank 3.5

text

View Details

Google Gemini 1.0M ctx

Gemini 2.5 Flash

text

View Details

Google Gemini 1.0M ctx

Gemini 2.5 Flash-Lite

text

View Details

Mistral AI 256K ctx

Mistral Small 4

text

API

View Details

Mistral AI 128K ctx

Mistral Medium 3

text

API

View Details

Mistral AI 256K ctx

Mistral Large 3

text

API

View Details

Mistral AI 128K ctx

Mistral Nemo (12B)

text

API

View Details

Mistral AI 256K ctx

Codestral

textcode

API

View Details

Mistral AI 128K ctx

Pixtral Large

textimage

API

View Details

Z AI (Zhipu AI) 200K ctx

GLM-4.7-Flash

text

API

View Details

Z AI (Zhipu AI) 128K ctx

GLM-4.5-Flash

text

API

View Details

Z AI (Zhipu AI) 128K ctx

GLM-4.6V-Flash

text

API

View Details

Cerebras 128K ctx

llama3.1-8b

text

API

View Details

Cerebras 128K ctx

gpt-oss-120b

text

API

View Details

Cerebras 131K ctx

qwen-3-235b-a22b-instruct-2507

text

API

View Details

Cerebras 128K ctx

zai-glm-4.7

text

API

View Details

Cloudflare Workers AI 131K ctx

@cf/meta/llama-3.3-70b-instruct-fp8-fast

text

View Details

Cloudflare Workers AI 131K ctx

@cf/meta/llama-3.1-8b-instruct-fp8-fast

text

View Details

Cloudflare Workers AI 131K ctx

@cf/meta/llama-3.2-11b-vision-instruct

textimage

View Details

Cloudflare Workers AI 10.0M ctx

@cf/meta/llama-4-scout-17b-16e-instruct

text

View Details

Cloudflare Workers AI 128K ctx

@cf/mistralai/mistral-small-3.1-24b-instruct

text

View Details

Cloudflare Workers AI 256K ctx

@cf/google/gemma-4-26b-a4b-it

text

View Details

Cloudflare Workers AI 32K ctx

@cf/qwen/qwq-32b

text

View Details

Cloudflare Workers AI 32K ctx

@cf/deepseek-ai/deepseek-r1-distill-qwen-32b

text

View Details

GitHub Models 1.0M ctx

gpt-4.1

text

API

View Details

GitHub Models 1.0M ctx

gpt-4.1-mini

text

API

View Details

GitHub Models 128K ctx

gpt-4o

text

API

View Details

GitHub Models 200K ctx

o3-mini

text

API

View Details

GitHub Models 200K ctx

o4-mini

text

API

View Details

GitHub Models 512K ctx

Llama-4-Scout-17B-16E

text

API

View Details

GitHub Models 256K ctx

Llama-4-Maverick-17B-128E

text

API

View Details

GitHub Models 131K ctx

Meta-Llama-3.3-70B

text

API

View Details

GitHub Models 64K ctx

DeepSeek-R1

text

API

View Details

GitHub Models 128K ctx

Mistral-Small-3.1

text

API

View Details

Groq 131K ctx

llama-3.3-70b-versatile

text

API

View Details

Groq 131K ctx

llama-3.1-8b-instant

text

API

View Details

Groq 131K ctx

llama-4-scout-17b-16e-instruct

text

API

View Details

Groq 131K ctx

llama-4-maverick-17b-128e-instruct

text

API

View Details

Groq 131K ctx

qwen3-32b

text

API

View Details

Groq 262K ctx

kimi-k2-instruct

text

API

View Details

Groq 131K ctx

deepseek-r1-distill-70b

text

API

View Details

Groq 131K ctx

whisper-large-v3

text

API

View Details

Groq 131K ctx

whisper-large-v3-turbo

text

API

View Details

Hugging Face 128K ctx

Meta-Llama-3.1-8B-Instruct

text

View Details

Hugging Face 32K ctx

Mistral-7B-Instruct-v0.3

text

View Details

Hugging Face 32K ctx

Mixtral-8x7B-Instruct-v0.1

text

View Details

Hugging Face 128K ctx

Phi-3.5-mini-instruct

text

View Details

Hugging Face 131K ctx

Qwen2.5-7B-Instruct

text

View Details

Kilo Code 131K ctx

bytedance-seed/dola-seed-2.0-pro:free

text

API

View Details

Kilo Code 131K ctx

x-ai/grok-code-fast-1:optimized:free

textcode

API

View Details

Kilo Code 262K ctx

nvidia/nemotron-3-super-120b-a12b:free

text

API

View Details

Kilo Code 131K ctx

arcee-ai/trinity-large-thinking:free

text

API

View Details

LLM7.io 131K ctx

deepseek-r1-0528

text

API

View Details

LLM7.io 131K ctx

deepseek-v3-0324

text

API

View Details

LLM7.io 131K ctx

gpt-4o-mini

text

API

View Details

LLM7.io 32K ctx

mistral-small-3.1-24b

text

API

View Details

LLM7.io 131K ctx

qwen2.5-coder-32b

textcode

API

View Details

ModelScope 131K ctx

Qwen/Qwen3.5-35B-A3B

text

API

View Details

ModelScope 131K ctx

Qwen/Qwen3.5-27B

text

API

View Details

ModelScope 131K ctx

Qwen/Qwen-Image

text

API

View Details

Ollama Cloud 128K ctx

llama3.1:cloud

text

API

View Details

Ollama Cloud 128K ctx

deepseek-r1:cloud

text

API

View Details

Ollama Cloud 128K ctx

qwen2.5:cloud

text

API

View Details

Ollama Cloud 8K ctx

gemma2:cloud

text

API

View Details

Ollama Cloud 32K ctx

mistral:cloud

text

API

View Details

OVHcloud AI Endpoints 131K ctx

Meta-Llama-3_3-70B-Instruct

text

API

View Details

OVHcloud AI Endpoints 131K ctx

DeepSeek-R1-Distill-Llama-70B

text

API

View Details

OVHcloud AI Endpoints 262K ctx

Qwen3-Coder-30B-A3B-Instruct

textcode

API

View Details

OVHcloud AI Endpoints 128K ctx

Qwen2.5-VL-72B-Instruct

textimage

API

View Details

OVHcloud AI Endpoints 128K ctx

Mistral-Nemo-Instruct-2407

text

API

View Details

OVHcloud AI Endpoints 32K ctx

Qwen3Guard-Gen-8B

text

API

View Details

OVHcloud AI Endpoints 32K ctx

Qwen3Guard-Gen-0.6B

text

API

View Details

SiliconFlow 33K ctx

deepseek-ai/DeepSeek-R1-0528-Qwen3-8B

text

API

View Details

SiliconFlow 131K ctx

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

text

API

View Details

SiliconFlow 32K ctx

THUDM/glm-4-9b-chat

text

API

View Details

SiliconFlow 66K ctx

THUDM/GLM-4.1V-9B-Thinking

text

API

View Details

SiliconFlow 131K ctx

deepseek-ai/DeepSeek-OCR

text

API

View Details

SiliconFlow 131K ctx

Abbreviation

text

API

View Details

NVIDIA NIM 1.0M ctx

deepseek-ai/deepseek-v4-flash

text

API

View Details

NVIDIA NIM 131K ctx

deepseek-ai/deepseek-v4-pro

text

API

View Details

NVIDIA NIM 131K ctx

meta/llama-3.1-70b-instruct

text

API

View Details

NVIDIA NIM 131K ctx

meta/llama-3.2-11b-vision-instruct

textimage

API

View Details

NVIDIA NIM 131K ctx

meta/llama-3.2-1b-instruct

text

API

View Details

NVIDIA NIM 131K ctx

meta/llama-3.2-3b-instruct

text

API

View Details

NVIDIA NIM 164K ctx

meta/llama-guard-4-12b

textimage

API

View Details

NVIDIA NIM 205K ctx

minimaxai/minimax-m2.7

text

API

View Details

NVIDIA NIM 131K ctx

mistralai/mistral-large-2-instruct

text

API

View Details

NVIDIA NIM 262K ctx

moonshotai/kimi-k2.6

text

API

View Details

NVIDIA NIM 131K ctx

nvidia/llama-3.1-nemotron-ultra-253b-v1

text

API

View Details

NVIDIA NIM 131K ctx

nvidia/llama-3.3-nemotron-super-49b-v1.5

text

API

View Details

NVIDIA NIM 262K ctx

qwen/qwen3.5-122b-a10b

textimage

API

View Details

NVIDIA NIM 262K ctx

qwen/qwen3.5-397b-a17b

textimage

API

View Details

NVIDIA NIM 262K ctx

stepfun-ai/step-3.5-flash

text

API

View Details

NVIDIA NIM 203K ctx

z-ai/glm-5.1

text

API

View Details

OpenRouter 131K ctx

NVIDIA: Llama Nemotron Embed VL 1B V2 (free)

textimageembeddings

API

View Details

Chutes.ai 131K ctx

DeepSeek-R1

text

API

View Details

Chutes.ai 131K ctx

Llama 3.1 70B

text

API

View Details

Glhf.chat 131K ctx

Llama 3.1 70B

text

API

View Details

Glhf.chat 33K ctx

Mixtral 8x7B

text

API

View Details

Grok (xAI) 131K ctx

Grok-2

text

API

View Details

Grok (xAI) 131K ctx

Grok-2 Mini

text

API

View Details

Groq 131K ctx

Moonshot Kimi K2

text

API

View Details

Groq 131K ctx

Moonshot Kimi K2 0905

text

API

View Details

Groq 131K ctx

GPT-OSS 120B

text

API

View Details

Groq 131K ctx

GPT-OSS 20B

text

API

View Details

Groq 131K ctx

GPT-OSS Safeguard 20B

text

API

View Details

GitHub Models 131K ctx

Phi-4

text

API

View Details

GitHub Models 131K ctx

Mistral Large (24.11)

text

API

View Details

GitHub Models 256K ctx

AI21 Jamba 1.5 Large

text

API

View Details

Cerebras 131K ctx

Llama 3.1 70B

text

API

View Details

Mistral AI 33K ctx

Mistral 7B

text

API

View Details

Mistral AI 33K ctx

Mixtral 8x7B

text

API

View Details

Cloudflare Workers AI 33K ctx

Mistral 7B

text

View Details

Cloudflare Workers AI 33K ctx

Qwen 1.5 7B

text

View Details

Select 2-4 models from the table above to compare them side by side.

How to Compare Free LLM APIs — What Matters

Not all specs matter equally. Here's what to focus on when comparing free models:

Context window — Most important for coding tools (Claude Code, Cursor). 128K is the practical minimum for processing a real codebase. For long documents or multi-file refactors, look for 256K+.
Rate limit (RPM) — 30+ RPM is comfortable for solo developers (one request every 2 seconds). Below 10 RPM, you'll feel the throttle. Check both RPM and daily caps (RPD).
OpenAI compatibility — If the model's API is OpenAI-compatible, it works with virtually every AI tool (Cursor, Codex, OpenCode, LangChain). Non-compatible APIs need custom integration.
Tool calling support — Essential for AI coding agents. If the model can't call tools, it can generate code but can't run commands or search your codebase.
Credit card requirement — Some "free" tiers still require card verification. If you want zero friction, filter for "No Card" models on the models page.
Max output tokens — For coding, 8K output is the minimum (one full source file). 16K+ lets the model generate entire modules. Reasoning models need extra output for chain-of-thought.

After comparing specs, test your top picks in the Playground with a real API key — latency and output quality can't be judged from numbers alone.