Groq

InferenceOptimization • US

Total Models29

Free Models0

Paid Models29

Ultra-fast inference

🌐 Visit Website 💰 Official Pricing 📚 API Documentation

💰 Paid Models (29)

Model	Input/1M	Cached in/1M	Output/1M	Context	Capabilities
Llama 3.1 8B Instant llama-3-1-8b-instant	$0.050	—	$0.080	128K	chatfunction_calling
Llama 3.1 8B Instant 128k llama-3.1-8b-instant-128k	$0.050	—	$0.080	128K	chat
Llama 3.1 8B llama-3-1-8b	$0.050	—	$0.080	128K	chatfunction_calling
Llama 3 8B llama-3-8b	$0.050	—	$0.080	8K	chat
GPT OSS 20B 128k gpt-oss-20b-128k	$0.075	—	$0.300	128K	chat
GPT OSS Safeguard 20B gpt-oss-safeguard-20b	$0.075	—	$0.300	128K	chat
openai/gpt-oss-20b openai/gpt-oss-20b	$0.075	$0.037	$0.300	-	chat
Llama 4 Scout llama-4-scout	$0.110	—	$0.340	128K	chatfunction_calling
GPT OSS 120B 128k gpt-oss-120b-128k	$0.150	—	$0.600	128K	chat
openai/gpt-oss-120b openai/gpt-oss-120b	$0.150	$0.075	$0.600	-	chat
Gemma 2 9B gemma-2-9b	$0.200	—	$0.200	8K	chat
Llama 4 Maverick llama-4-maverick	$0.200	—	$0.600	128K	chatfunction_calling
Llama Guard 4 12B llama-guard-4-12b	$0.200	—	$0.200	128K	chatmoderation
Mixtral 8x7B mixtral-8x7b	$0.240	—	$0.240	33K	chat
Qwen3 32B qwen3-32b	$0.290	—	$0.590	131K	chatfunction_calling
Llama 3.3 70B Versatile 128k llama-3.3-70b-versatile-128k	$0.590	—	$0.790	128K	chat
Llama 3.1 70B llama-3-1-70b	$0.590	—	$0.790	128K	chatfunction_calling
Llama 3.3 70B llama-3-3-70b	$0.590	—	$0.790	128K	chatfunction_calling
Llama 3.3 70B Versatile llama-3-3-70b-versatile	$0.590	—	$0.790	128K	chatfunction_calling
Llama 3 70B llama-3-70b	$0.590	—	$0.790	8K	chat
Qwen 3.6 27B 131k qwen-3.6-27b-131k	$0.600	—	$3.00	131K	chat
DeepSeek R1 Distill Llama 70B deepseek-r1-distill-llama-70b	$0.750	—	$0.990	128K	chatreasoning
Kimi K2 kimi-k2	$1.00	—	$3.00	256K	chatreasoning
moonshotai/kimi-k2-instruct-0905 moonshotai/kimi-k2-instruct-0905	$1.00	$0.500	$3.00	-	chat
Llama 3.1 8B Instant 128k llama-3.1-8b-instant	$50.00	—	$80.00	-
GPT-OSS 120B gpt-oss-120b	$75.00	—	$300.00	128K	chat
GPT-OSS 20B gpt-oss-20b	$75.00	—	$300.00	128K	chat
Llama 3.3 70B Versatile 128k llama-3.3-70b-versatile	$590.00	—	$790.00	-
Qwen 3.6 27B 131k qwen/qwen3.6-27b	$600.00	—	$3000.00	-