Supported models in AI Gateway

List of supported models

Responses API

curl "https://api.orq.ai/v3/router/responses" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/gpt-4o",
    "input": "Write a one-sentence bedtime story about a unicorn."
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

response = client.responses.create(
  model="openai/gpt-4o",
  input="Write a one-sentence bedtime story about a unicorn."
)

print(response.output_text)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const response = await client.responses.create({
    model: "openai/gpt-4o",
    input: "Write a one-sentence bedtime story about a unicorn."
  });

  console.log(response.output_text);
}

main();

Supported Models

Provider	Model
Alibaba	`alibaba/deepseek-v4-flash`
Alibaba	`alibaba/deepseek-v4-pro`
Alibaba	`alibaba/kimi-k2.5`
Alibaba	`alibaba/kimi-k2.6`
Alibaba	`alibaba/qwen-mt-flash`
Alibaba	`alibaba/qwen-mt-lite`
Alibaba	`alibaba/qwen-plus`
Alibaba	`alibaba/qwen-plus-2025-12-01`
Alibaba	`alibaba/qwen3-max`
Alibaba	`alibaba/qwen3-vl-flash`
Alibaba	`alibaba/qwen3-vl-flash-2025-10-15`
Alibaba	`alibaba/qwen3-vl-plus`
Alibaba	`alibaba/qwen3.5-122b-a10b`
Alibaba	`alibaba/qwen3.5-27b`
Alibaba	`alibaba/qwen3.5-35b-a3b`
Alibaba	`alibaba/qwen3.5-flash`
Alibaba	`alibaba/qwen3.5-flash-2026-02-23`
Alibaba	`alibaba/qwen3.6-35b-a3b`
Alibaba	`alibaba/qwen3.6-flash`
Alibaba	`alibaba/qwen3.6-plus`
Alibaba	`alibaba/qwen3.6-plus-2026-04-02`
Anthropic	`anthropic/claude-fable-5`
Anthropic	`anthropic/claude-haiku-4-5`
Anthropic	`anthropic/claude-haiku-4-5-20251001`
Anthropic	`anthropic/claude-opus-4-0`
Anthropic	`anthropic/claude-opus-4-1`
Anthropic	`anthropic/claude-opus-4-1-20250805`
Anthropic	`anthropic/claude-opus-4-20250514`
Anthropic	`anthropic/claude-opus-4-5`
Anthropic	`anthropic/claude-opus-4-5-20251101`
Anthropic	`anthropic/claude-opus-4-6`
Anthropic	`anthropic/claude-opus-4-7`
Anthropic	`anthropic/claude-opus-4-8`
Anthropic	`anthropic/claude-sonnet-4-0`
Anthropic	`anthropic/claude-sonnet-4-20250514`
Anthropic	`anthropic/claude-sonnet-4-5`
Anthropic	`anthropic/claude-sonnet-4-5-20250929`
Anthropic	`anthropic/claude-sonnet-4-6`
Anthropic	`anthropic/claude-sonnet-5`
AWS Bedrock	`aws/apac.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/apac.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/apac.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/apac.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/au.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/au.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-fable-5`
AWS Bedrock	`aws/eu.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-6-v1`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-7`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/global.anthropic.claude-fable-5`
AWS Bedrock	`aws/global.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-6-v1`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-7`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-5`
AWS Bedrock	`aws/jp.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/meta.llama3-1-405b-instruct-v1:0`
AWS Bedrock	`aws/minimax.minimax-m2.5`
AWS Bedrock	`aws/mistral.devstral-2-123b`
AWS Bedrock	`aws/mistral.magistral-small-2509`
AWS Bedrock	`aws/mistral.ministral-3-3b-instruct`
AWS Bedrock	`aws/mistral.mistral-large-3-675b-instruct`
AWS Bedrock	`aws/mistral.pixtral-large-2502-v1:0`
AWS Bedrock	`aws/nvidia.nemotron-nano-3-30b`
AWS Bedrock	`aws/nvidia.nemotron-super-3-120b`
AWS Bedrock	`aws/qwen.qwen3-coder-next`
AWS Bedrock	`aws/us.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/us.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/us.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/us.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-fable-5`
AWS Bedrock	`aws/us.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-1-20250805-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-5`
AWS Bedrock	`aws/zai.glm-5`
Azure	`azure/eu.gpt-5.6-luna`
Azure	`azure/eu.gpt-5.6-terra`
Azure	`azure/global.gpt-5.6-luna`
Azure	`azure/global.gpt-5.6-terra`
Azure	`azure/gpt-4.1`
Azure	`azure/gpt-4.1-mini`
Azure	`azure/gpt-4.1-nano`
Azure	`azure/gpt-4o`
Azure	`azure/gpt-4o-mini`
Azure	`azure/gpt-5-chat`
Azure	`azure/gpt-5-mini`
Azure	`azure/gpt-5-nano`
Azure	`azure/gpt-5.4`
Azure	`azure/gpt-5.6-sol`
Azure	`azure/gpt-5.6-sol-global`
Azure	`azure/o1`
Azure	`azure/o1-mini`
Azure	`azure/o3-mini`
Cerebras	`cerebras/gpt-oss-120b`
Cerebras	`cerebras/llama3.1-8b`
Cerebras	`cerebras/qwen-3-235b-a22b-instruct-2507`
Cerebras	`cerebras/zai-glm-4.7`
Cohere	`cohere/c4ai-aya-expanse-32b`
Cohere	`cohere/c4ai-aya-expanse-8b`
Cohere	`cohere/c4ai-aya-vision-32b`
Cohere	`cohere/c4ai-aya-vision-8b`
Cohere	`cohere/command-a-03-2025`
Cohere	`cohere/command-a-reasoning-08-2025`
Cohere	`cohere/command-a-translate-08-2025`
Cohere	`cohere/command-a-vision-07-2025`
Cohere	`cohere/command-r-08-2024`
Cohere	`cohere/command-r-plus-08-2024`
Cohere	`cohere/command-r7b-12-2024`
Cohere	`cohere/command-r7b-arabic-02-2025`
Deepseek	`deepseek/deepseek-chat`
Deepseek	`deepseek/deepseek-reasoner`
Deepseek	`deepseek/deepseek-v4-flash`
Deepseek	`deepseek/deepseek-v4-pro`
Vertex AI	`google/claude-haiku-4-5`
Vertex AI	`google/claude-opus-4-1@20250805`
Vertex AI	`google/claude-opus-4-5@20251101`
Vertex AI	`google/claude-opus-4-6`
Vertex AI	`google/claude-opus-4-7`
Vertex AI	`google/claude-opus-4-8`
Vertex AI	`google/claude-opus-4@20250514`
Vertex AI	`google/claude-sonnet-4-5@20250929`
Vertex AI	`google/claude-sonnet-4-6`
Vertex AI	`google/claude-sonnet-4@20250514`
Vertex AI	`google/deepseek-ai/deepseek-v3.1-maas`
Vertex AI	`google/eu.claude-fable-5`
Vertex AI	`google/eu.claude-opus-4-7`
Vertex AI	`google/eu.claude-opus-4-8`
Vertex AI	`google/eu.claude-sonnet-5`
Vertex AI	`google/eu.gemini-3.5-flash`
Vertex AI	`google/gemini-2.0-flash`
Vertex AI	`google/gemini-2.0-flash-001`
Vertex AI	`google/gemini-2.0-flash-lite-001`
Vertex AI	`google/gemini-2.5-flash`
Vertex AI	`google/gemini-2.5-flash-lite`
Vertex AI	`google/gemini-2.5-flash-lite-preview-09-2025`
Vertex AI	`google/gemini-2.5-pro`
Vertex AI	`google/gemini-3-flash-preview`
Vertex AI	`google/gemini-3.1-flash-lite`
Vertex AI	`google/gemini-3.1-flash-lite-preview`
Vertex AI	`google/gemini-3.1-pro-preview`
Vertex AI	`google/gemini-3.5-flash`
Vertex AI	`google/global.claude-fable-5`
Vertex AI	`google/global.claude-opus-4-7`
Vertex AI	`google/global.claude-opus-4-8`
Vertex AI	`google/global.claude-sonnet-5`
Vertex AI	`google/meta/llama-3.3-70b-instruct-maas`
Vertex AI	`google/meta/llama-4-scout-17b-16e-instruct-maas`
Vertex AI	`google/mistral-small-2503`
Vertex AI	`google/openai/gpt-oss-120b-maas`
Vertex AI	`google/openai/gpt-oss-20b-maas`
Vertex AI	`google/qwen/qwen3-235b-a22b-instruct-2507-maas`
Vertex AI	`google/us.claude-fable-5`
Vertex AI	`google/us.claude-opus-4-7`
Vertex AI	`google/us.claude-opus-4-8`
Vertex AI	`google/us.claude-sonnet-5`
Vertex AI	`google/us.gemini-3.5-flash`
Vertex AI	`google/zai-org/glm-4.7-maas`
Vertex AI	`google/zai-org/glm-5-maas`
Vertex AI	`google/zai-org/glm-5.1-maas`
Google AI	`google-ai/gemini-2.0-flash`
Google AI	`google-ai/gemini-2.0-flash-001`
Google AI	`google-ai/gemini-2.0-flash-lite`
Google AI	`google-ai/gemini-2.0-flash-lite-001`
Google AI	`google-ai/gemini-2.5-flash`
Google AI	`google-ai/gemini-2.5-flash-lite`
Google AI	`google-ai/gemini-2.5-flash-lite-preview-09-2025`
Google AI	`google-ai/gemini-2.5-pro`
Google AI	`google-ai/gemini-3-flash-preview`
Google AI	`google-ai/gemini-3-pro-preview`
Google AI	`google-ai/gemini-3.1-flash-lite`
Google AI	`google-ai/gemini-3.1-flash-lite-preview`
Google AI	`google-ai/gemini-3.1-pro-preview`
Google AI	`google-ai/gemini-3.1-pro-preview-customtools`
Google AI	`google-ai/gemini-3.5-flash`
Google AI	`google-ai/gemini-flash-latest`
Google AI	`google-ai/gemini-flash-lite-latest`
Google AI	`google-ai/gemma-3-12b-it`
Google AI	`google-ai/gemma-3-27b-it`
Google AI	`google-ai/gemma-3-4b-it`
Google AI	`google-ai/gemma-3n-e2b-it`
Google AI	`google-ai/gemma-3n-e4b-it`
Google AI	`google-ai/gemma-4-26b-a4b-it`
Google AI	`google-ai/gemma-4-31b-it`
Groq	`groq/allam-2-7b`
Groq	`groq/compound`
Groq	`groq/compound-mini`
Groq	`groq/llama-3.1-8b-instant`
Groq	`groq/llama-3.3-70b-versatile`
Groq	`groq/meta-llama/llama-4-scout-17b-16e-instruct`
Groq	`groq/meta-llama/llama-prompt-guard-2-22m`
Groq	`groq/meta-llama/llama-prompt-guard-2-86m`
Groq	`groq/moonshotai/kimi-k2-instruct-0905`
Groq	`groq/openai/gpt-oss-120b`
Groq	`groq/openai/gpt-oss-20b`
Groq	`groq/openai/gpt-oss-safeguard-20b`
Groq	`groq/qwen/qwen3-32b`
hcompany	`hcompany/holo3-122b-a10b`
hcompany	`hcompany/holo3-35b-a3b`
inceptron	`inceptron/MiniMaxAI/MiniMax-M2.5`
inceptron	`inceptron/moonshotai/Kimi-K2.6`
inceptron	`inceptron/moonshotai/Kimi-K2.7-Code`
inceptron	`inceptron/zai-org/GLM-5.2`
Minimax	`minimax/minimax-m2`
Minimax	`minimax/minimax-m2-her`
Minimax	`minimax/minimax-m2.1`
Minimax	`minimax/minimax-m2.1-lightning`
Minimax	`minimax/minimax-m2.5`
Minimax	`minimax/MiniMax-M2.5-highspeed`
Minimax	`minimax/minimax-m2.5-lightning`
Minimax	`minimax/MiniMax-M2.7`
Minimax	`minimax/MiniMax-M2.7-highspeed`
Minimax	`minimax/MiniMax-M3`
Mistral	`mistral/codestral-2508`
Mistral	`mistral/codestral-latest`
Mistral	`mistral/devstral-2512`
Mistral	`mistral/devstral-latest`
Mistral	`mistral/devstral-medium-latest`
Mistral	`mistral/magistral-medium-2509`
Mistral	`mistral/magistral-medium-latest`
Mistral	`mistral/magistral-small-2509`
Mistral	`mistral/magistral-small-latest`
Mistral	`mistral/ministral-14b-2512`
Mistral	`mistral/ministral-14b-latest`
Mistral	`mistral/ministral-3b-2512`
Mistral	`mistral/ministral-3b-latest`
Mistral	`mistral/ministral-8b-2512`
Mistral	`mistral/ministral-8b-latest`
Mistral	`mistral/mistral-large-2512`
Mistral	`mistral/mistral-large-latest`
Mistral	`mistral/mistral-medium`
Mistral	`mistral/mistral-medium-2505`
Mistral	`mistral/mistral-medium-2508`
Mistral	`mistral/mistral-medium-2604`
Mistral	`mistral/mistral-medium-3`
Mistral	`mistral/mistral-medium-3.5`
Mistral	`mistral/mistral-medium-latest`
Mistral	`mistral/mistral-small-2506`
Mistral	`mistral/mistral-small-2603`
Mistral	`mistral/mistral-small-latest`
Mistral	`mistral/mistral-tiny-2407`
Mistral	`mistral/mistral-tiny-latest`
Mistral	`mistral/open-mistral-nemo`
Mistral	`mistral/open-mistral-nemo-2407`
Mistral	`mistral/voxtral-small-2507`
Mistral	`mistral/voxtral-small-latest`
Moonshot AI	`moonshotai/kimi-k2-0711-preview`
Moonshot AI	`moonshotai/kimi-k2-0905-preview`
Moonshot AI	`moonshotai/kimi-k2-thinking`
Moonshot AI	`moonshotai/kimi-k2-thinking-turbo`
Moonshot AI	`moonshotai/kimi-k2-turbo-preview`
Moonshot AI	`moonshotai/kimi-k2.5`
Moonshot AI	`moonshotai/kimi-k2.6`
Moonshot AI	`moonshotai/kimi-k2.7-code`
nebius	`nebius/deepseek-ai/DeepSeek-V4-Pro`
nebius	`nebius/google/gemma-3-27b-it`
nebius	`nebius/meta-llama/Llama-3.3-70B-Instruct`
nebius	`nebius/MiniMaxAI/MiniMax-M2.5`
nebius	`nebius/MiniMaxAI/MiniMax-M3`
nebius	`nebius/moonshotai/Kimi-K2.6`
nebius	`nebius/moonshotai/Kimi-K2.7-Code`
nebius	`nebius/NousResearch/Hermes-4-405B`
nebius	`nebius/NousResearch/Hermes-4-70B`
nebius	`nebius/nvidia/Cosmos3-Super-Reasoner`
nebius	`nebius/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1`
nebius	`nebius/nvidia/Nemotron-3-Nano-Omni`
nebius	`nebius/nvidia/nemotron-3-super-120b-a12b`
nebius	`nebius/nvidia/Nemotron-3-Ultra-550b-a55b`
nebius	`nebius/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B`
nebius	`nebius/openai/gpt-oss-120b`
nebius	`nebius/openbmb/MiniCPM-V-4_5`
nebius	`nebius/Qwen/Qwen2.5-VL-72B-Instruct`
nebius	`nebius/Qwen/Qwen3-235B-A22B-Instruct-2507`
nebius	`nebius/Qwen/Qwen3-30B-A3B-Instruct-2507`
nebius	`nebius/Qwen/Qwen3-32B`
nebius	`nebius/Qwen/Qwen3-Next-80B-A3B-Thinking`
nebius	`nebius/Qwen/Qwen3.5-397B-A17B`
nebius	`nebius/zai-org/GLM-5.1`
nebius	`nebius/zai-org/GLM-5.2`
OpenAI	`openai/gpt-3.5-turbo`
OpenAI	`openai/gpt-3.5-turbo-0125`
OpenAI	`openai/gpt-3.5-turbo-16k`
OpenAI	`openai/gpt-4-0125-preview`
OpenAI	`openai/gpt-4-turbo`
OpenAI	`openai/gpt-4-turbo-2024-04-09`
OpenAI	`openai/gpt-4.1`
OpenAI	`openai/gpt-4.1-2025-04-14`
OpenAI	`openai/gpt-4.1-mini`
OpenAI	`openai/gpt-4.1-mini-2025-04-14`
OpenAI	`openai/gpt-4.1-nano`
OpenAI	`openai/gpt-4.1-nano-2025-04-14`
OpenAI	`openai/gpt-4o`
OpenAI	`openai/gpt-4o-2024-05-13`
OpenAI	`openai/gpt-4o-2024-08-06`
OpenAI	`openai/gpt-4o-2024-11-20`
OpenAI	`openai/gpt-4o-mini`
OpenAI	`openai/gpt-4o-mini-2024-07-18`
OpenAI	`openai/gpt-4o-mini-search-preview`
OpenAI	`openai/gpt-4o-mini-search-preview-2025-03-11`
OpenAI	`openai/gpt-4o-search-preview`
OpenAI	`openai/gpt-4o-search-preview-2025-03-11`
OpenAI	`openai/gpt-5`
OpenAI	`openai/gpt-5-2025-08-07`
OpenAI	`openai/gpt-5-chat-latest`
OpenAI	`openai/gpt-5-codex`
OpenAI	`openai/gpt-5-mini`
OpenAI	`openai/gpt-5-mini-2025-08-07`
OpenAI	`openai/gpt-5-nano`
OpenAI	`openai/gpt-5-nano-2025-08-07`
OpenAI	`openai/gpt-5.1`
OpenAI	`openai/gpt-5.1-2025-11-13`
OpenAI	`openai/gpt-5.1-chat-latest`
OpenAI	`openai/gpt-5.1-codex`
OpenAI	`openai/gpt-5.1-codex-max`
OpenAI	`openai/gpt-5.1-codex-mini`
OpenAI	`openai/gpt-5.2`
OpenAI	`openai/gpt-5.2-2025-12-11`
OpenAI	`openai/gpt-5.2-chat-latest`
OpenAI	`openai/gpt-5.2-codex`
OpenAI	`openai/gpt-5.3-chat-latest`
OpenAI	`openai/gpt-5.3-codex`
OpenAI	`openai/gpt-5.4`
OpenAI	`openai/gpt-5.4-2026-03-05`
OpenAI	`openai/gpt-5.4-mini`
OpenAI	`openai/gpt-5.4-mini-2026-03-17`
OpenAI	`openai/gpt-5.4-nano`
OpenAI	`openai/gpt-5.4-nano-2026-03-17`
OpenAI	`openai/gpt-5.6-luna`
OpenAI	`openai/gpt-5.6-sol`
OpenAI	`openai/gpt-5.6-terra`
OpenAI	`openai/o1`
OpenAI	`openai/o1-2024-12-17`
OpenAI	`openai/o3`
OpenAI	`openai/o3-2025-04-16`
OpenAI	`openai/o3-mini`
OpenAI	`openai/o3-mini-2025-01-31`
OpenAI	`openai/o4-mini`
OpenAI	`openai/o4-mini-2025-04-16`
Perplexity	`perplexity/sonar`
Perplexity	`perplexity/sonar-deep-research`
Perplexity	`perplexity/sonar-pro`
Perplexity	`perplexity/sonar-reasoning-pro`
poolside	`poolside/poolside/laguna-m.1`
poolside	`poolside/poolside/laguna-xs-2.1`
scaleway	`scaleway/devstral-2-123b-instruct-2512`
scaleway	`scaleway/gpt-oss-120b`
scaleway	`scaleway/holo2-30b-a3b`
scaleway	`scaleway/llama-3.3-70b-instruct`
scaleway	`scaleway/mistral-small-3.2-24b-instruct-2506`
scaleway	`scaleway/pixtral-12b-2409`
scaleway	`scaleway/qwen3-235b-a22b-instruct-2507`
scaleway	`scaleway/qwen3-coder-30b-a3b-instruct`
scaleway	`scaleway/qwen3.5-397b-a17b`
scaleway	`scaleway/voxtral-small-24b-2507`
tencent	`tencent/deepseek-v4-flash`
tencent	`tencent/deepseek-v4-flash-202605`
tencent	`tencent/deepseek-v4-pro`
tencent	`tencent/deepseek-v4-pro-202606`
tencent	`tencent/glm-5`
tencent	`tencent/glm-5-turbo`
tencent	`tencent/glm-5.1`
tencent	`tencent/glm-5.2`
tencent	`tencent/glm-5v-turbo`
tencent	`tencent/hy-mt2-plus`
tencent	`tencent/kimi-k2.5`
tencent	`tencent/kimi-k2.6`
tencent	`tencent/minimax-m2.5`
tencent	`tencent/minimax-m2.7`
tencent	`tencent/minimax-m3`
tensorix	`tensorix/deepseek/deepseek-chat-v3.1`
tensorix	`tensorix/deepseek/deepseek-r1-0528`
tensorix	`tensorix/deepseek/deepseek-v3.2`
tensorix	`tensorix/deepseek/deepseek-v4-flash`
tensorix	`tensorix/deepseek/deepseek-v4-pro`
tensorix	`tensorix/meta-llama/llama-3.3-70b-instruct`
tensorix	`tensorix/meta-llama/llama-4-maverick`
tensorix	`tensorix/minimax/minimax-m2`
tensorix	`tensorix/minimax/minimax-m2.5`
tensorix	`tensorix/minimax/minimax-m3`
tensorix	`tensorix/moonshotai/kimi-k2.5`
tensorix	`tensorix/moonshotai/Kimi-K2.6`
tensorix	`tensorix/moonshotai/kimi-k2.7-code`
tensorix	`tensorix/nvidia/nemotron-3-super-120b-a12b`
tensorix	`tensorix/openai/gpt-oss-120b`
tensorix	`tensorix/openai/gpt-oss-20b`
tensorix	`tensorix/qwen/qwen3-235b-a22b-2507`
tensorix	`tensorix/qwen/qwen3-coder-30b-a3b-instruct`
tensorix	`tensorix/qwen/qwen3-vl-235b-a22b-instruct`
tensorix	`tensorix/qwen/qwen3.5-122b-a10b`
tensorix	`tensorix/qwen/qwen3.5-9b`
tensorix	`tensorix/xiaomi/mimo-v2.5`
tensorix	`tensorix/z-ai/glm-4.6`
tensorix	`tensorix/z-ai/glm-4.7`
tensorix	`tensorix/z-ai/glm-5`
tensorix	`tensorix/z-ai/glm-5-turbo`
tensorix	`tensorix/z-ai/glm-5.1`
tensorix	`tensorix/z-ai/glm-5.2`
tensorix	`tensorix/z-ai/glm-5v-turbo`
Together AI	`togetherai/deepseek-ai/DeepSeek-R1`
Together AI	`togetherai/deepseek-ai/DeepSeek-V3`
Together AI	`togetherai/deepseek-ai/DeepSeek-V3.1`
Together AI	`togetherai/meta-llama/Llama-3.3-70B-Instruct-Turbo`
Together AI	`togetherai/meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8`
Together AI	`togetherai/meta-llama/Llama-4-Scout-17B-16E-Instruct`
Together AI	`togetherai/meta-llama/Llama-Guard-4-12B`
Together AI	`togetherai/moonshotai/Kimi-K2.6`
Wafer	`wafer/GLM-5.1`
Wafer	`wafer/Kimi-K2.6`
Wafer	`wafer/Qwen3.5-397B-A17B`
Wafer	`wafer/Qwen3.6-35B-A3B`
xai	`xai/grok-3`
xai	`xai/grok-3-fast`
xai	`xai/grok-3-fast-latest`
xai	`xai/grok-3-latest`
xai	`xai/grok-3-mini`
xai	`xai/grok-3-mini-fast`
xai	`xai/grok-3-mini-fast-latest`
xai	`xai/grok-3-mini-latest`
xai	`xai/grok-4`
xai	`xai/grok-4-0709`
xai	`xai/grok-4-1-fast`
xai	`xai/grok-4-1-fast-non-reasoning`
xai	`xai/grok-4-1-fast-reasoning`
xai	`xai/grok-4-fast`
xai	`xai/grok-4-fast-non-reasoning`
xai	`xai/grok-4.20-0309-non-reasoning`
xai	`xai/grok-4.20-0309-reasoning`
xai	`xai/grok-4.20-beta-latest-non-reasoning`
xai	`xai/grok-4.20-beta-latest-reasoning`
xai	`xai/grok-4.20-multi-agent-0309`
xai	`xai/grok-4.20-multi-agent-beta-latest`
xai	`xai/grok-code-fast-1`
Z AI	`zai/glm-4.5`
Z AI	`zai/glm-4.5-air`
Z AI	`zai/glm-4.5-flash`
Z AI	`zai/glm-4.5v`
Z AI	`zai/glm-4.6`
Z AI	`zai/glm-4.6v`
Z AI	`zai/glm-4.7`
Z AI	`zai/glm-4.7-flash`
Z AI	`zai/glm-4.7-flashx`
Z AI	`zai/glm-5`
Z AI	`zai/glm-5-turbo`
Z AI	`zai/glm-5.1`
Z AI	`zai/glm-5.2`
Z AI	`zai/glm-5v-turbo`

Chat models

curl https://api.orq.ai/v3/router/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/gpt-4o",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

completion = client.chat.completions.create(
  model="openai/gpt-4o",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Hello!"}
  ]
)

print(completion.choices[0].message)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const completion = await client.chat.completions.create({
    messages: [{ role: "system", content: "You are a helpful assistant." }],
    model: "openai/gpt-4o"
  });

  console.log(completion.choices[0]);
}

main();

Provider	Model
Alibaba	`alibaba/deepseek-v4-flash`
Alibaba	`alibaba/deepseek-v4-pro`
Alibaba	`alibaba/kimi-k2.5`
Alibaba	`alibaba/kimi-k2.6`
Alibaba	`alibaba/qwen-mt-flash`
Alibaba	`alibaba/qwen-mt-lite`
Alibaba	`alibaba/qwen-plus`
Alibaba	`alibaba/qwen-plus-2025-12-01`
Alibaba	`alibaba/qwen3-max`
Alibaba	`alibaba/qwen3-vl-flash`
Alibaba	`alibaba/qwen3-vl-flash-2025-10-15`
Alibaba	`alibaba/qwen3-vl-plus`
Alibaba	`alibaba/qwen3.5-122b-a10b`
Alibaba	`alibaba/qwen3.5-27b`
Alibaba	`alibaba/qwen3.5-35b-a3b`
Alibaba	`alibaba/qwen3.5-flash`
Alibaba	`alibaba/qwen3.5-flash-2026-02-23`
Alibaba	`alibaba/qwen3.6-35b-a3b`
Alibaba	`alibaba/qwen3.6-flash`
Alibaba	`alibaba/qwen3.6-plus`
Alibaba	`alibaba/qwen3.6-plus-2026-04-02`
Anthropic	`anthropic/claude-fable-5`
Anthropic	`anthropic/claude-haiku-4-5`
Anthropic	`anthropic/claude-haiku-4-5-20251001`
Anthropic	`anthropic/claude-opus-4-0`
Anthropic	`anthropic/claude-opus-4-1`
Anthropic	`anthropic/claude-opus-4-1-20250805`
Anthropic	`anthropic/claude-opus-4-20250514`
Anthropic	`anthropic/claude-opus-4-5`
Anthropic	`anthropic/claude-opus-4-5-20251101`
Anthropic	`anthropic/claude-opus-4-6`
Anthropic	`anthropic/claude-opus-4-7`
Anthropic	`anthropic/claude-opus-4-8`
Anthropic	`anthropic/claude-sonnet-4-0`
Anthropic	`anthropic/claude-sonnet-4-20250514`
Anthropic	`anthropic/claude-sonnet-4-5`
Anthropic	`anthropic/claude-sonnet-4-5-20250929`
Anthropic	`anthropic/claude-sonnet-4-6`
Anthropic	`anthropic/claude-sonnet-5`
AWS Bedrock	`aws/apac.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/apac.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/apac.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/apac.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/au.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/au.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/eu.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-fable-5`
AWS Bedrock	`aws/eu.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-6-v1`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-7`
AWS Bedrock	`aws/eu.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/eu.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/global.anthropic.claude-fable-5`
AWS Bedrock	`aws/global.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-6-v1`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-7`
AWS Bedrock	`aws/global.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/global.anthropic.claude-sonnet-5`
AWS Bedrock	`aws/jp.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/jp.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/meta.llama3-1-405b-instruct-v1:0`
AWS Bedrock	`aws/minimax.minimax-m2.5`
AWS Bedrock	`aws/mistral.devstral-2-123b`
AWS Bedrock	`aws/mistral.magistral-small-2509`
AWS Bedrock	`aws/mistral.ministral-3-3b-instruct`
AWS Bedrock	`aws/mistral.mistral-large-3-675b-instruct`
AWS Bedrock	`aws/mistral.pixtral-large-2502-v1:0`
AWS Bedrock	`aws/nvidia.nemotron-nano-3-30b`
AWS Bedrock	`aws/nvidia.nemotron-super-3-120b`
AWS Bedrock	`aws/qwen.qwen3-coder-next`
AWS Bedrock	`aws/us.amazon.nova-2-lite-v1:0`
AWS Bedrock	`aws/us.amazon.nova-lite-v1:0`
AWS Bedrock	`aws/us.amazon.nova-micro-v1:0`
AWS Bedrock	`aws/us.amazon.nova-pro-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-fable-5`
AWS Bedrock	`aws/us.anthropic.claude-haiku-4-5-20251001-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-1-20250805-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-5-20251101-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-opus-4-8`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-20250514-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-5-20250929-v1:0`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-4-6`
AWS Bedrock	`aws/us.anthropic.claude-sonnet-5`
AWS Bedrock	`aws/zai.glm-5`
Azure	`azure/eu.gpt-5.6-luna`
Azure	`azure/eu.gpt-5.6-terra`
Azure	`azure/global.gpt-5.6-luna`
Azure	`azure/global.gpt-5.6-terra`
Azure	`azure/gpt-4.1`
Azure	`azure/gpt-4.1-mini`
Azure	`azure/gpt-4.1-nano`
Azure	`azure/gpt-4o`
Azure	`azure/gpt-4o-mini`
Azure	`azure/gpt-5-chat`
Azure	`azure/gpt-5-mini`
Azure	`azure/gpt-5-nano`
Azure	`azure/gpt-5.4`
Azure	`azure/gpt-5.6-sol`
Azure	`azure/gpt-5.6-sol-global`
Azure	`azure/o1`
Azure	`azure/o1-mini`
Azure	`azure/o3-mini`
Cerebras	`cerebras/gpt-oss-120b`
Cerebras	`cerebras/llama3.1-8b`
Cerebras	`cerebras/qwen-3-235b-a22b-instruct-2507`
Cerebras	`cerebras/zai-glm-4.7`
Cohere	`cohere/c4ai-aya-expanse-32b`
Cohere	`cohere/c4ai-aya-expanse-8b`
Cohere	`cohere/c4ai-aya-vision-32b`
Cohere	`cohere/c4ai-aya-vision-8b`
Cohere	`cohere/command-a-03-2025`
Cohere	`cohere/command-a-reasoning-08-2025`
Cohere	`cohere/command-a-translate-08-2025`
Cohere	`cohere/command-a-vision-07-2025`
Cohere	`cohere/command-r-08-2024`
Cohere	`cohere/command-r-plus-08-2024`
Cohere	`cohere/command-r7b-12-2024`
Cohere	`cohere/command-r7b-arabic-02-2025`
Deepseek	`deepseek/deepseek-chat`
Deepseek	`deepseek/deepseek-reasoner`
Deepseek	`deepseek/deepseek-v4-flash`
Deepseek	`deepseek/deepseek-v4-pro`
Vertex AI	`google/claude-haiku-4-5`
Vertex AI	`google/claude-opus-4-1@20250805`
Vertex AI	`google/claude-opus-4-5@20251101`
Vertex AI	`google/claude-opus-4-6`
Vertex AI	`google/claude-opus-4-7`
Vertex AI	`google/claude-opus-4-8`
Vertex AI	`google/claude-opus-4@20250514`
Vertex AI	`google/claude-sonnet-4-5@20250929`
Vertex AI	`google/claude-sonnet-4-6`
Vertex AI	`google/claude-sonnet-4@20250514`
Vertex AI	`google/deepseek-ai/deepseek-v3.1-maas`
Vertex AI	`google/eu.claude-fable-5`
Vertex AI	`google/eu.claude-opus-4-7`
Vertex AI	`google/eu.claude-opus-4-8`
Vertex AI	`google/eu.claude-sonnet-5`
Vertex AI	`google/eu.gemini-3.5-flash`
Vertex AI	`google/gemini-2.0-flash`
Vertex AI	`google/gemini-2.0-flash-001`
Vertex AI	`google/gemini-2.0-flash-lite-001`
Vertex AI	`google/gemini-2.5-flash`
Vertex AI	`google/gemini-2.5-flash-lite`
Vertex AI	`google/gemini-2.5-flash-lite-preview-09-2025`
Vertex AI	`google/gemini-2.5-pro`
Vertex AI	`google/gemini-3-flash-preview`
Vertex AI	`google/gemini-3.1-flash-lite`
Vertex AI	`google/gemini-3.1-flash-lite-preview`
Vertex AI	`google/gemini-3.1-pro-preview`
Vertex AI	`google/gemini-3.5-flash`
Vertex AI	`google/global.claude-fable-5`
Vertex AI	`google/global.claude-opus-4-7`
Vertex AI	`google/global.claude-opus-4-8`
Vertex AI	`google/global.claude-sonnet-5`
Vertex AI	`google/meta/llama-3.3-70b-instruct-maas`
Vertex AI	`google/meta/llama-4-scout-17b-16e-instruct-maas`
Vertex AI	`google/mistral-small-2503`
Vertex AI	`google/openai/gpt-oss-120b-maas`
Vertex AI	`google/openai/gpt-oss-20b-maas`
Vertex AI	`google/qwen/qwen3-235b-a22b-instruct-2507-maas`
Vertex AI	`google/us.claude-fable-5`
Vertex AI	`google/us.claude-opus-4-7`
Vertex AI	`google/us.claude-opus-4-8`
Vertex AI	`google/us.claude-sonnet-5`
Vertex AI	`google/us.gemini-3.5-flash`
Vertex AI	`google/zai-org/glm-4.7-maas`
Vertex AI	`google/zai-org/glm-5-maas`
Vertex AI	`google/zai-org/glm-5.1-maas`
Google AI	`google-ai/gemini-2.0-flash`
Google AI	`google-ai/gemini-2.0-flash-001`
Google AI	`google-ai/gemini-2.0-flash-lite`
Google AI	`google-ai/gemini-2.0-flash-lite-001`
Google AI	`google-ai/gemini-2.5-flash`
Google AI	`google-ai/gemini-2.5-flash-lite`
Google AI	`google-ai/gemini-2.5-flash-lite-preview-09-2025`
Google AI	`google-ai/gemini-2.5-pro`
Google AI	`google-ai/gemini-3-flash-preview`
Google AI	`google-ai/gemini-3-pro-preview`
Google AI	`google-ai/gemini-3.1-flash-lite`
Google AI	`google-ai/gemini-3.1-flash-lite-preview`
Google AI	`google-ai/gemini-3.1-pro-preview`
Google AI	`google-ai/gemini-3.1-pro-preview-customtools`
Google AI	`google-ai/gemini-3.5-flash`
Google AI	`google-ai/gemini-flash-latest`
Google AI	`google-ai/gemini-flash-lite-latest`
Google AI	`google-ai/gemma-3-12b-it`
Google AI	`google-ai/gemma-3-27b-it`
Google AI	`google-ai/gemma-3-4b-it`
Google AI	`google-ai/gemma-3n-e2b-it`
Google AI	`google-ai/gemma-3n-e4b-it`
Google AI	`google-ai/gemma-4-26b-a4b-it`
Google AI	`google-ai/gemma-4-31b-it`
Groq	`groq/allam-2-7b`
Groq	`groq/compound`
Groq	`groq/compound-mini`
Groq	`groq/llama-3.1-8b-instant`
Groq	`groq/llama-3.3-70b-versatile`
Groq	`groq/meta-llama/llama-4-scout-17b-16e-instruct`
Groq	`groq/meta-llama/llama-prompt-guard-2-22m`
Groq	`groq/meta-llama/llama-prompt-guard-2-86m`
Groq	`groq/moonshotai/kimi-k2-instruct-0905`
Groq	`groq/openai/gpt-oss-120b`
Groq	`groq/openai/gpt-oss-20b`
Groq	`groq/openai/gpt-oss-safeguard-20b`
Groq	`groq/qwen/qwen3-32b`
hcompany	`hcompany/holo3-122b-a10b`
hcompany	`hcompany/holo3-35b-a3b`
inceptron	`inceptron/MiniMaxAI/MiniMax-M2.5`
inceptron	`inceptron/moonshotai/Kimi-K2.6`
inceptron	`inceptron/moonshotai/Kimi-K2.7-Code`
inceptron	`inceptron/zai-org/GLM-5.2`
Minimax	`minimax/minimax-m2`
Minimax	`minimax/minimax-m2-her`
Minimax	`minimax/minimax-m2.1`
Minimax	`minimax/minimax-m2.1-lightning`
Minimax	`minimax/minimax-m2.5`
Minimax	`minimax/MiniMax-M2.5-highspeed`
Minimax	`minimax/minimax-m2.5-lightning`
Minimax	`minimax/MiniMax-M2.7`
Minimax	`minimax/MiniMax-M2.7-highspeed`
Minimax	`minimax/MiniMax-M3`
Mistral	`mistral/codestral-2508`
Mistral	`mistral/codestral-latest`
Mistral	`mistral/devstral-2512`
Mistral	`mistral/devstral-latest`
Mistral	`mistral/devstral-medium-latest`
Mistral	`mistral/magistral-medium-2509`
Mistral	`mistral/magistral-medium-latest`
Mistral	`mistral/magistral-small-2509`
Mistral	`mistral/magistral-small-latest`
Mistral	`mistral/ministral-14b-2512`
Mistral	`mistral/ministral-14b-latest`
Mistral	`mistral/ministral-3b-2512`
Mistral	`mistral/ministral-3b-latest`
Mistral	`mistral/ministral-8b-2512`
Mistral	`mistral/ministral-8b-latest`
Mistral	`mistral/mistral-large-2512`
Mistral	`mistral/mistral-large-latest`
Mistral	`mistral/mistral-medium`
Mistral	`mistral/mistral-medium-2505`
Mistral	`mistral/mistral-medium-2508`
Mistral	`mistral/mistral-medium-2604`
Mistral	`mistral/mistral-medium-3`
Mistral	`mistral/mistral-medium-3.5`
Mistral	`mistral/mistral-medium-latest`
Mistral	`mistral/mistral-small-2506`
Mistral	`mistral/mistral-small-2603`
Mistral	`mistral/mistral-small-latest`
Mistral	`mistral/mistral-tiny-2407`
Mistral	`mistral/mistral-tiny-latest`
Mistral	`mistral/open-mistral-nemo`
Mistral	`mistral/open-mistral-nemo-2407`
Mistral	`mistral/voxtral-small-2507`
Mistral	`mistral/voxtral-small-latest`
Moonshot AI	`moonshotai/kimi-k2-0711-preview`
Moonshot AI	`moonshotai/kimi-k2-0905-preview`
Moonshot AI	`moonshotai/kimi-k2-thinking`
Moonshot AI	`moonshotai/kimi-k2-thinking-turbo`
Moonshot AI	`moonshotai/kimi-k2-turbo-preview`
Moonshot AI	`moonshotai/kimi-k2.5`
Moonshot AI	`moonshotai/kimi-k2.6`
Moonshot AI	`moonshotai/kimi-k2.7-code`
nebius	`nebius/deepseek-ai/DeepSeek-V4-Pro`
nebius	`nebius/google/gemma-3-27b-it`
nebius	`nebius/meta-llama/Llama-3.3-70B-Instruct`
nebius	`nebius/MiniMaxAI/MiniMax-M2.5`
nebius	`nebius/MiniMaxAI/MiniMax-M3`
nebius	`nebius/moonshotai/Kimi-K2.6`
nebius	`nebius/moonshotai/Kimi-K2.7-Code`
nebius	`nebius/NousResearch/Hermes-4-405B`
nebius	`nebius/NousResearch/Hermes-4-70B`
nebius	`nebius/nvidia/Cosmos3-Super-Reasoner`
nebius	`nebius/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1`
nebius	`nebius/nvidia/Nemotron-3-Nano-Omni`
nebius	`nebius/nvidia/nemotron-3-super-120b-a12b`
nebius	`nebius/nvidia/Nemotron-3-Ultra-550b-a55b`
nebius	`nebius/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B`
nebius	`nebius/openai/gpt-oss-120b`
nebius	`nebius/openbmb/MiniCPM-V-4_5`
nebius	`nebius/Qwen/Qwen2.5-VL-72B-Instruct`
nebius	`nebius/Qwen/Qwen3-235B-A22B-Instruct-2507`
nebius	`nebius/Qwen/Qwen3-30B-A3B-Instruct-2507`
nebius	`nebius/Qwen/Qwen3-32B`
nebius	`nebius/Qwen/Qwen3-Next-80B-A3B-Thinking`
nebius	`nebius/Qwen/Qwen3.5-397B-A17B`
nebius	`nebius/zai-org/GLM-5.1`
nebius	`nebius/zai-org/GLM-5.2`
OpenAI	`openai/gpt-3.5-turbo`
OpenAI	`openai/gpt-3.5-turbo-0125`
OpenAI	`openai/gpt-3.5-turbo-16k`
OpenAI	`openai/gpt-4-0125-preview`
OpenAI	`openai/gpt-4-turbo`
OpenAI	`openai/gpt-4-turbo-2024-04-09`
OpenAI	`openai/gpt-4.1`
OpenAI	`openai/gpt-4.1-2025-04-14`
OpenAI	`openai/gpt-4.1-mini`
OpenAI	`openai/gpt-4.1-mini-2025-04-14`
OpenAI	`openai/gpt-4.1-nano`
OpenAI	`openai/gpt-4.1-nano-2025-04-14`
OpenAI	`openai/gpt-4o`
OpenAI	`openai/gpt-4o-2024-05-13`
OpenAI	`openai/gpt-4o-2024-08-06`
OpenAI	`openai/gpt-4o-2024-11-20`
OpenAI	`openai/gpt-4o-mini`
OpenAI	`openai/gpt-4o-mini-2024-07-18`
OpenAI	`openai/gpt-4o-mini-search-preview`
OpenAI	`openai/gpt-4o-mini-search-preview-2025-03-11`
OpenAI	`openai/gpt-4o-search-preview`
OpenAI	`openai/gpt-4o-search-preview-2025-03-11`
OpenAI	`openai/gpt-5`
OpenAI	`openai/gpt-5-2025-08-07`
OpenAI	`openai/gpt-5-chat-latest`
OpenAI	`openai/gpt-5-codex`
OpenAI	`openai/gpt-5-mini`
OpenAI	`openai/gpt-5-mini-2025-08-07`
OpenAI	`openai/gpt-5-nano`
OpenAI	`openai/gpt-5-nano-2025-08-07`
OpenAI	`openai/gpt-5.1`
OpenAI	`openai/gpt-5.1-2025-11-13`
OpenAI	`openai/gpt-5.1-chat-latest`
OpenAI	`openai/gpt-5.1-codex`
OpenAI	`openai/gpt-5.1-codex-max`
OpenAI	`openai/gpt-5.1-codex-mini`
OpenAI	`openai/gpt-5.2`
OpenAI	`openai/gpt-5.2-2025-12-11`
OpenAI	`openai/gpt-5.2-chat-latest`
OpenAI	`openai/gpt-5.2-codex`
OpenAI	`openai/gpt-5.3-chat-latest`
OpenAI	`openai/gpt-5.3-codex`
OpenAI	`openai/gpt-5.4`
OpenAI	`openai/gpt-5.4-2026-03-05`
OpenAI	`openai/gpt-5.4-mini`
OpenAI	`openai/gpt-5.4-mini-2026-03-17`
OpenAI	`openai/gpt-5.4-nano`
OpenAI	`openai/gpt-5.4-nano-2026-03-17`
OpenAI	`openai/gpt-5.6-luna`
OpenAI	`openai/gpt-5.6-sol`
OpenAI	`openai/gpt-5.6-terra`
OpenAI	`openai/o1`
OpenAI	`openai/o1-2024-12-17`
OpenAI	`openai/o3`
OpenAI	`openai/o3-2025-04-16`
OpenAI	`openai/o3-mini`
OpenAI	`openai/o3-mini-2025-01-31`
OpenAI	`openai/o4-mini`
OpenAI	`openai/o4-mini-2025-04-16`
Perplexity	`perplexity/sonar`
Perplexity	`perplexity/sonar-deep-research`
Perplexity	`perplexity/sonar-pro`
Perplexity	`perplexity/sonar-reasoning-pro`
poolside	`poolside/poolside/laguna-m.1`
poolside	`poolside/poolside/laguna-xs-2.1`
scaleway	`scaleway/devstral-2-123b-instruct-2512`
scaleway	`scaleway/gpt-oss-120b`
scaleway	`scaleway/holo2-30b-a3b`
scaleway	`scaleway/llama-3.3-70b-instruct`
scaleway	`scaleway/mistral-small-3.2-24b-instruct-2506`
scaleway	`scaleway/pixtral-12b-2409`
scaleway	`scaleway/qwen3-235b-a22b-instruct-2507`
scaleway	`scaleway/qwen3-coder-30b-a3b-instruct`
scaleway	`scaleway/qwen3.5-397b-a17b`
scaleway	`scaleway/voxtral-small-24b-2507`
tencent	`tencent/deepseek-v4-flash`
tencent	`tencent/deepseek-v4-flash-202605`
tencent	`tencent/deepseek-v4-pro`
tencent	`tencent/deepseek-v4-pro-202606`
tencent	`tencent/glm-5`
tencent	`tencent/glm-5-turbo`
tencent	`tencent/glm-5.1`
tencent	`tencent/glm-5.2`
tencent	`tencent/glm-5v-turbo`
tencent	`tencent/hy-mt2-plus`
tencent	`tencent/kimi-k2.5`
tencent	`tencent/kimi-k2.6`
tencent	`tencent/minimax-m2.5`
tencent	`tencent/minimax-m2.7`
tencent	`tencent/minimax-m3`
tensorix	`tensorix/deepseek/deepseek-chat-v3.1`
tensorix	`tensorix/deepseek/deepseek-r1-0528`
tensorix	`tensorix/deepseek/deepseek-v3.2`
tensorix	`tensorix/deepseek/deepseek-v4-flash`
tensorix	`tensorix/deepseek/deepseek-v4-pro`
tensorix	`tensorix/meta-llama/llama-3.3-70b-instruct`
tensorix	`tensorix/meta-llama/llama-4-maverick`
tensorix	`tensorix/minimax/minimax-m2`
tensorix	`tensorix/minimax/minimax-m2.5`
tensorix	`tensorix/minimax/minimax-m3`
tensorix	`tensorix/moonshotai/kimi-k2.5`
tensorix	`tensorix/moonshotai/Kimi-K2.6`
tensorix	`tensorix/moonshotai/kimi-k2.7-code`
tensorix	`tensorix/nvidia/nemotron-3-super-120b-a12b`
tensorix	`tensorix/openai/gpt-oss-120b`
tensorix	`tensorix/openai/gpt-oss-20b`
tensorix	`tensorix/qwen/qwen3-235b-a22b-2507`
tensorix	`tensorix/qwen/qwen3-coder-30b-a3b-instruct`
tensorix	`tensorix/qwen/qwen3-vl-235b-a22b-instruct`
tensorix	`tensorix/qwen/qwen3.5-122b-a10b`
tensorix	`tensorix/qwen/qwen3.5-9b`
tensorix	`tensorix/xiaomi/mimo-v2.5`
tensorix	`tensorix/z-ai/glm-4.6`
tensorix	`tensorix/z-ai/glm-4.7`
tensorix	`tensorix/z-ai/glm-5`
tensorix	`tensorix/z-ai/glm-5-turbo`
tensorix	`tensorix/z-ai/glm-5.1`
tensorix	`tensorix/z-ai/glm-5.2`
tensorix	`tensorix/z-ai/glm-5v-turbo`
Together AI	`togetherai/deepseek-ai/DeepSeek-R1`
Together AI	`togetherai/deepseek-ai/DeepSeek-V3`
Together AI	`togetherai/deepseek-ai/DeepSeek-V3.1`
Together AI	`togetherai/meta-llama/Llama-3.3-70B-Instruct-Turbo`
Together AI	`togetherai/meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8`
Together AI	`togetherai/meta-llama/Llama-4-Scout-17B-16E-Instruct`
Together AI	`togetherai/meta-llama/Llama-Guard-4-12B`
Together AI	`togetherai/moonshotai/Kimi-K2.6`
Wafer	`wafer/GLM-5.1`
Wafer	`wafer/Kimi-K2.6`
Wafer	`wafer/Qwen3.5-397B-A17B`
Wafer	`wafer/Qwen3.6-35B-A3B`
xai	`xai/grok-3`
xai	`xai/grok-3-fast`
xai	`xai/grok-3-fast-latest`
xai	`xai/grok-3-latest`
xai	`xai/grok-3-mini`
xai	`xai/grok-3-mini-fast`
xai	`xai/grok-3-mini-fast-latest`
xai	`xai/grok-3-mini-latest`
xai	`xai/grok-4`
xai	`xai/grok-4-0709`
xai	`xai/grok-4-1-fast`
xai	`xai/grok-4-1-fast-non-reasoning`
xai	`xai/grok-4-1-fast-reasoning`
xai	`xai/grok-4-fast`
xai	`xai/grok-4-fast-non-reasoning`
xai	`xai/grok-4.20-0309-non-reasoning`
xai	`xai/grok-4.20-0309-reasoning`
xai	`xai/grok-4.20-beta-latest-non-reasoning`
xai	`xai/grok-4.20-beta-latest-reasoning`
xai	`xai/grok-4.20-multi-agent-0309`
xai	`xai/grok-4.20-multi-agent-beta-latest`
xai	`xai/grok-code-fast-1`
Z AI	`zai/glm-4.5`
Z AI	`zai/glm-4.5-air`
Z AI	`zai/glm-4.5-flash`
Z AI	`zai/glm-4.5v`
Z AI	`zai/glm-4.6`
Z AI	`zai/glm-4.6v`
Z AI	`zai/glm-4.7`
Z AI	`zai/glm-4.7-flash`
Z AI	`zai/glm-4.7-flashx`
Z AI	`zai/glm-5`
Z AI	`zai/glm-5-turbo`
Z AI	`zai/glm-5.1`
Z AI	`zai/glm-5.2`
Z AI	`zai/glm-5v-turbo`

Completion models

curl https://api.orq.ai/v3/router/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/gpt-3.5-turbo-instruct",
    "prompt": "Once upon a time",
    "max_tokens": 100
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

completion = client.completions.create(
  model="openai/gpt-3.5-turbo-instruct",
  prompt="Once upon a time",
  max_tokens=100
)

print(completion.choices[0].text)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const completion = await client.completions.create({
    model: "openai/gpt-3.5-turbo-instruct",
    prompt: "Once upon a time",
    max_tokens: 100
  });

  console.log(completion.choices[0].text);
}

main();

Provider	Model
OpenAI	`openai/gpt-3.5-turbo-instruct`

Embedding models

curl https://api.orq.ai/v3/router/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/text-embedding-3-small",
    "input": "Hello world"
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

embedding = client.embeddings.create(
  model="openai/text-embedding-3-small",
  input="Hello world"
)

print(embedding.data[0].embedding)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const embedding = await client.embeddings.create({
    model: "openai/text-embedding-3-small",
    input: "Hello world"
  });

  console.log(embedding.data[0].embedding);
}

main();

Provider	Model
AWS Bedrock	`aws/amazon.titan-embed-g1-text-02`
AWS Bedrock	`aws/amazon.titan-embed-image-v1`
AWS Bedrock	`aws/amazon.titan-embed-text-v2:0`
Azure	`azure/text-embedding-3-small`
Azure	`azure/text-embedding-ada-002`
Cohere	`cohere/embed-english-light-v3.0`
Cohere	`cohere/embed-english-v3.0`
Cohere	`cohere/embed-multilingual-light-v3.0`
Cohere	`cohere/embed-multilingual-v3.0`
Cohere	`cohere/embed-v4.0`
Vertex AI	`google/gemini-embedding-001`
Vertex AI	`google/gemini-embedding-2`
Vertex AI	`google/multimodalembedding@001`
Vertex AI	`google/text-multilingual-embedding-002`
Google AI	`google-ai/gemini-embedding-001`
Google AI	`google-ai/gemini-embedding-2`
Google AI	`google-ai/text-embedding-004`
Jina AI	`jina/jina-clip-v1`
Jina AI	`jina/jina-clip-v2`
Jina AI	`jina/jina-embeddings-v2-base-code`
Jina AI	`jina/jina-embeddings-v2-base-de`
Jina AI	`jina/jina-embeddings-v2-base-en`
Jina AI	`jina/jina-embeddings-v2-base-es`
Jina AI	`jina/jina-embeddings-v2-base-zh`
Jina AI	`jina/jina-embeddings-v3`
Mistral	`mistral/codestral-embed`
Mistral	`mistral/codestral-embed-2505`
Mistral	`mistral/mistral-embed`
Mistral	`mistral/mistral-embed-2312`
nebius	`nebius/Qwen/Qwen3-Embedding-8B`
OpenAI	`openai/text-embedding-3-large`
OpenAI	`openai/text-embedding-3-small`
OpenAI	`openai/text-embedding-ada-002`
scaleway	`scaleway/bge-multilingual-gemma2`
scaleway	`scaleway/qwen3-embedding-8b`
tensorix	`tensorix/qwen/qwen3-embedding-8b`

Image models

Image Generation

curl https://api.orq.ai/v3/router/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/dall-e-3",
    "prompt": "A beautiful sunset over mountains",
    "n": 1,
    "size": "1024x1024"
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

response = client.images.generate(
  model="openai/dall-e-3",
  prompt="A beautiful sunset over mountains",
  n=1,
  size="1024x1024"
)

print(response.data[0].url)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const response = await client.images.generate({
    model: "openai/dall-e-3",
    prompt: "A beautiful sunset over mountains",
    n: 1,
    size: "1024x1024"
  });

  console.log(response.data[0].url);
}

main();

Image Edit

curl https://api.orq.ai/v3/router/images/edits \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -F model="openai/gpt-image-1" \
  -F image="@body-lotion.png" \
  -F image="@bath-bomb.png" \
  -F image="@incense-kit.png" \
  -F image="@soap.png" \
  -F prompt="Generate a photorealistic image of a gift basket on a white background labeled 'Relax & Unwind' with a ribbon and handwriting-like font, containing all the items in the reference pictures."

import base64
from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

prompt = """
Generate a photorealistic image of a gift basket on a white background
labeled 'Relax & Unwind' with a ribbon and handwriting-like font,
containing all the items in the reference pictures.
"""

result = client.images.edit(
    model="openai/gpt-image-1",
    image=[
        open("body-lotion.png", "rb"),
        open("bath-bomb.png", "rb"),
        open("incense-kit.png", "rb"),
        open("soap.png", "rb"),
    ],
    prompt=prompt
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# Save the image to a file
with open("gift-basket.png", "wb") as f:
    f.write(image_bytes)

import fs from "fs";
import OpenAI, { toFile } from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

const imageFiles = [
    "bath-bomb.png",
    "body-lotion.png",
    "incense-kit.png",
    "soap.png",
];

const images = await Promise.all(
    imageFiles.map(async (file) =>
        await toFile(fs.createReadStream(file), null, {
            type: "image/png",
        })
    ),
);

const response = await client.images.edit({
    model: "openai/gpt-image-1",
    image: images,
    prompt: "Create a lovely gift basket with these four items in it",
});

// Save the image to a file
const image_base64 = response.data[0].b64_json;
const image_bytes = Buffer.from(image_base64, "base64");
fs.writeFileSync("basket.png", image_bytes);

Image Variations

curl https://api.orq.ai/v3/router/images/variations \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -F model="openai/dall-e-2" \
  -F image="@image_edit_original.png" \
  -F n=2 \
  -F size="1024x1024"

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

response = client.images.create_variation(
  model="openai/dall-e-2",
  image=open("image_edit_original.png", "rb"),
  n=2,
  size="1024x1024"
)

print(response.data[0].url)

import fs from "fs";
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const response = await client.images.createVariation({
    model: "openai/dall-e-2",
    image: fs.createReadStream("otter.png"),
    n: 2,
    size: "1024x1024"
  });

  console.log(response.data);
}

main();

Supported Image Models

Provider	Model	Capabilities
bytedance	`bytedance/seededit-3-0-i2i-250628`	Generation, Edit
bytedance	`bytedance/seedream-3-0-t2i-250415`	Generation
bytedance	`bytedance/seedream-4-0-250828`	Generation, Edit
bytedance	`bytedance/seedream-4-5-251128`	Generation, Edit
FAL	`fal/flux-2`	Generation
FAL	`fal/flux-2-flex`	Generation
FAL	`fal/flux-2-max`	Generation
FAL	`fal/flux-2-pro`	Generation
FAL	`fal/flux-pro/new`	Generation
FAL	`fal/flux/dev`	Generation
FAL	`fal/flux/schnell`	Generation
FAL	`fal/gemini-25-flash-image`	Generation
Vertex AI	`google/imagen-3.0-fast-generate-001`	Generation
Vertex AI	`google/imagen-3.0-generate-001`	Generation
Vertex AI	`google/imagen-4.0-fast-generate-001`	Generation
Vertex AI	`google/imagen-4.0-generate-001`	Generation
Vertex AI	`google/imagen-4.0-ultra-generate-001`	Generation
Google AI	`google-ai/gemini-3.1-flash-image`	Generation, Edit
Google AI	`google-ai/gemini-3.1-flash-image-preview`	Generation
Google AI	`google-ai/gemini-3.1-flash-lite-image`	Generation, Edit
Google AI	`google-ai/imagen-4.0-fast-generate-001`	Generation
Google AI	`google-ai/imagen-4.0-generate-001`	Generation
Google AI	`google-ai/imagen-4.0-ultra-generate-001`	Generation
Leonardo AI	`leonardoai/leonard-diffusion-xl`	Generation, Edit
Leonardo AI	`leonardoai/leonard-kino-xl`	Generation, Edit
Leonardo AI	`leonardoai/leonard-lightning-xl`	Generation, Edit
Leonardo AI	`leonardoai/leonard-vision-xl`	Generation, Edit
OpenAI	`openai/chatgpt-image-latest`	Generation
OpenAI	`openai/gpt-image-1`	Generation, Edit
OpenAI	`openai/gpt-image-1-mini`	Generation
OpenAI	`openai/gpt-image-1.5`	Generation, Edit
OpenAI	`openai/gpt-image-1.5-2025-12-16`	Generation, Edit
OpenAI	`openai/gpt-image-2`	Generation, Edit
OpenAI	`openai/gpt-image-2-2026-04-21`	Generation, Edit
Z AI	`zai/cogview-4-250304`	Generation

Moderations models

curl https://api.orq.ai/v3/router/moderations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "openai/text-moderation-latest",
    "input": "I want to check if this text is appropriate."
  }'

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

response = client.moderations.create(
  model="openai/text-moderation-latest",
  input="I want to check if this text is appropriate."
)

print(response.results[0])

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const response = await client.moderations.create({
    model: "openai/text-moderation-latest",
    input: "I want to check if this text is appropriate.",
  });

  console.log(response.results[0]);
}

main();

Provider	Model
Mistral	`mistral/mistral-moderation-2411`
Mistral	`mistral/mistral-moderation-2603`
OpenAI	`openai/omni-moderation-2024-09-26`
OpenAI	`openai/omni-moderation-latest`
OpenAI	`openai/text-moderation-007`
OpenAI	`openai/text-moderation-latest`
OpenAI	`openai/text-moderation-stable`

Rerank models

curl https://api.orq.ai/v3/router/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -d '{
    "model": "cohere/rerank-english-v3.0",
    "query": "What is machine learning?",
    "documents": [
      "Machine learning is a branch of AI",
      "Machine learning uses data to improve",
      "AI is changing the world"
    ]
  }'

Provider	Model
AWS Bedrock	`aws/amazon.rerank-v1:0`
Cohere	`cohere/rerank-english-v3.0`
Cohere	`cohere/rerank-multilingual-v3.0`
Cohere	`cohere/rerank-v3.5`
Cohere	`cohere/rerank-v4.0-fast`
Cohere	`cohere/rerank-v4.0-pro`
Jina AI	`jina/jina-colbert-v2`
Jina AI	`jina/jina-reranker-v1-base-en`
Jina AI	`jina/jina-reranker-v1-tiny-en`
Jina AI	`jina/jina-reranker-v1-turbo-en`
Jina AI	`jina/jina-reranker-v2-base-multilingual`

Speech-to-Text models

curl https://api.orq.ai/v3/router/audio/transcriptions \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -F file="@/path/to/audio.mp3" \
  -F model="openai/whisper-1"

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

audio_file = open("speech.mp3", "rb")
transcript = client.audio.transcriptions.create(
  model="openai/whisper-1",
  file=audio_file
)

print(transcript.text)

import OpenAI from "openai";
import fs from "fs";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const transcript = await client.audio.transcriptions.create({
    file: fs.createReadStream("speech.mp3"),
    model: "openai/whisper-1",
  });

  console.log(transcript.text);
}

main();

Provider	Model
Azure	`azure/whisper`
Eleven Labs	`elevenlabs/scribe_v1`
Groq	`groq/whisper-large-v3`
Groq	`groq/whisper-large-v3-turbo`
Mistral	`mistral/voxtral-mini-2507`
OpenAI	`openai/gpt-4o-mini-transcribe`
OpenAI	`openai/gpt-4o-transcribe`
OpenAI	`openai/whisper-1`
reson8	`reson8/prerecorded`
scaleway	`scaleway/whisper-large-v3`
tensorix	`tensorix/Systran/faster-whisper-large-v3`

Text-to-Speech models

curl https://api.orq.ai/v3/router/audio/speech \
  -H "Authorization: Bearer $ORQ_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello world!",
    "voice": "alloy"
  }' --output speech.mp3

from openai import OpenAI
import os

client = OpenAI(
  base_url="https://api.orq.ai/v3/router",
  api_key=os.getenv("ORQ_API_KEY"),
)

response = client.audio.speech.create(
  model="openai/tts-1",
  voice="alloy",
  input="Hello world!"
)

response.stream_to_file("speech.mp3")

import OpenAI from "openai";
import fs from "fs";

const client = new OpenAI({
  baseURL: 'https://api.orq.ai/v3/router',
  apiKey: process.env.ORQ_API_KEY,
});

async function main() {
  const mp3 = await client.audio.speech.create({
    model: "openai/tts-1",
    voice: "alloy",
    input: "Hello world!",
  });

  const buffer = Buffer.from(await mp3.arrayBuffer());
  await fs.promises.writeFile("speech.mp3", buffer);
}

main();

Provider	Model
Eleven Labs	`elevenlabs/eleven_flash_v2`
Eleven Labs	`elevenlabs/eleven_flash_v2_5`
Eleven Labs	`elevenlabs/eleven_multilingual_v2`
Eleven Labs	`elevenlabs/eleven_turbo_v2_5`
Vertex AI	`google/gemini-2.5-flash-preview-tts`
Vertex AI	`google/gemini-2.5-pro-preview-tts`
Google AI	`google-ai/gemini-2.5-flash-preview-tts`
Google AI	`google-ai/gemini-2.5-pro-preview-tts`
Groq	`groq/canopylabs/orpheus-arabic-saudi`
Groq	`groq/canopylabs/orpheus-v1-english`
OpenAI	`openai/gpt-4o-mini-tts`
OpenAI	`openai/tts-1`
OpenAI	`openai/tts-1-hd`
tensorix	`tensorix/chatterbox-turbo`

Text-to-Speech Voices

The following voices are available for Text-to-Speech models:

OpenAI

alloy: Neutral, versatile voice
echo: Neutral, soft-spoken voice
fable: Expressive, narrative-focused voice
onyx: Deep, authoritative voice
nova: Warm, natural voice
shimmer: Clear, optimistic voice

ElevenLabs

aria: Neutral, versatile voice
roger: Deep, authoritative voice
sarah: Warm, friendly voice
laura: Soft, gentle voice
charlie: Casual, conversational voice
george: Professional, articulate voice
callum: Youthful, energetic voice
river: Calm, soothing voice
liam: Clear, confident voice
charlotte: Elegant, refined voice
alice: Bright, cheerful voice
matilda: Thoughtful, measured voice
will: Reliable, trustworthy voice
jessica: Engaging, expressive voice
eric: Authoritative, commanding voice
chris: Friendly, approachable voice
brian: Mature, distinguished voice
daniel: Versatile, balanced voice
lily: Sweet, melodious voice
bill: Grounded, authentic voice

Retries & Error Handling Streaming

Get Started

AI Gateway

AI Observability

AI Engineering

AI Governance

AI Chat

Organization

List of supported models

Responses API

Supported Models

Chat models

Completion models

Embedding models

Image models

Image Generation

Image Edit

Image Variations

Supported Image Models

Moderations models

Rerank models

Speech-to-Text models

Text-to-Speech models

Text-to-Speech Voices

OpenAI

ElevenLabs

​List of supported models

​Responses API

​Supported Models

​Chat models

​Completion models

​Embedding models

​Image models

​Image Generation

​Image Edit

​Image Variations

​Supported Image Models

​Moderations models

​Rerank models

​Speech-to-Text models

​Text-to-Speech models

​Text-to-Speech Voices

​OpenAI

​ElevenLabs

List of supported models

Responses API

Supported Models

Chat models

Completion models

Embedding models

Image models

Image Generation

Image Edit

Image Variations

Supported Image Models

Moderations models

Rerank models

Speech-to-Text models

Text-to-Speech models

Text-to-Speech Voices

OpenAI

ElevenLabs