Models

List available model IDs across all inference endpoints.

Chat models

Use these model IDs with chat completions and messages.

Model ID	Provider	Context
`claude-opus-4-6`	Anthropic	1M
`claude-opus-4-5`	Anthropic	200k
`claude-sonnet-4-6`	Anthropic	1M
`claude-sonnet-4-5`	Anthropic	200k
`claude-sonnet-4`	Anthropic	200k
`claude-haiku-4-5`	Anthropic	200k
`claude-haiku-3-5`	Anthropic	200k
`gpt-5.2`	OpenAI	400k
`gpt-5-3-codex`	OpenAI	400k
`gpt-5`	OpenAI	400k
`gpt-5-mini`	OpenAI	400k
`gpt-5-nano`	OpenAI	400k
`gpt-4o`	OpenAI	128k
`gpt-4o-mini`	OpenAI	128k
`gpt-4.1`	OpenAI	1M
`grok-4-1-fast-reasoning`	xAI	2M
`grok-4-1-fast-non-reasoning`	xAI	2M
`grok-code-fast-1`	xAI	256k
`gemini-3-1-pro-preview`	Google	1M
`gemini-3-pro-preview`	Google	1M
`gemini-3-flash-preview`	Google	1M
`gemini-2.5-pro`	Google	1M
`gemini-2.5-flash`	Google	1M
`gemini-2.5-flash-lite`	Google	1M
`deepseek-v3-2`	Fireworks	128k
`deepseek-r1`	Bedrock	128k
`gpt-oss-120b`	Bedrock	128k
`gpt-oss-20b`	Bedrock	128k
`minimax-m2.5`	Fireworks AI	192k
`kimi-k2.5`	Fireworks AI	262k
`kimi-k2-thinking`	Bedrock	262k
`zai-glm-5`	Fireworks AI	198k
`zai-glm-4.7`	Bedrock	128k
`zai-glm-4.7-flash`	Bedrock	128k
`f1`	Firmware	128k
`f1-flash`	Firmware	1M
`f1-pro`	Firmware	1M

Embedding models

Use these model IDs with embeddings.

Model ID	Provider	Price per 1M tokens
`text-embedding-3-small`	OpenAI	$0.02
`text-embedding-3-large`	OpenAI	$0.13
`text-embedding-ada-002`	OpenAI	$0.10
`text-embedding-004`	Google	Free
`voyage-4-large`	Voyage AI	$0.12
`voyage-4`	Voyage AI	$0.06
`voyage-4-lite`	Voyage AI	$0.02
`voyage-context-3`	Voyage AI	$0.18
`voyage-code-3`	Voyage AI	$0.18
`voyage-finance-2`	Voyage AI	$0.12
`voyage-law-2`	Voyage AI	$0.12
`voyage-code-2`	Voyage AI	$0.12

Rerank models

Use these model IDs with rerank.

Model ID	Provider	Price per 1M tokens
`rerank-2.5`	Voyage AI	$0.05
`rerank-2.5-lite`	Voyage AI	$0.02

Audio transcription models

Use these model IDs with audio transcriptions.

Model ID	Provider	Price
`whisper-1`	OpenAI	$0.006/min
`elevenlabs-scribe-v2`	ElevenLabs	$0.40/hr

Audio speech models

Use these model IDs with audio speech.

Model ID	Provider	Price per 1M chars
`elevenlabs-tts-multilingual`	ElevenLabs	$170.00
`elevenlabs-tts-v3`	ElevenLabs	$170.00

Image generation models

Use these model IDs with image generation.

Model ID	Provider	Price
`dall-e-3`	OpenAI	$0.04–$ 0.12 per image
`imagen-4`	Google	$0.04 per image
`imagen-4-ultra`	Google	$0.06 per image
`imagen-4-fast`	Google	$0.02 per image
`gemini-3-pro-image-preview`	Google	Token-based
`gemini-3-1-flash-image-preview`	Google	Token-based
`gemini-2.5-flash-image`	Google	Token-based

Call endpoint

Send a GET request with your Firmware API key.

Authenticate

Use an API key in the Authorization header.

curl https://app.firmware.ai/api/v1/models \
  -H "Authorization: Bearer $FIRMWARE_API_KEY"

Understand response

Returns an OpenAI-compatible list object. Each entry is a supported model object.

object

string

Always list.

data

array

Array of model objects.

Show Model object

string

Provider-prefixed model ID like openai/gpt-4o-mini.

object

string

Typically model.

created

integer

Unix timestamp, if provided by upstream.

owned_by

string

Provider name like openai.

provider

string

Provider name, if included.

created_at

string

ISO timestamp, if included.

provider_info

object

Provider metadata like status, if included.

...

any

Additional fields may be present.

See example

Example response shape. Fields may vary by provider.

{
  "object": "list",
  "data": [
    {
      "id": "openai/gpt-4o-mini",
      "object": "model",
      "created": 1735689600,
      "owned_by": "openai",
      "provider_info": {
        "status": "enabled"
      }
    }
  ]
}

Handle errors

401 means the API key is missing or invalid. 429 means you hit a usage or plan limit.

Inference

Deep Research

Chat models

Embedding models

Rerank models

Audio transcription models

Audio speech models

Image generation models

Call endpoint

Authenticate

Understand response

See example

Handle errors

Inference

Deep Research

​Chat models

​Embedding models

​Rerank models

​Audio transcription models

​Audio speech models

​Image generation models

​Call endpoint

​Authenticate

​Understand response

​See example

​Handle errors

Chat models

Embedding models

Rerank models

Audio transcription models

Audio speech models

Image generation models

Call endpoint

Authenticate

Understand response

See example

Handle errors