Saltearse al contenido

Cargas de trabajo en código. Endpoints en minutos.

Declara una carga de trabajo de IA, llama a ensure() y obtén un endpoint compatible con OpenAI listo para usar. Un núcleo en Rust, SDKs nativos de Python y TypeScript.

Dos tokens, mínimo privilegio

Declaras una carga de trabajo con el plano de control (ManagementClient, un token ik_sdk_) y la llamas con el plano de datos (DataClient, un token ik_live_). ensure() es idempotente por el slug, así que puedes ejecutarlo en cada despliegue.

El token de control ik_sdk_ aprovisiona cargas de trabajo pero no puede llamar a inferencia. El token de datos ik_live_ llama a inferencia pero no puede aprovisionar. Pasa una clave de datos por carga de trabajo — una app puede usar varias, cada una con su propia clave.

Explora la documentación


¿Nuevo en la plataforma? Crea una cuenta o abre el panel · Más en inferencekey.com