Cargas de trabajo en código. Endpoints en minutos.
Declara una carga de trabajo de IA, llama a ensure() y obtén un endpoint compatible con OpenAI listo para usar. Un núcleo en Rust, SDKs nativos de Python y TypeScript.
Dos tokens, mínimo privilegio
Declaras una carga de trabajo con el plano de control (ManagementClient, un token ik_sdk_) y la llamas con el plano de datos (DataClient, un token ik_live_). ensure() es idempotente por el slug, así que puedes ejecutarlo en cada despliegue.
El token de control ik_sdk_ aprovisiona cargas de trabajo pero no puede llamar a inferencia. El token de datos ik_live_ llama a inferencia pero no puede aprovisionar. Pasa una clave de datos por carga de trabajo — una app puede usar varias, cada una con su propia clave.
Explora la documentación
Quickstart Consigue tus tokens, ejecuta tu primer ensure() y haz tu primera llamada.
Guías Autenticación, cargas por política / worker / modalidad, y casos de uso de principio a fin.
Referencia Arquitectura, tokens, OnDrift, backends y políticas, formato wire y errores comunes.
Referencia de API Superficie completa de Python y TypeScript. Go y Java próximamente (sobre la C ABI).
¿Nuevo en la plataforma? Crea una cuenta o abre el panel · Más en inferencekey.com