Des charges de travail dans le code. Des endpoints en minutes.
Déclarez une charge de travail d'IA, appelez ensure() et obtenez un endpoint compatible OpenAI prêt à l'emploi. Un cœur en Rust, des SDK natifs Python et TypeScript.
Deux jetons, moindre privilège
Vous déclarez une charge de travail avec le plan de contrôle (ManagementClient, un jeton ik_sdk_) et vous l’appelez avec le plan de données (DataClient, un jeton ik_live_). ensure() est idempotent sur le slug : vous pouvez l’exécuter à chaque déploiement.
Le jeton de contrôle ik_sdk_ provisionne des charges de travail mais ne peut pas appeler l’inférence. Le jeton de données ik_live_ appelle l’inférence mais ne peut pas provisionner. Passez une clé de données par charge de travail — une application peut en piloter plusieurs, chacune avec sa propre clé.
Explorer la documentation
Démarrage Obtenez vos jetons, lancez votre premier ensure() et faites votre premier appel.
Guides Authentification, charges par politique / worker / modalité, et cas d'usage de bout en bout.
Référence Architecture, jetons, OnDrift, backends et politiques, format wire et erreurs courantes.
Référence API Surface complète Python et TypeScript. Go et Java bientôt disponibles (via la C ABI).
Nouveau sur la plateforme ? Créez un compte ou ouvrez le tableau de bord · En savoir plus sur inferencekey.com