Aller au contenu

Des charges de travail dans le code. Des endpoints en minutes.

Déclarez une charge de travail d'IA, appelez ensure() et obtenez un endpoint compatible OpenAI prêt à l'emploi. Un cœur en Rust, des SDK natifs Python et TypeScript.

Deux jetons, moindre privilège

Vous déclarez une charge de travail avec le plan de contrôle (ManagementClient, un jeton ik_sdk_) et vous l’appelez avec le plan de données (DataClient, un jeton ik_live_). ensure() est idempotent sur le slug : vous pouvez l’exécuter à chaque déploiement.

Le jeton de contrôle ik_sdk_ provisionne des charges de travail mais ne peut pas appeler l’inférence. Le jeton de données ik_live_ appelle l’inférence mais ne peut pas provisionner. Passez une clé de données par charge de travail — une application peut en piloter plusieurs, chacune avec sa propre clé.

Explorer la documentation


Nouveau sur la plateforme ? Créez un compte ou ouvrez le tableau de bord · En savoir plus sur inferencekey.com