OpenAI dévoile 4 nouvelles fonctionnalités d'IA disponibles dès maintenant
OpenAI dévoile 4 nouvelles fonctionnalités d'IA disponibles dès maintenant
Lors de l'événement DevDay à San Francisco, OpenAI a annoncé plusieurs mises à jour majeures de ses services API. Ces nouveautés sont destinées à aider les entrepreneurs à développer des produits et des fonctionnalités alimentés par l'IA, notamment avec des outils personnalisés, des applications basées sur la voix, et des performances améliorées des modèles plus petits. Parmi ces nouveautés, quatre fonctionnalités majeures ont été introduites : la distillation de modèles, la mise en cache des prompts, le fine-tuning de vision et le lancement d'un service API nommé Realtime.
La distillation de modèles permet d'améliorer les capacités des modèles plus petits en les affinant à partir des sorties des modèles plus grands. OpenAI a simplifié ce processus en intégrant une suite de distillation directement sur sa plateforme API. Désormais, les développeurs peuvent créer leurs propres ensembles de données, affiner un modèle plus petit pour suivre les réponses d’un modèle plus puissant, et évaluer les performances avec des outils automatisés. Cette méthode permet de rendre les modèles plus légers sans compromettre leur efficacité.
La mise en cache des prompts est une nouvelle fonctionnalité qui permet de réduire les coûts liés aux appels API répétitifs. Les développeurs peuvent réutiliser des préfixes communs, souvent longs et coûteux, sans payer le plein tarif à chaque utilisation. Ce système applique automatiquement une réduction de 50 % pour les préfixes récurrents, rendant l'API plus abordable pour les cas d'utilisation spécifiques. Cette initiative s'inscrit dans la volonté d’OpenAI de rendre ses services plus accessibles et compétitifs.
Le fine-tuning de vision est une mise à jour clé qui permet désormais d'affiner les modèles GPT-4 avec des images, en plus du texte. Cette avancée ouvre la voie à des applications plus performantes, telles que la recherche visuelle améliorée, la détection d'objets dans les véhicules autonomes, ou encore l'analyse d'images médicales. En permettant aux développeurs de téléverser des ensembles d'images étiquetées, OpenAI renforce l'efficacité de ses modèles pour comprendre et interpréter les images.
Enfin, l’API Realtime permet aux développeurs de créer des applications basées sur la voix de manière plus fluide et réactive. En supprimant les étapes intermédiaires entre la transcription de l'audio et la génération vocale, cette API offre une solution plus rapide et plus précise pour les interactions vocales en temps réel. À terme, cette API prendra en charge des expériences multimodales, incluant la vidéo, rendant possible des applications comme la prise de rendez-vous ou la commande de produits en ligne directement via des interactions vocales.