Site icon Le blog high-tech & telecom de Xavier Studer

Qu’apporte vraiment le modèle GPT 4o? Premières impressions

Le test de ChatGPT 4o. Image DALL-E3.
Le test de ChatGPT 4o. Image DALL-E3.

OpenAI vient d’annoncer GPT-4o, son nouveau modèle phare capable de raisonner en temps réel sur l’audio, la vision et le texte. Cette intelligence artificielle (IA) générative accepte en entrée différentes combinaisons de texte, audio, image et vidéo et génère n’importe quelle combinaison de texte, audio et image en sortie.

GPT-4o peut répondre à des entrées audio en seulement 232 millisecondes en moyenne, ce qui est similaire au temps de réponse humain dans une conversation. Il égale les performances de GPT-4 Turbo sur le texte en anglais et le code, avec une amélioration significative sur le texte dans les langues non anglaises, tout en étant beaucoup plus rapide et 50% moins cher dans l’API.

Premières impressions mitigées

En tant qu’abonné Plus à ChatGPT, j’ai pu tester GPT-4o quasi immédiatement après son lancement. J’ai effectivement constaté une grande réactivité dans le traitement de mes requêtes par cette IA, comme annoncé sur cette page. Evidemment, cela ne résout pas les problèmes de fiabilité.

Toutefois, la capacité de décrire des images envoyées depuis un smartphone m’a agréablement surpris, même si je n’ai pas perçu d’emblée de rupture ou de grandes nouveautés par rapport à GPT-4. Grâce à ce perfectionnement, on peut par exemple identifier avec aisance les noms des plantes capturées dans ses photos. Superbe.

Un potentiel à confirmer

Il faudra toutefois encore attendre de voir comment les développeurs s’empareront de ces nouvelles capacités multimodales pour créer des applications innovantes. GPT-4o ouvre certainement de nouvelles possibilités d’interaction homme-machine plus naturelles.

Mais pour l’instant, du point de vue de l’utilisateur final, le saut qualitatif n’est pas flagrant même si la possibilité d’analyser des photos, par exemple, semble être une réussite. La suite nous dira si GPT-4o tient ses promesses et apporte une réelle valeur ajoutée par rapport à ses prédécesseurs. Dans tous les cas, on a déjà identifié quelques limites de notre côté.

XS

Quitter la version mobile