OpenAI

5 articles

Articles

Prompt caching : diviser ses couts d'API LLM par 10
IA

Prompt caching : diviser ses couts d'API LLM par 10

Vous envoyez le meme contexte de 50 000 tokens a chaque requete : un long system prompt, la documentation de votre application, des exemples few-shot, l'historique recent de la conversation. Sur 1 000 requetes par jour, c'est 50 millions de tokens d'entree facturees, soit environ 150 dollars par jour, soit 4 500 dollars par mois rien que pour le contexte que vous envoyez en boucle. Cette situation, courante en 2026, est exactement celle que le prompt caching resout. La technique, generalisee che

Jean-Michel Helem · 1 juin 2026 · 8 min
Embeddings de code : la recherche semantique qui change tout
IA

Embeddings de code : la recherche semantique qui change tout

Pendant trente ans, chercher du code a signifie une chose : grep, ou ses variantes. Tapez les bons mots-cles, vous trouvez. Ratez le bon nom de fonction, vous ne trouvez pas. Ce paradigme a survecu a tous les changements de langages, d'IDE et de paradigmes. Il commence a etre serieusement bouscule en 2026 par les embeddings de code, qui permettent de chercher par sens et non plus par texte. Demander "ou est gere le calcul de remboursement de TVA ?" sur un projet correctement indexe retrouve la f

Jean-Michel Helem · 13 mai 2026 · 7 min
GPT-5.3-Codex et OpenAI Frontier : l'ère des agents IA d'entreprise
OpenAI

GPT-5.3-Codex et OpenAI Frontier : l'ère des agents IA d'entreprise

Le 5 février 2026, OpenAI a lancé simultanément deux produits qui marquent un virage stratégique : GPT-5.3-Codex, un modèle taillé pour le code et les workflows agentiques, et Frontier, une plateforme de gestion d'agents IA pour l'entreprise. Avec HP, Intuit, Oracle, State Farm, Thermo Fisher et Uber parmi les premiers clients, OpenAI ne cache plus son ambition : devenir le système d'exploitation de l'IA d'entreprise. GPT-5.3-Codex : un modèle conçu pour les agents GPT-5.3-Codex n'est pas

Jean-Michel Helem · 26 février 2026 · 6 min
Code Red chez OpenAI : Google Gemini 3 inverse le rapport de force
IA

Code Red chez OpenAI : Google Gemini 3 inverse le rapport de force

Le 1er décembre 2025, Sam Altman a envoyé un mémo interne à tous les employés d'OpenAI : "Code Red". Trois ans après avoir déclenché la même alerte chez Google avec le lancement de ChatGPT, le CEO d'OpenAI se retrouve dans la position inverse. Google Gemini 3 vient de surpasser GPT-5.1 sur la plupart des benchmarks majeurs, et la riposte s'organise dans l'urgence. L'ironie de l'histoire En décembre 2022, le lancement de ChatGPT avait provoqué un séisme chez Google. Sundar Pichai avait déclaré

Jean-Michel Helem · 15 décembre 2025 · 5 min
Agentic AI Foundation : OpenAI et Anthropic s'allient pour standardiser les agents IA
IA

Agentic AI Foundation : OpenAI et Anthropic s'allient pour standardiser les agents IA

Le 9 décembre 2025 restera comme une date charnière dans l'histoire de l'intelligence artificielle. Ce jour-là, trois géants de l'IA habituellement en concurrence frontale - OpenAI, Anthropic et Block - ont annoncé la création de l'Agentic AI Foundation (AAIF) sous l'égide de la Linux Foundation. Cette alliance stratégique vise à établir des standards ouverts pour les agents IA, ces systèmes autonomes capables d'exécuter des tâches complexes sans intervention humaine constante. Une alliance hi

Jean-Michel Helem · 8 décembre 2025 · 7 min