Aller au contenu

2024

Mise en production de ma première application RAG

J’ai consacré cette année beaucoup de temps à la veille et R&D autour des applications d’intelligence artificielle, en particulier sur les RAG (Retrieval Augmented Generation). J’ai déjà partagé des apprentissages de cette veille, notamment dan mon article précédent (Premiers pas avec le Retrieval Augmented Generation (RAG)) ainsi lors d’une conférence sur les systèmes RAG lors de la No-Code Week à Cologne.

Cette veille n’était pas menée aveuglément : je cherchais à répondre à une demande client réelle. Après un certain nombre d’itérations j’ai pu finalement livrer un outil qui entre en production cet été. Je partagerai dans cet article les challenges rencontrés ainsi que les choix d’implémentation pris pour livrer ce projet.

Digi-Studio speaker lors de la No-Code Week 2024

L’édition 2024 de la No-Code Week s’est tenue à Cologne du 10 au 14 juin 2024. La No-Code Week est un rassemblement annuel des passionnés du No-Code organisé à l’initiative des piliers de la communauté No-Code France. Et ce fut un réel plaisir de partager quelques moments avec ses “pairs” et de pouvoir échanger entre passionnés autour de quelques Kölsch.

J’ai eu le privilège de faire partie des conférenciers de cette édition lors de la soirée dédiée à la thématique IA. C’etait pour moi l’occasion de partager un retour d’expérience sur les RAG (Retrieval Augmented Generation). La conférence reprend dans les grandes lignes le contenu de mon article Premiers pas avec le Retrieval Augmented Generation (RAG) avec plusieurs compléments. Vous pouvez retrouver l’enregistrement de cette conférence ici :

Première rencontre avec Mistral Large

Notre licorne française Mistral AI a annoncé hier la sortie d’un nouveau modèle de langage Mistral Large dont les capacités s’approchent de GPT-4, ainsi qu’une application web de chatbot baptisée Le Chat.

L’annonce indique également une autre nouveauté qui m’intéresse particulièrement : les modes JSON format and function calling. Ces fonctionnalités déjà disponibles sur OpenAI permettent de contrôler le format de sortie du modèle de langage afin de pouvoir l’interfacer avec des outils externes (API, Code…). Et c’est ce qui me manquait pour pousser plus loin mes tests des modèles de Mistral AI. En effet, sans cette fonctionnalité, il était impossible d’utiliser Mistral AI dans des applications IA complexes (voir mon article sur les RAG).

J’ai donc pu tester Mistral Large et le mode function calling sur un exemple assez poussé et voici un premier résultat.

Premiers pas avec le Retrieval Augmented Generation (RAG)

Si vous vous intéressez un peu aux actualités autour de l’IA, vous avez certainement entendu parler des GPTs, la dernière fonctionnalité de ChatGPT. Il est possible en quelques clics d’uploader des documents pour construire un chatbot personnalisé. Sur le papier ça semble parfait, mais en pratique j’ai constaté plusieurs limitations.

Je me suis donc intéressé au développement d’applications IA en propre (sans passer par ChatGPT) et j’approfondis le sujet depuis quelques semaines. J’ai beaucoup appris, beaucoup testé. Les informations en français sont tellement rares que j’ai décidé de partager mes recherches ici pour vous proposer le contenu que j’aurais aimé trouver. Dans ce billet, je vous expliquerai

  • pourquoi les GPTs ont vite été limitants dans mon cas
  • que sont les embeddings
  • qu’est que le RAG comment on peut construire une application IA
  • mes premiers retours d’expérience.

Comment utiliser l’IA d’OpenAI sans passer par ChatGPT

Pour beaucoup d’entre nous, l’Intelligence Artificielle s’est invitée dans notre environnement de travail. Personnellement, je l’utilise comme assistant virtuel (aide à la rédaction, à l’écriture de code, à la traduction…) mais aussi dans des automatisations plus techniques en utilisant l’API.

Le visage le plus familier de cette technologie est bien entendu ChatGPT mais il existe bien d’autres options pour utiliser OpenAI, parfois plus pratique. J’ai testé un certain nombre d’outils et je voulais partager mon retour d’expérience.