Portfolio

Projets

Mettre l'IA au service de problèmes d'ingénierie et techniques complexes.

CLIArena

Benchmarking des agents de codage CLI — et leurs forks

Lecture des codebases de Codex, Gemini CLI, Mistral Vibe et OpenCode, puis fork de trois d'entre eux pour exécuter GLM-4.7 sur Terminal-Bench 2.0. Même modèle, écart de performance 2x — c'est le scaffolding qui compte. Benchmark des quatre agents sur un problème d'optimisation NP-difficile non publié ; Claude Code a battu ma solution C++ vieille de 8 ans. Forks désormais mis à jour pour supporter GLM-5.

Python, Rust, TypeScript, Docker, Harbor

OmniAgents

Interface unifiée pour les agents de codage IA

Interface unifiée pour les agents de codage IA à travers les environnements d'exécution (Local, Docker, E2B) et les frameworks (smolagents, Pydantic-AI, LangChain). Plus maintenu activement — l'exploration a mené à la reconstruction d'OpenHands from scratch pour comprendre les mécanismes internes des agents.

Python, Docker, E2B

Predibench

Benchmark de l'IA sur les marchés de prédiction réels

Évaluation des modèles d'IA sur les marchés de prédiction réels. Plateforme en direct testant si l'IA peut battre les humains en prévision.

Python, Polymarket API, RAG

Jimmy Energy

Head of Software — Comex member (2022-2025)

Transformation Engineering-as-Code

En tant que directeur et membre du Comex, j'ai constitué et dirigé l'équipe logicielle qui a transformé une entreprise d'ingénierie traditionnelle vers un flux de travail basé sur Git. Remplacement du PLM hérité par des outils Python personnalisés (PyJimmy). Toute l'équipe d'ingénierie travaille désormais à partir d'une base de code unifiée avec contrôle de version, CI/CD et intégration de l'IA.

Impact : Les ingénieurs consacrent leur temps à l'ingénierie plutôt qu'à la gestion de fichiers. Des données propres et versionnées permettent des flux de travail IA.

Python, Git, AWS, GitHub Actions

Webportal

Navigation web pour agents IA via parsing VLM

Un parseur web utilisant un VLM pour analyser les pages et les requêtes backend, fournissant un format digéré aux LLMs pour la navigation web autonome. Construit lors du hackathon HuggingFace x Anthropic (3ème place).

Firebase, Web APIs, VLM

HuggingFace x Anthropic Hackathon — Travel Booking Agent

Agent IA qui réserve de vrais voyages via un navigateur (3ème place)

Un agent de réservation de voyage utilisant smolagents et browser-use. 3ème place au hackathon HuggingFace x Anthropic.

Python, smolagents, browser-use

DeepDraft

Forcer les agents IA à suivre un raisonnement scientifique

L'objectif était de forcer les agents à suivre un processus de raisonnement scientifique rigoureux pour répondre aux questions. Si c'était à refaire aujourd'hui, serait basé sur un agent CLI open-source comme Mistral Vibe ou Codex.

Python, RAG, LLM agents

Pyforge

Bibliothèque Python minimaliste pour l'engineering-as-code

Contrôle de version pour les artefacts d'ingénierie — modèles, simulations, docs. Un exemple d'engineering-as-code : traiter les données d'ingénierie avec la même rigueur que le logiciel.

Python, Git

AIEngineer

Agent d'IA pour le scaffolding de projets d'ingénierie

Mon premier projet avec des agents IA. Utilisait Aider pour générer du code par programmation pour des projets d'ingénierie. Avec les connaissances d'aujourd'hui, je construirais simplement un agent avec des outils directement plutôt que de m'appuyer sur l'approche d'Aider.

Python, Aider, Pyforge