Mettre l'IA au service de problèmes d'ingénierie et techniques complexes.
CLIArena
Benchmarking des agents de codage CLI — et leurs forks
Lecture des codebases de Codex, Gemini CLI, Mistral Vibe et OpenCode, puis fork de trois d'entre eux pour exécuter GLM-4.7 sur Terminal-Bench 2.0. Même modèle, écart de performance 2x — c'est le scaffolding qui compte. Benchmark des quatre agents sur un problème d'optimisation NP-difficile non publié ; Claude Code a battu ma solution C++ vieille de 8 ans. Forks désormais mis à jour pour supporter GLM-5.
Python, Rust, TypeScript, Docker, Harbor
OmniAgents
Interface unifiée pour les agents de codage IA
Interface unifiée pour les agents de codage IA à travers les environnements d'exécution (Local, Docker, E2B) et les frameworks (smolagents, Pydantic-AI, LangChain). Plus maintenu activement — l'exploration a mené à la reconstruction d'OpenHands from scratch pour comprendre les mécanismes internes des agents.
Predibench
Benchmark de l'IA sur les marchés de prédiction réels
Évaluation des modèles d'IA sur les marchés de prédiction réels. Plateforme en direct testant si l'IA peut battre les humains en prévision.
Python, Polymarket API, RAG
Jimmy Energy
Head of Software — Comex member (2022-2025)
Transformation Engineering-as-Code
En tant que directeur et membre du Comex, j'ai constitué et dirigé l'équipe logicielle qui a transformé une entreprise d'ingénierie traditionnelle vers un flux de travail basé sur Git. Remplacement du PLM hérité par des outils Python personnalisés (PyJimmy). Toute l'équipe d'ingénierie travaille désormais à partir d'une base de code unifiée avec contrôle de version, CI/CD et intégration de l'IA.
Impact : Les ingénieurs consacrent leur temps à l'ingénierie plutôt qu'à la gestion de fichiers. Des données propres et versionnées permettent des flux de travail IA.
Python, Git, AWS, GitHub Actions
Webportal
Navigation web pour agents IA via parsing VLM
Un parseur web utilisant un VLM pour analyser les pages et les requêtes backend, fournissant un format digéré aux LLMs pour la navigation web autonome. Construit lors du hackathon HuggingFace x Anthropic (3ème place).
HuggingFace x Anthropic Hackathon — Travel Booking Agent
Agent IA qui réserve de vrais voyages via un navigateur (3ème place)
Un agent de réservation de voyage utilisant smolagents et browser-use. 3ème place au hackathon HuggingFace x Anthropic.
Python, smolagents, browser-use
DeepDraft
Forcer les agents IA à suivre un raisonnement scientifique
L'objectif était de forcer les agents à suivre un processus de raisonnement scientifique rigoureux pour répondre aux questions. Si c'était à refaire aujourd'hui, serait basé sur un agent CLI open-source comme Mistral Vibe ou Codex.
Pyforge
Bibliothèque Python minimaliste pour l'engineering-as-code
Contrôle de version pour les artefacts d'ingénierie — modèles, simulations, docs. Un exemple d'engineering-as-code : traiter les données d'ingénierie avec la même rigueur que le logiciel.
AIEngineer
Agent d'IA pour le scaffolding de projets d'ingénierie
Mon premier projet avec des agents IA. Utilisait Aider pour générer du code par programmation pour des projets d'ingénierie. Avec les connaissances d'aujourd'hui, je construirais simplement un agent avec des outils directement plutôt que de m'appuyer sur l'approche d'Aider.