Voici mon infrastructure personnelle — déployée, opérationnelle, auto-monitorée.
Pas une démo. Pas un POC. Du code en production depuis des mois.
Chaque ligne ci-dessous tourne en production 24h/24.
L'assistant IA (Claude Code + Claude Desktop) est le pivot unique de toute l'infrastructure. Via le protocole MCP (Model Context Protocol) et des tunnels SSH chiffrés, il orchestre l'ensemble des composants : lecture des emails, automatisation des navigateurs, exécution de code sur serveurs distants, déclenchement de workflows, et interrogation directe de la base documentaire locale (RAG) avec filtrage par tags métier (client, projet, type, date, confidentialité). Un seul point d'entrée pour piloter mail, infra, agents, sauvegardes et connaissance — zéro credential exposé, traçabilité complète.
Un routeur LLM propriétaire distribue les requêtes vers 6 fournisseurs d'IA en cascade : si l'un est indisponible ou épuisé, le suivant prend le relais automatiquement. Les workflows N8n orchestrent la génération de contenu, la gestion des alertes et les automatisations métier. Résultat : 0€/mois de coût LLM en utilisation normale (quotas gratuits), 0 interruption de service.
Chaque email passe par 3 filtres successifs avant d'atteindre sa destination : antivirus ClamAV, scoring SpamAssassin et règle de rejet personnalisée. Le monitoring fonctionne 24h/24 en Python autonome, sans consommer un seul token IA. Résultat : 20 domaines gérés, 0 spam transmis, rapports quotidiens automatiques.
La règle 3-2-1 est appliquée automatiquement : 3 copies, sur 2 supports distincts, dont 1 hors datacenter. Un heartbeat HTTP valide chaque sauvegarde — silence = alerte immédiate. Résultat : RTO estimé < 2h en cas de crash total du datacenter OVH.
Vue synthétique de l'ensemble : l'IA orchestre l'infrastructure (serveurs, mail, workflows, backups) pendant que le monitoring fonctionne de façon totalement autonome. 3 couches bien séparées : Interaction, Infrastructure privée LAN, Services Cloud. Résultat : une architecture production auto-gérée, documentée, et évolutive.
Claude Code et Claude Desktop accèdent directement à votre base documentaire locale via le protocole MCP (Model Context Protocol). Vos documents sont indexés avec des tags métier (client, projet, type, date, confidentialité), ce qui permet à l'IA de cibler la recherche avant même la lecture sémantique. Résultat : Claude vous répond en s'appuyant sur vos propres archives, vos contrats, vos notes — sans rien envoyer dans le cloud. Le modèle local Ollama complète le dispositif pour les requêtes 100% hors ligne.
Le RAG (Retrieval Augmented Generation) transforme un dossier de fichiers en assistant intelligent. Vous posez la question, l'IA lit la réponse dans vos propres documents. Pas de mots-clés à deviner. Pas de classement manuel. Pas de fuite hors de votre périmètre.
Claude Code et Claude Desktop se connectent à la base vectorielle via le protocole MCP. Vous posez la question dans la conversation, Claude interroge le RAG, lit les passages pertinents dans vos documents, et rédige la réponse en s'y appuyant explicitement.
Chaque document est indexé avec ses tags : client, projet, type, date, niveau de confidentialité. Claude cible la recherche : « réponds uniquement à partir des contrats signés en 2025 du client X ». La précision augmente, le bruit disparaît.
La base vectorielle retrouve les passages de sens proche, même quand le vocabulaire diffère entre la question et le document. Posez la question librement, l'IA comprend l'intention et trouve la référence.
Les contrats clients, les données nominatives, les pièces sensibles restent sur le poste. La base vectorielle et les embeddings s'exécutent localement, sans clé API externe, sans télémétrie. RGPD natif.
Quand vous voulez vous passer complètement de Claude, le modèle local Ollama prend le relais sur le GPU du poste. Même sans connexion Internet, la base reste interrogeable via AnythingLLM. Indispensable en déplacement.
Deux bases distinctes : l'une privée sur le PC (contrats, EasyCode, notes), l'autre partagée sur le serveur (procédures publiques, doc tech). Aucun pont automatique. Vous décidez ce qui sort.
L'agent IA WhatsApp et les workflows N8n disposent de leur propre mémoire vectorielle. Chaque conversation, chaque décision est conservée. L'utilisateur n'a plus à répéter le contexte.
Vingt-cinq ans de notes techniques, de dossiers clients, de rapports d'audit. Le RAG transforme cette masse dormante en assistant opérationnel. La référence exacte en une phrase, plutôt qu'une recherche fichier par fichier.
Infrastructure IA, automatisation, sécurité, monitoring autonome, RAG documentaire souverain — je déploie pour vous ce que je fais pour moi.
Discutons de votre projet