Souveraineté des outils logiciels stratégiques : la commande publique n’a pas attendu le débat public

Depuis quelques mois, la souveraineté de nos outils logiciels stratégiques s’est invitée dans la conversation publique. Le sujet circule et est débattu à un rythme inédit. Plusieurs controverses récentes l’expliquent : l’évolution du contexte géopolitique et les choix d’infrastructure rendus visibles de certaines administrations régaliennes.

Une lecture globale suggère ainsi que la commande publique française aurait découvert récemment la question de la souveraineté, sous l’effet de ces événements. Pourtant, cette exigence articulée aux enjeux de SecOps (Sécurité des Opérations) et de souveraineté est centrale et est prise en compte depuis de nombreuses années. La conversation publique récente la rejoint. Elle ne l’a pas créée.

Une exigence déjà installée.

Bien avant l’emballement du grand public, bien avant que le mot « souverain » ne devienne un argument commercial usuel, les cahiers des charges des ministères et des entités sensibles posaient déjà des questions précises. Où sont hébergées les données. Quels modèles d’intelligence artificielle analysent l’information. D’où proviennent ces données et par quels canaux. Vers quels fournisseurs partent les requêtes. Quelles boucles d’apprentissage existent. Quelle est la structure capitalistique de l’éditeur. Quels engagements contractuels protègent ces flux dans la durée. Ces questions étaient lues par des architectes SI exigeants, vérifiées en revue technique, posées en condition d’admission du marché.

Cette exigence s’inscrit dans une continuité plus longue encore. Elle existait dix ans auparavant dans les programmes de défense et de souveraineté numérique des administrations sensibles. Elle réside aujourd’hui, indépendamment de la couverture médiatique du moment. Cette rigueur reste largement invisible parce qu’elle se déroule dans des appels d’offres, des architectures cibles, des questionnaires fournisseurs. Elle prend corps dans des dizaines de pages de spécifications techniques, des audits indépendants, des engagements contractuels précis.

Le cas qui domine la conversation publique.

Parmi les cas qui occupent aujourd’hui le débat, celui de Palantir tient une place particulière. Le fait qu’un éditeur américain occupe une position centrale dans certains arbitrages d’infrastructure de l’État français mérite l’attention qui lui est portée. L’impact stratégique d’un tel choix doit être pris au sérieux.

Mais ce contrat public, par sa singularité (notamment un manque de solution concurrente adaptée et un cadre de renouvellement de marché), ne saurait pour autant décrire à lui seul l’état réel de l’exigence souveraine dans la commande publique française de solutions logiciels à l’ère des Big Data et de l’Intelligence Artificielle.

Cette exigence se traduit aujourd’hui en cinq couches d’audit clés :

Couche 1. L’hébergement local, devenu prérequis.

Sur ce point, le consensus est large. Les données d’un client doivent rester dans l’espace juridique européen, idéalement français. Le cadre réglementaire (RGPD, SecNumCloud, directive NIS2) pousse dans cette direction, et même les éditeurs étrangers les plus exposés ont fini par proposer des hébergements régionaux. La couche 1 fait désormais partie des prérequis du marché. Sa valeur de différenciation a disparu. Elle reste facile à vérifier, facile à afficher, et c’est pourquoi elle absorbe l’essentiel de la conversation commerciale.

Couche 2. Le modèle, le vrai point de friction.

Quand une solution met en avant qu’elle utilise de l’intelligence artificielle, la question suivante est automatique : quel modèle, et où est-il hébergé ? Cette question est posée y compris par des acheteurs qui ne sont pas spécialistes des enjeux de SecOps mais qui en ont saisi les implications.

Et dans la quasi-totalité des cas, le moteur cognitif des solutions du marché est un appel API vers l’un des grands modèles de langage généralistes les plus puissants du moment, presque toujours américain (OpenAI, Anthropic, Google).

Ce choix technique pose deux problèmes distincts. Le premier est juridique : même avec un hébergement France, la requête voyage avec son « prompt », qui peut contenir des informations sensibles sur le client, ses concurrents, ses sujets d’intérêt. Le second est stratégique : la compréhension fine des sujets traités est déléguée à une entreprise extérieure dont le contrat ne couvre pas la protection durable de cette compréhension. Une coupure d’accès, un changement de politique d’usage, un verrouillage tarifaire, et la solution perd son cerveau.

Il existe une autre voie, qui demande un investissement certain : construire ou héberger ses propres modèles spécialisés. Des modèles plus petits (SLM), plus ciblés, entraînés sur les tâches critiques de l’outil. Quelques éditeurs français et européens ont fait ce choix, généralement en partenariat avec des laboratoires de recherche. La raison de cet investissement tient directement à ce que dit l’antithèse : les acheteurs publics et les organisations sensibles examinent toute la chaîne, depuis l’hébergement jusqu’aux corpus d’apprentissage. Sans un tel investissement, il est difficile de répondre sérieusement à leurs cahiers des charges.

Cette deuxième couche est là où la souveraineté se joue durablement. Elle conditionne la dépendance, ou son absence, à un fournisseur tiers.

Couche 3. L’apprentissage, à nommer en clair.

Les modèles, qu’ils soient externes ou internes, progressent. Sur quoi ?

Engagement intangible de tout éditeur : les contenus clients ne doivent jamais servir à entraîner un modèle partagé. Ce standard est attendu, contractuellement vérifiable, intégré aux engagements des éditeurs sérieux.

Néanmoins les outils modernes sont en capacité de progresser à partir des retours de leurs utilisateurs. Quand un opérateur indique à l’outil qu’une information est pertinente ou qu’elle ne l’est pas, cette donnée nourrit l’apprentissage de l’outil sur le contexte propre du client. Il s’agit d’une boucle de feedback fonctionnelle, indispensable à la qualité, qui doit être cloisonnée par client et documentée comme telle.

Le problème, sur cette couche, tient à l’opacité. Un éditeur qui revendique « zéro apprentissage » tout en opérant des boucles de feedback décrit la réalité de manière partielle. Les acheteurs publics expérimentés font la différence et valorisent les éditeurs qui décrivent leurs mécanismes en clair.

Couche 4. La collecte et la provenance des données.

Avant même d’être analysées par un modèle, les données qu’un outil traite doivent provenir de quelque part. Cette couche, souvent négligée dans les discussions publiques sur la souveraineté, mérite pourtant un examen précis. Quand un outil s’appuie sur des APIs tierces pour collecter ses contenus, les requêtes elles-mêmes deviennent un signal stratégique : le fournisseur de l’API voit ce qu’on cherche, sur qui, à quelle fréquence, dans quels contextes. Ce signal, en agrégat, peut composer une carte d’intentions sensibles. La même remarque vaut pour les données acquises auprès de courtiers spécialisés : la chaîne de provenance des informations, le contrat qui régit leur utilisation, et la traçabilité des sources sont autant de variables qui conditionnent la souveraineté réelle de l’outil. La couche “collecte” est, à bien des égards, la jumelle silencieuse de la couche “modèle”. Elle fuit dans la même direction si on n’y prête pas attention.

Couche 5. L’actionnariat de l’éditeur.

La cinquième dimension n’est pas technique. Elle est structurelle. Une entreprise éditrice peut être française, hébergée en France, opérer ses propres modèles, contrôler ses sources et son apprentissage. Si son capital est majoritairement détenu par un groupe étranger, en particulier non européen, le risque stratégique réapparaît. Les décisions de roadmap, les arbitrages de partage de données entre entités d’un même groupe, les obligations légales applicables à la maison mère, peuvent à tout moment renvoyer une organisation française vers des choix dictés ailleurs. Cette dimension est rarement examinée dans les appels d’offre, alors qu’elle conditionne la durabilité de toutes les couches précédentes. Une couche technique parfaite peut être annulée par une décision capitalistique qui ne se voit pas dans une fiche produit. Et c’est notamment important à l’heure où des solutions stratégiques étrangères subventionnent massivement des startups européennes fondées par d’anciens employés ou partenaires pour répondre aux quatre précédentes couches de souveraineté.

Confronter le débat public à la réalité.

Pour qui veut vérifier la solidité d’une posture souveraine annoncée, la méthodologie existe. Hébergement vérifié, sans s’y arrêter. Modèle examiné, en demandant qui le contrôle et où passe la requête. Apprentissage documenté, en évitant les formules génériques. Collecte tracée, en regardant chaque source et chaque API. Actionnariat étudié, en remontant la chaîne capitalistique jusqu’à son sommet.

Ces couches d’audit attestent de la solidité des audits réalisés par nos institutions régaliennes dans l’attribution de marchés publics de solutions logiciels. Cette exigence est l’une des armatures qui protège les services régaliens et les administrations sensibles de dépendances technologiques mal arbitrées. Elle est aussi l’une des raisons qui rendent les attributions aussi lentes ; attributions qui dans le contexte géopolitique actuel pourraient bénéficier d’une accélération des processus au bénéfice… de la souveraineté nationale. Un autre sujet qui méritait lui aussi toute sa place dans le débat public.

Une tribune de Ludovic Desgranges, CEO de NewsCore