REPORTAGE. Piscines non-déclarées, fraudes à la TVA, travail au noir... Comment l'intelligence artificielle aide le fisc à traquer les fraudeurs

→ Оригинал (без защиты от корпорастов) | Изображения из статьи: [1]

Le fisc utilise l'IA et plus largement les nouvelles technologies pour débusquer les contribuables qui ne paient pas tous leurs impôts. Précurseur en la matière, il planche sur ces outils numériques depuis une dizaine d'années. Dernière avancée : le fisc chasse les constructions non déclarées, depuis les airs.

Imaginez : vous faites construire un garage, un abri de jardin, une maisonnette et vous "oubliez" de le signaler. Vous risquez fort d'être rattrapé par le dispositif "Foncier innovant". Son expérimentation a commencé dans neuf départements, en 2022, avant d'être étendue à toute la métropole l'année suivante, avec d'abord la détection des piscines non déclarées. Bilan : 140 000 piscines débusquées, soit 40 millions d'euros de recettes fiscales en plus.

"Aucune imposition automatiquement déclenchée"

Concrètement, l'algorithme compare des images aériennes publiques de l'IGN aux données du cadastre. S'il repère sur une photo une piscine non déclarée, il le signale. Un agent vérifie et le cas échéant le propriétaire est invité à régulariser sa situation. Marina Fages, cheffe de bureau du cadastre, et responsable du projet, précise : "Il n'y a aucune imposition automatiquement déclenchée : un agent analyse, puis valide ou rejette la détection." Et le taux de réussite ? "Après validation, 94% des propriétaires confirment avoir une piscine. La proportion de détections validées en amont tourne autour des 2/3." L'algorithme progresse : au début, il prenait parfois des bâches pour des piscines.

Détecter des piscines non déclarées, les services des impôts le faisait déjà, mais ponctuellement, explique Marina Fages : "Le réel apport du projet Foncier Innovant c'est le caractère systématique et industrialisé de cette détection-là. C'est vraiment un gage d'équité fiscale qui permet aux services fonciers d'être beaucoup plus percutants en matière de fiabilisation des bases sur ces axes-là."

Mais Damien Robinet, secrétaire national du syndicat Solidaires Finances Publiques lui, dénonce un dispositif "conditionné à la suppression de 300 emplois" et une "dématérialisation à outrance, des conditions de travail dégradées pour les personnels des finances publiques, et une détérioration de la précision du plan cadastral." Il s'interroge aussi sur l'appel à des prestataires externes : Bercy s'est d'abord appuyé sur Google et Capgemini pour développer ce projet à 30 millions d'euros, avant de réinternaliser progressivement les compétences. Marina Fages l'assure : "Le projet Foncier Innovant modifie les méthodes de travail. C'est l'ajout d'une nouvelle corde à notre arc. Le géomètre du cadastre reste un maillon essentiel sur la mission fiscale."

Le fisc développe beaucoup d'autres algorithmes

Le pôle "data mining" - fouille de données - du service du contrôle fiscal compte 33 membres dont 10 data scientists - c'est trop peu, dit d'ailleurs un rapport du Sénat. Mais trois personnes de plus viennent d'être recrutées dans le cadre de la lutte contre la fraude. Et il y a de la matière à explorer : six téraoctets.

Carole Maudet, sous directrice du contrôle fiscal, nous le décrit : "Nous avons des millions, voire des milliards de données à la fois en interne [les déclarations par exemple] et celles de nos principaux partenaires, autres administrations de contrôle. On a aussi des échanges automatiques d'information avec les autres administrations fiscales étrangères." Le tout est stocké sur un serveur, ajoute le responsable du service Gilles Clabecq, "quelque part en France". On n'en saura pas plus, question de sécurité.

Croiser ces données, c'est la mission des algorithmes du service qui font ressortir des "anomalies". Autant dire, des potentielles erreurs de déclaration, voire des fraudes, tant pour les entreprises que pour les particuliers. Le premier modèle remonte à 2020, pour les particuliers raconte Gilles Clabecq : "Il estimait à partir de votre patrimoine immobilier, le niveau attendu au niveau fiscal. Il a donné de très bons résultats : un dossier sur deux a donné lieu à validation de l'anomalie."

Carole Maudet l'assure, après c'est toujours un humain qui décide : "Il n'y a pas de contrôle automatique. Le bureau transmet des informations dans les services locaux qui seuls décident ou non d'engager un contrôle fiscal." 

"Il n'y a pas de robot ou d'humanoïde qui traverserait les couloirs et qui déciderait tout seul. D'ailleurs, il n'y a pas d'intelligence artificielle sans être humain, ça n'existe pas."

Carole Maudet

à franceinfo

Le "web scrapping"

L'an dernier, les contrôles issus du "data mining" ont permis la mise en recouvrement de 2,5 milliards d'euros sur 15,2 au total. Damien Robinet dénonce des suppressions de poste, "une dépossession de la technicité des personnels" et "parfois une incompréhension des résultats proposés par l'intelligence artificielle". La mise en place du projet CVFR (Ciblage de la Fraude et Valorisation des Requêtes) a été, selon la Direction Générale des Finances Publiques, assortie de la suppression de 400 emplois à temps plein.

L'administration fiscale va aussi à la pêche aux informations sur les réseaux sociaux et les sites de vente en ligne. Des petites annonces offrant des prestations (coiffure, déménagement, plomberie, informatique), des ventes non déclarées de voitures ou bien des locations. L'idée est de vérifier en comparant avec les bases de données du fisc si leurs auteurs déclarent bien tout ça à l'Etat. Ça s'appelle du "web scrapping" - du moissonnage de données.

"L'expérimentation a débuté avec la loi de finance pour 2020 et a été renouvelée en 2024", explique Gilles Clabecq. La DGFIP est autorisée à collecter les données sur les réseaux sociaux, pendant un temps limité. Ça permet de détecter trois anomalies : "Les activités occultes, la fraude à la domiciliation, et, depuis la nouvelle expérimentation, la détection de la minoration de recettes."

"Détecter les entreprises ou les entrepreneurs qui déclarent un chiffre d'affaires qui semble incohérent au regard de leurs activités économiques sur les réseaux sociaux"

Gilles Clabecq

à franceinfo

C'est "vraiment très encadré, évidemment tout est déclaré auprès de la CNIL", ajoute-t-il. "Il y a un nombre très limité, au sein du bureau, d'agents qui collectent les données. Ils sont deux et deux autres personnes conçoivent les robots de collecte. C'est toujours l'humain qui intervient derrière, il n'y a pas un algorithme fou qui est en train de scraper l'ensemble des pages des citoyens !"

Des comptes sous pseudonyme pour enquêter sur les réseaux

Autre nouveauté avec la loi de finances 2024 : certains agents "spécialement habilités" pourront créer un compte sous pseudonyme pour enquêter sur les réseaux qui l'exigent - par exemple, Facebook, Instagram, ou Linkedin. Ce sera possible dès la parution d'un décret d'application, qui doit être publié "prochainement", dit la DGFIP. Pour Damien Robinet, "c'est de la communication", "aujourd'hui la grosse fraude fiscale ne se cache pas là. C'est un élément parmi d'autres, mais c'est l'arbre qui cache la forêt. Il faut arrêter les suppressions de postes, on en a eu 36 000 depuis 2008 à la DGFIP".

"On n'est pas anti-technologies à Solidaires Finances Publiques, loin de là, résume le syndicaliste. La question c'est quelle finalité on met à l'utilisation des outils technologiques. Aujourd'hui on a le sentiment qu'ils sont surtout déployés pour permettre des économies plus que pour avoir une efficacité substantielle dans le contrôle fiscal".

Bilan de cette expérimentation entre 2021 et mi-2023 : plus d'un million d'annonces aspirées, 160 dossiers d'activités occultes repérés et 17 contrôles fiscaux lancés, révélait le Monde en décembre dernier. Mais ce sont des chiffres provisoires, beaucoup d'enquêtes sont encore en cours.