Projet VIDOC : l’IA d’Hyperlex traite plus de 4 millions de documents fonciers en 20h pour la Chambre des Notaires de Paris

Projet VIDOC : l’IA d’Hyperlex traite plus de 4 millions de documents fonciers en 20h pour la Chambre des Notaires de Paris

18 OCTOBRE 2019

Suite à la signature d’une convention signée entre la Chambre des Notaires de Paris et la Direction Générale des Finances Publiques (DGFIP) en 2017, Hyperlex a accompagné le notariat parisien dans la création de la base VIDOC qui permet la consultation des fiches de révision foncière. Il s’agissait pour les algorithmes d’Intelligence Artificielle d’Hyperlex d’anonymiser des masses de documents avant leur mise en ligne et d’automatiser le tri de millions de fichiers.


/actus/vidoc-chambre-notaires-paris-hyperlex

Qu’est-ce que la base VIDOC ?

VIDOC (pour “VIsualisation de la DOcumentation Cadastrale”) permet de répondre aux demandes des clients de l’ensemble des offices notariaux de France, mais aussi aux professionnels et aux particuliers, en mettant à disposition une base de données immobilières référençant l’affectation des biens immobiliers à Paris.

Contexte du projet VIDOC

Il revient au notaire chargé d’établir un acte authentique portant sur un local affecté à un autre usage que l’habitation (par exemple bureaux et commerces...) de vérifier la régularité de l’usage. Le notaire doit alors consulter la base des déclarations d’usage.

En mars 2016, pour les biens situés à Paris, la Direction Régionale des Finances Publiques de Paris annonce qu’elle ne délivrerait plus de copies des déclarations d’usage. La Chambre des Notaires de Paris a signé une convention en 2017 afin de reprendre à sa charge cette mission nécessaire aux notaires.

La problématique à laquelle répondre : traiter rapidement et de manière fiable de gros volumes de documents

Au démarrage du projet, la Chambre des Notaires de Paris disposait de 10 millions de pages pour 2,4 millions de fichiers. L’objectif était de trier et d'anonymiser ces masses documentaires afin de permettre leur mise en ligne. Mais comment faire pour traiter tant de documents sans y passer des années ? La puissance de l’IA d’Hyperlex a permis d’aboutir ce projet en un temps record... On vous dit tout, ci-dessous.

Déroulement du projet VIDOC : l’expertise humaine associée à la rapidité de l’IA

Certaines informations confidentielles devant être masquées lors de la consultation de ces documents, la Chambre des Notaires de Paris a eu recours à l’intelligence artificielle d’Hyperlex pour :

  • supprimer les pages indésirables (documents propres à l’administration fiscale) ;
  • référencer les types de déclarations présents dans chaque fichier ;
  • améliorer l’indexation des données (reconnaissance automatique des adresses manuscrites par exemple) pour faciliter la consultation.

Pendant 10 mois, de mai 2017 à mars 2018, les équipes du projet qui associent des notaires, la DSI de la Chambre des Notaires de Paris et les ingénieurs d’Hyperlex, labellisent les documents et entraînent l’IA.

Concrètement, pour les experts métier, il s’agit “d’étiqueter” des documents bruts afin d’exercer l’IA à la reconnaissance des types de documents et des informations clés qu’ils contiennent (par exemple : “le fichier 00001.pdf est un permis de construire”). Pour les ingénieurs d’Hyperlex, il s’agit de paramétrer les algorithmes, au fur et à mesure de l’apprentissage, afin d’obtenir les meilleurs résultats et de permettre par la suite à l’IA de reconnaître les informations de manière autonome.

Les résultats du projet VIDOC : gain de temps et fiabilité

Une fois entraîné, l’algorithme d’intelligence artificielle d’Hyperlex a pu supprimer un total de 4,2 millions de pages dans 2,2 millions de fichiers. Le temps de calcul de l’algorithme n’aura duré que 20h (140 pages analysées par seconde, 34 fichiers traités par seconde). Il aurait fallu 25 ans pour une personne seule à raison d’un fichier par minute, pendant 7h par jour et sur 220 jours ouvrés par an.

Quant à s'interroger sur la fiabilité de l'IA, elle était aussi au rendez-vous : le taux de classification correct mesuré a été supérieur à 99,5%.

Plébiscitée par les notaires, la base VIDOC a été consultée environ 400 000 fois depuis son ouverture en mars 2018.

À découvrir aussi : le projet VictorIA, second projet mené conjointement par Hyperlex et la Chambre des Notaires de Paris. 🔎 Découvrir le projet

👉 Vous souhaitez en savoir plus sur nos solutions et notre IA ? N'hésitez pas à contacter notre équipe !

Découvrez Hyperlex !

Découvrez comment nous pouvons transformer votre travail au quotidien.