FRNL | | NewsBibliothèqueAgendaNewsletterJobsAdvertisingContact |
  
Accueil » Une solution IA structure et interprète des documents numériques

Une solution IA structure et interprète des documents numériques



La start-up gantoise Paperbox, spin-off de Skyhaus, la maison-mère du spécialiste IA ML6, lance une nouvelle plate-forme intelligente qui aide les entreprises à structurer la montagne de documents qu’elles doivent traiter chaque jour. Sur la base du contenu, le logiciel réussit, en tant que plate-forme ‘as a Service’, à distinguer et trier des documents tels que des factures, des bons de livraison, des documents de transport ou des contrats. En outre, la solution permet aussi d’extraire automatiquement des données comme le numéro de TVA, la description du produit et les clauses.

Le créateur Maarten Callaert explique que Paperbox entend aider les entreprises, principalement dans les secteurs logistique et financier, à convertir leurs documents non structurés en informations concrètes : « De nombreuses entreprises sont confrontées à une croissance sauvage des documents qui absorbe énormément de temps et de budget. Chaque année, des milliers voire des millions de documents comme des factures, des demandes d’indemnisation, des contrats et des PV s’empilent, et souvent dans des langues différentes. De ce fait, de nombreux collaborateurs ne voient plus l’essentiel et des événements tels que le Brexit ou la Covid-19 ont à ce niveau tout sauf un impact positif. »

Un logiciel ‘autodidacte’
Le module ‘Classify’ reprend en vrac et automatiquement dans la plate-forme Paperbox tous les documents des clients, partenaires et fournisseurs via une API. Ensuite, la plate-forme va les classer par type dans différents dossiers ou ‘boxes’. L’utilisateur ne doit donc pas chercher dans différents dossiers, dans les armoires, sur les serveurs ou les disques durs mais a accès, par le biais d’un tableau de bord en ligne convivial, à une seule source pour tous les documents de l’entreprise.

Le module ‘Extract’ retire, au moyen du ‘natural language processing’, les différentes données des documents, comme le numéro de TVA, la date, l’expéditeur et la description du produit, mais aussi des champs plus complexes comme les clauses et les paragraphes des contrats et des conditions générales. Stijn Decubber, Product Lead et Tech Lead de Paperbox précise : « Les algorithmes sous-jacents sont autodidactes. Chaque détection se produit avec un certain niveau de certitude. Lorsque celui-ci descend sous un seuil donné, l’utilisateur peut intervenir pour confirmer ou corriger. De cette manière, les algorithmes sont ‘éduqués’ et l’utilisateur peut programmer la plate-forme en fonction de ses besoins spécifiques. »

Paperbox sera disponible moyennant un petit coût d’activation et un abonnement mensuel selon le volume des documents et le choix des modules.
Didier Van Den Eynde
08-09-2020