ESG & NLP

Extraction de données extra-financières dans des documents non structurés (PDF)

Fabrice Pont | 04.09.20

Le format PDF est le format standard de diffusion des rapports d’entreprises (annuels, financiers, …) et ces rapports représentent la source principale d’information des investisseurs sur les marchés. En particulier, les stratégies d’Investissement Socialement Responsable (ISR) se basent sur l’analyse et la comparaison de Key Performance Indicator (KPI) en lien avec l’Environnement, l’Aspect social et les méthodes de Gouvernance des entreprises (dits « KPI ESG »). Ces indicateurs sont publiés au sein des rapports d’entreprises que les investisseurs analysent pour décider de leur stratégie. La récupération de ces données spécifiques n’est pas aisée car elles sont noyées au milieu de rapports conséquents et l’analyse se fait essentiellement manuellement ce qui représente un temps considérable étant donné le nombre très important d’entreprises différentes. 

Cet article présente notre outil d’assistance de récupération de ces données qui permet d’analyser les rapports d’entreprises et d’en retirer des informations précises (ex : empreinte carbone) en récupérant du mieux possible son contexte. Notre approche est basée sur deux composantes qui sont l’extraction de données brutes d’un fichier PDF suivi d’une analyse des documents en utilisant l’état de l’art en traitement du langage naturel (NLP). Les résultats de notre programme sur l’analyse des rapports du CAC40 montrent qu’une grosse part du travail d’extraction d’information, faite habituellement à la main par des analystes, peut être automatisée ou semi-automatisée.

Extrait de l’étude

Je souhaite recevoir l’étude :

« Technologie NLP : Extraction d’informations dans des documents non structurés (pdf) »

 




    Un email est envoyé au remplissage du formulaire. N’hésitez pas à vérifier vos spams si vous ne le recevez pas dans votre boîte de réception.

    Latest News

    Le rapport RTS SFDR : les exigences informationnelles finalisées

    Le rapport RTS SFDR : les exigences informationnelles finalisées

    Le rapport final du RTS sur le règlement SFDR a enfin été publié le 22 octobre 2021 après plusieurs mois d’attente ! Ce rapport remplace la version publiée en février dernier et entrera en vigueur dès le 1er juillet 2022.L’équipe WeeFin a décrypté et synthétisé les...

    WeeFin finaliste du challenge Fintech For Tomorrow

    WeeFin finaliste du challenge Fintech For Tomorrow

    WeeFin finaliste du Challenge Fintech For Tomorrow au Climate Finance DayWeeFin a eu la chance d'être séléctionné en finale du challenge Fintech For Tomorrow pour sa plateforme Saas ESG Connect. Depuis 2018, le Challenge mobilise les énergies des acteurs français de...

    Cet article vous a plu ? Partagez-le :)