ESG & NLP
Extraction de données extra-financières dans des documents non structurés (PDF)
Fabrice Pont | 04.09.20
Le format PDF est le format standard de diffusion des rapports d’entreprises (annuels, financiers, …) et ces rapports représentent la source principale d’information des investisseurs sur les marchés. En particulier, les stratégies d’Investissement Socialement Responsable (ISR) se basent sur l’analyse et la comparaison de Key Performance Indicator (KPI) en lien avec l’Environnement, l’Aspect social et les méthodes de Gouvernance des entreprises (dits « KPI ESG »). Ces indicateurs sont publiés au sein des rapports d’entreprises que les investisseurs analysent pour décider de leur stratégie. La récupération de ces données spécifiques n’est pas aisée car elles sont noyées au milieu de rapports conséquents et l’analyse se fait essentiellement manuellement ce qui représente un temps considérable étant donné le nombre très important d’entreprises différentes.
Cet article présente notre outil d’assistance de récupération de ces données qui permet d’analyser les rapports d’entreprises et d’en retirer des informations précises (ex : empreinte carbone) en récupérant du mieux possible son contexte. Notre approche est basée sur deux composantes qui sont l’extraction de données brutes d’un fichier PDF suivi d’une analyse des documents en utilisant l’état de l’art en traitement du langage naturel (NLP). Les résultats de notre programme sur l’analyse des rapports du CAC40 montrent qu’une grosse part du travail d’extraction d’information, faite habituellement à la main par des analystes, peut être automatisée ou semi-automatisée.
Extrait de l’étude

Je souhaite recevoir l’étude :
“Technologie NLP : Extraction d’informations dans des documents non structurés (pdf)”
Un email est envoyé au remplissage du formulaire. N’hésitez pas à vérifier vos spams si vous ne le recevez pas dans votre boîte de réception.
Latest News
European ESG Template (EET) Un modèle pour faciliter l’échange d’informations liées à l’ESG
European ESG Template (EET) Un modèle pour faciliter l’échange d’informations liées à l’ESG.L'équipe WeeFin - 27.02.2023FinDatEx, une association de place, a pour mission de faciliter le processus d’échange de données entre les parties prenantes sur les marchés...
Investissement durable : quand la transparence se fait opaque
Un monde de paradoxes Orienter les flux de capitaux vers des entreprises plus vertueuses pour répondre aux défis environnementaux et sociaux est primordial et s’inscrit dans les initiatives réglementaires de la commission européenne via le green deal. Si...
Les Principales Incidences Négatives (PAI) – des indicateurs cruciaux pour mettre en évidence l’impact de vos investissements sur les enjeux Environnementaux, Sociaux et de Gouvernance
La finance durable est un domaine très évolutif du point de vue des pratiques de marché, des méthodologies et des exigences règlementaires. L’équipe d’experts ESG de WeeFin décrypte toutes ces évolutions afin d’apporter son regard critique et de vous partager ses...