L’information et la connaissance sont au cœur de la vie des entreprises et des industries. Elles prennent une part importante dans les processus de décision et le maintien du savoir-faire de toutes organisations. L’accès et plus largement l’analyse des informations et connaissances contenues dans ces documents sont rendus complexe par leur profusion. Très souvent, on fait appel au collègue qui connaît tous les projets, qui sait qui a travaillé sur quel sujet et les difficultés rencontrées. Ce collègue joue le rôle de gardien de mémoire dont parlait Aristote. Parfois ce rôle est joué par un service d’archiviste qui va utiliser des méthodes de classifications de documents, telle celle du Dewey pour pouvoir retrouver l’information

Aujourd’hui, 80% de l’information est portée par des documents contenant de l’information non-structurée, mais l’accès et l’analyse des informations contenues dans ces documents sont rendus complexes par leur profusion. Les outils développés au List permettent de structurer les données des entreprises en fonction d’une ontologie définie apriori et avoir une exploitation en fonction des besoins utilisateurs. L’analyse du texte se base sur la plateforme LIMA et l’adaptation à un nouveau domaine ou une nouvelle application se fait en utilisant CLIMA.

Les capacités croissantes de l’informatique ont permis l’apparition de procédés de Gestion électronique de Documents (GED) qui visent à organiser et gérer des documents au sein d’une organisation en mettant en œuvre des systèmes d’acquisition, d’indexation, de classement, de stockage, d’accès et de diffusion.  Les outils NLP peuvent être interfacées avec une solution de GED afin d’y apporter une composante data-mining et ainsi élargir les fonctionnalités de la GED.

ANT’inno, notre partenaire industriel pour la GED