Extraction automatique d'information, du texte brut au web semantique
Auteur : POIBEAU Thierry
Date de parution: 02-2003
Langue : FRANCAIS
238p. 16x24
Resume
Les entreprises et les particuliers sont confrontes a une masse d'information sans cesse croissante. Partant de ce constat, de nombreux systemes ont ete concus pour filtrer, trier et categoriser l'information. L'offre est en revanche beaucoup plus faible en ce qui concerne l'analyse du contenu. Extraction automatique d'information - du texte brut au web semantique presente les progres recents en
extraction d'information et en comprehension de textes. Les recherches effectuees ces dernieres annees dans le domaine du traitement automatique des langues rendent en effet possible l'annotation
semantique de documents, l'extraction d'information pertinente et la creation de bases de connaissances structurees a partir de textes en langage naturel. L'ouvrage rappelle les grands courants de recherche qui ont marque le domaine de la comprehension automatique de textes par ordinateur. Il se poursuit par la presentation detaillee d'un systeme appele SEMTEX, qui est applique a une grande variete de textes et de situations differentes. Les applications detaillees donnent des perspectives sur le web semantique et l'ingenierie des connaissances.
Sommaire
Introduction.
Chap 1. Des systemes de comprehension de textes aux systemes
d'extraction d'information.
Chap 2. Strategies pour l'acquisition semi-automatique de ressources
pour l'extraction.
Chap 3. Vers une mise en oeuvre operationnelle de l'extraction
d'information.
Chap 4. SemTex : architecture du systeme et cadre applicatif.
Chap 5. Le reperage d'entites nommees : une approche a base de connaissances hybrides.
Chap 6. La mise en relation des entites.
Chap 7. Acquisition semi-automatique de clas! ses semantiques.
Chap 8. Acquisition semi-automatique de patrons d'extraction.
Conclusion.
Annexes.
Themes
> Gestion des donnees dans l'entreprise : groupware, workflow...
> Sciences cognitives appliquees a l'informatique : langage naturel, semantique, linguistique.
La recherche d?information sur les reseaux
Ouvrage coordonne par Jean-Claude Le Moal, Bernard Hidoine et Lisette Calderan, Institut national de recherche en informatique et en automatique (INRIA)
Cours INRIA, 30 septembre - 4 octobre 2002, Le Bono (Morbihan)
Sciences de l?information, serie Etudes et techniques (ISSN 1160-2376)
2002 - 322 pages - ISBN 2-84365-062-3
Prix : 35,00 ? TTC (TVA a 5,5%)
Resume
Pour la deuxieme fois, le cours bisannuel sur l?informatique et l?information scientifique et technique organise par l?INRIA est consacre en 2002 a la recherche d?information sur les reseaux. Extraordinaire essor de ces reseaux electroniques, croissance vertigineuse des volumes d?information disponible sur le Web, developpement des outils et techniques d?exploitation de celle-ci, multiplication des usagers professionnels ou non : autant de raisons de se pencher a nouveau sur le fonctionnement des systemes de recherche, sur l?organisation des documents dans un centre de ressources numerique ou virtuel pour les rendre aisement accessibles en intranet ou sur Internet...
Reflet de ce cours concu par Jean-Claude Le Moal, Bernard Hidoine et Lisette Calderan, cet ouvrage propose au lecteur de mettre a jour ses connaissances sur la recherche d'information. Pour ce faire, des auteurs d'origines diverses ? bibliothecaire ou professionnel de l'industrie de l'information, consultant en IST ou informaticien, chercheur ou enseignant ? exposent a la fois un point de vue sur la situation presente et des perspectives sur les evolutions a venir.
Sylvie Dalbin (ATD-DESYBEL) offre pour commencer un panorama des sources d'information et des instruments de recherche sur le Web. Francois Role (Ministere de la Recherche) presente le langage XML et la documentation structuree. Marie-Elise Freon (Jouve) propose une typologie des metadonnees illustree d'exemples detailles. Pascale Sebillot (IRISA) detaille les techniques de traitement automatique des langues qui laissent entrevoir d?interessantes perspectives. A la recherche des constantes et des mutations dans les pratiques documentaires, Dominique Lahary (BDP du Val-d?Oise) dresse une typologie des bibliotheques virtuelles. Laurent Romary (INRIA-LORIA) montre la necessite de la normalisation pour permettre des echanges d'information efficaces et parvenir a un veritable Web semantique. A titre d?exemple de recherche dans des documents multimedias, Nozha Boujemaa (INRIA) se penche sur l'indexation et la recherche d'images par le contenu visuel. Et Armelle Thomas (Inforizon) complete cet ensemble par l?examen de la veille strategique exercee en entreprise sur les reseaux.
Posted by blog/gaspar
at 12:29 PM CET
Updated: Tuesday, 24 February 2004 12:30 PM CET
Post Comment | Permalink | Share This Post
Updated: Tuesday, 24 February 2004 12:30 PM CET
Post Comment | Permalink | Share This Post