viernes, 5 de marzo de 2010

RESUM AUTOMÀTIC


SISTEMES DE RESUM AUTOMÀTIC DE DOCUMENTS
El concepte d'informació ha canviat degut a l'aparició d'Internet i, és per això, que s'han promogut noves tecnologies per a la recuperació i extracció d'informació per confeccionar resums automàtics.
Hi ha dues tecnologies per fer un resum. En primer lloc, s'obté la informació i, després s'extrau la que ens interessa. Aleshores, es crea un document nou que només contingui la informació rellevant.
Les tècniques per resumir automàticament són tres: la basada en els tractaments superficials, que no fa cap anàlisi lingüística; la basada en les entitats anomenades en el text, que fa un reconeixement i classificació del lèxic; i la basada en l'estructura discursiva, que detecta els marcadors discursius.D'una banda, hi ha diversos productes per efectuar resums com el d'Inxight (Xerox), el de Copernic, el de Microsoft Word i també els de la pàgina de Mitre Org. De l'altra, com a mètodes en desenvolupament cal destacar el SweSun i l'Estractor (amb resums en espanyol).
Per acabar, i pel que fa a la investigació, convé ressaltar les pàgines de la Universitat d'Otawa. Així mateix, a l'Estat Espanyol s'està fent un resumidor de notícies al projecte Hermes.

No hay comentarios: