Propuesta de un diccionario de palabras STEMMER para uso aplicaciones de procesamiento de lenguaje natural
Descripción del Articulo
El recurso más importante que posee la raza humana es conocimiento y la información. En la época actual de información, del manejo eficiente de este conocimiento depende del uso de todos los demás recursos naturales, industriales y humanos. El Procesamiento del Lenguaje Natural (PLN) es el campo que...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2015 |
| Institución: | Universidad Andina Néstor Cáceres Velasquez |
| Repositorio: | UANCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uancv.edu.pe:UANCV/468 |
| Enlace del recurso: | http://repositorio.uancv.edu.pe/handle/UANCV/468 |
| Nivel de acceso: | acceso abierto |
| Materia: | Propuesta Procesamiento Diccionario Palabras STEMMER para uso Aplicaciones |
| Sumario: | El recurso más importante que posee la raza humana es conocimiento y la información. En la época actual de información, del manejo eficiente de este conocimiento depende del uso de todos los demás recursos naturales, industriales y humanos. El Procesamiento del Lenguaje Natural (PLN) es el campo que combina las tecnologías de la ciencia computacional con la lingüística, con el objetivo de hacer posible la comprensión y el procesamiento asistidos por ordenador de información expresada en lenguaje humano para determinadas tareas, como búsquedas de información, la traducción automática, los sistemas de diálogo interactivos, el análisis de opiniones. El PLN no trata de la comunicación por medio de lenguajes naturales de una forma abstracta, sino de diseñar mecanismos para comunicarse y que sean eficaces computacionalmente que se puedan realizar por medio de programas que ejecuten o simulen la comunicación. Los modelos aplicados se enfocan no sólo a la comprensión del lenguaje de por sí, sino a aspectos generales cognitivos humanos y a la organización de la memoria. El lenguaje natural sirve sólo de medio para estudiar estos fenómenos. Hasta la década de 1980, la mayoría de los sistemas de PLN se basaban en un complejo conjunto de reglas diseñadas a mano. A partir de finales de 1980, sin embargo, hubo una revolución en PLN con la introducción de algoritmos de aprendizaje automático, para el procesamiento del lenguaje. La Lematización es un proceso de eliminación automática de partes no esenciales de las palabras para reducirlas a su parte original (lema). El lema es viii la forma que por convenio se acepta como representante de todas las formas flexionadas de una misma palabra. Es decir, el lema de una palabra es la palabra que nos encontraríamos como entrada en un diccionario tradicional. Por ejemplo, decir es el lema de dije, pero también de diré o dijéramos; guapo es el lema de guapas; mesa es el lema de mesas. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).