1
tesis de maestría
Publicado 2017
Enlace
Enlace
El reconocimiento de entidades nombradas es una tarea relevante en el a´rea de Procesamiento de Lenguaje Natural, su funci´on es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma ingl´es. Recientes estudios en el idioma ingl´es han mostrado que utilizar caracter´ısticas no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si caracter´ısticas no supervisadas pueden mejorar la tarea de NER supervisado en el idioma espan˜ol. Para esto, se propone utilizar caracter´ısticas no supervisadas mediante word representations y colocaciones, as´ı como caracter´ısticas adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular ...
2
tesis de maestría
Publicado 2017
Enlace
Enlace
El reconocimiento de entidades nombradas es una tarea relevante en el área de Procesamiento de Lenguaje Natural, su función es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma inglés. Recientes estudios en el idioma inglés han mostrado que utilizar características no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si características no supervisadas pueden mejorar la tarea de NER supervisado en el idioma español. Para esto, se propone utilizar características no supervisadas mediante word representations y colocaciones, así como características adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utili...