Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Descripción del Articulo
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de proces...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2019 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/167938 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/14983 |
Nivel de acceso: | acceso abierto |
Materia: | Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
RPUC_8853ee7dff7202044fdb82a9cad5f426 |
---|---|
oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/167938 |
network_acronym_str |
RPUC |
network_name_str |
PUCP-Institucional |
repository_id_str |
2905 |
spelling |
Oncevay Marcos, Félix ArturoBustamante Alvarez, Gina2019-09-13T01:43:27Z2019-09-13T01:43:27Z20192019-09-12http://hdl.handle.net/20.500.12404/14983Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Interfaces de computadoras--Diseño y construcciónInformación--Almacenamiento y recuperaciónAlgoritmos--Procesamiento de datosAnálisis de datosPrevención del delitohttps://purl.org/pe-repo/ocde/ford#1.02.00Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenesinfo:eu-repo/semantics/bachelorThesisTesis de licenciaturareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática46440101https://orcid.org/0000-0001-7675-6208612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis20.500.14657/167938oai:repositorio.pucp.edu.pe:20.500.14657/1679382024-07-08 09:57:03.846http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
dc.title.es_ES.fl_str_mv |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
title |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
spellingShingle |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes Bustamante Alvarez, Gina Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
title_full |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
title_fullStr |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
title_full_unstemmed |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
title_sort |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
author |
Bustamante Alvarez, Gina |
author_facet |
Bustamante Alvarez, Gina |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Oncevay Marcos, Félix Arturo |
dc.contributor.author.fl_str_mv |
Bustamante Alvarez, Gina |
dc.subject.es_ES.fl_str_mv |
Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito |
topic |
Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos. |
publishDate |
2019 |
dc.date.accessioned.es_ES.fl_str_mv |
2019-09-13T01:43:27Z |
dc.date.available.es_ES.fl_str_mv |
2019-09-13T01:43:27Z |
dc.date.created.es_ES.fl_str_mv |
2019 |
dc.date.issued.fl_str_mv |
2019-09-12 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.other.none.fl_str_mv |
Tesis de licenciatura |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/14983 |
url |
http://hdl.handle.net/20.500.12404/14983 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Institucional |
collection |
PUCP-Institucional |
repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
repository.mail.fl_str_mv |
repositorio@pucp.pe |
_version_ |
1835638411168317440 |
score |
13.982926 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).