Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

Descripción del Articulo

Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de proces...

Descripción completa

Detalles Bibliográficos
Autor: Bustamante Alvarez, Gina
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/167938
Enlace del recurso:http://hdl.handle.net/20.500.12404/14983
Nivel de acceso:acceso abierto
Materia:Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_8853ee7dff7202044fdb82a9cad5f426
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/167938
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Oncevay Marcos, Félix ArturoBustamante Alvarez, Gina2019-09-13T01:43:27Z2019-09-13T01:43:27Z20192019-09-12http://hdl.handle.net/20.500.12404/14983Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Interfaces de computadoras--Diseño y construcciónInformación--Almacenamiento y recuperaciónAlgoritmos--Procesamiento de datosAnálisis de datosPrevención del delitohttps://purl.org/pe-repo/ocde/ford#1.02.00Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenesinfo:eu-repo/semantics/bachelorThesisTesis de licenciaturareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática46440101https://orcid.org/0000-0001-7675-6208612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis20.500.14657/167938oai:repositorio.pucp.edu.pe:20.500.14657/1679382024-07-08 09:57:03.846http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
spellingShingle Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Bustamante Alvarez, Gina
Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_full Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_fullStr Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_full_unstemmed Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_sort Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
author Bustamante Alvarez, Gina
author_facet Bustamante Alvarez, Gina
author_role author
dc.contributor.advisor.fl_str_mv Oncevay Marcos, Félix Arturo
dc.contributor.author.fl_str_mv Bustamante Alvarez, Gina
dc.subject.es_ES.fl_str_mv Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
topic Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.
publishDate 2019
dc.date.accessioned.es_ES.fl_str_mv 2019-09-13T01:43:27Z
dc.date.available.es_ES.fl_str_mv 2019-09-13T01:43:27Z
dc.date.created.es_ES.fl_str_mv 2019
dc.date.issued.fl_str_mv 2019-09-12
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.none.fl_str_mv Tesis de licenciatura
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/14983
url http://hdl.handle.net/20.500.12404/14983
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638411168317440
score 13.982926
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).