Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

Descripción del Articulo

Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de proces...

Descripción completa

Detalles Bibliográficos
Autor: Bustamante Alvarez, Gina
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/14983
Enlace del recurso:http://hdl.handle.net/20.500.12404/14983
Nivel de acceso:acceso abierto
Materia:Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_59e8b53938f56d21aff4d2770ab69159
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/14983
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
spellingShingle Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Bustamante Alvarez, Gina
Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_full Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_fullStr Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_full_unstemmed Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
title_sort Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
author Bustamante Alvarez, Gina
author_facet Bustamante Alvarez, Gina
author_role author
dc.contributor.advisor.fl_str_mv Oncevay Marcos, Félix Arturo
dc.contributor.author.fl_str_mv Bustamante Alvarez, Gina
dc.subject.es_ES.fl_str_mv Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
topic Interfaces de computadoras--Diseño y construcción
Información--Almacenamiento y recuperación
Algoritmos--Procesamiento de datos
Análisis de datos
Prevención del delito
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.
publishDate 2019
dc.date.accessioned.es_ES.fl_str_mv 2019-09-13T01:43:27Z
dc.date.available.es_ES.fl_str_mv 2019-09-13T01:43:27Z
dc.date.created.es_ES.fl_str_mv 2019
dc.date.issued.fl_str_mv 2019-09-12
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/14983
url http://hdl.handle.net/20.500.12404/14983
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/2e57cd7d-e8da-4dd5-9094-0aa939f2c0bd/download
https://tesis.pucp.edu.pe/bitstreams/b7057810-7757-4f63-8ef1-cc9fb1c82e0d/download
https://tesis.pucp.edu.pe/bitstreams/b274b134-5781-49a8-bc36-732624f8112b/download
https://tesis.pucp.edu.pe/bitstreams/d493110e-6a7d-42ad-8d6c-f97da3b11bc4/download
https://tesis.pucp.edu.pe/bitstreams/e937f200-414a-45d4-b4d8-1bfa182a0f3e/download
bitstream.checksum.fl_str_mv c0c8ee7e117c8047a411bda86ff79b9e
25cd7e64ca0600de9c9eb4c1c406ca7d
35481b2c8d414f16a5a053be5878fdb5
e938267478d0bea7a27e4ca43553bc25
c3b175e6447566d3d8b83cb20170f099
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736989394436096
spelling Oncevay Marcos, Félix ArturoBustamante Alvarez, Gina2019-09-13T01:43:27Z2019-09-13T01:43:27Z20192019-09-12http://hdl.handle.net/20.500.12404/14983Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Interfaces de computadoras--Diseño y construcciónInformación--Almacenamiento y recuperaciónAlgoritmos--Procesamiento de datosAnálisis de datosPrevención del delitohttps://purl.org/pe-repo/ocde/ford#1.02.00Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenesinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática46440101https://orcid.org/0000-0001-7675-6208612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdfBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdfTexto completoapplication/pdf15349249https://tesis.pucp.edu.pe/bitstreams/2e57cd7d-e8da-4dd5-9094-0aa939f2c0bd/downloadc0c8ee7e117c8047a411bda86ff79b9eMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8919https://tesis.pucp.edu.pe/bitstreams/b7057810-7757-4f63-8ef1-cc9fb1c82e0d/download25cd7e64ca0600de9c9eb4c1c406ca7dMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81650https://tesis.pucp.edu.pe/bitstreams/b274b134-5781-49a8-bc36-732624f8112b/download35481b2c8d414f16a5a053be5878fdb5MD53falseAnonymousREADTHUMBNAILBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.jpgBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.jpgIM Thumbnailimage/jpeg12181https://tesis.pucp.edu.pe/bitstreams/d493110e-6a7d-42ad-8d6c-f97da3b11bc4/downloade938267478d0bea7a27e4ca43553bc25MD54falseAnonymousREADTEXTBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.txtBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.txtExtracted texttext/plain124699https://tesis.pucp.edu.pe/bitstreams/e937f200-414a-45d4-b4d8-1bfa182a0f3e/downloadc3b175e6447566d3d8b83cb20170f099MD55falseAnonymousREAD20.500.12404/14983oai:tesis.pucp.edu.pe:20.500.12404/149832025-03-12 17:56:52.179http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTElDRU5DSUEgRVNUw4FOREFSCgpCYWpvIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcywgYXV0b3Jpem8gZWwgZGVww7NzaXRvIGRlIG1pIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gZW4gZWwgUmVwb3NpdG9yaW8gRGlnaXRhbCBkZSBUZXNpcyBQVUNQLiAKCkNvbiBsYSBhdXRvcml6YWNpw7NuIGRlIGRlcMOzc2l0byBkZSBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuLCBvdG9yZ28gYSBsYSBQb250aWZpY2lhIFVuaXZlcnNpZGFkIENhdMOzbGljYSBkZWwgUGVyw7ogdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSBwYXJhIHJlcHJvZHVjaXIsIGRpc3RyaWJ1aXIsIGNvbXVuaWNhciBhbCBww7pibGljbyB0cmFuc2Zvcm1hciAow7puaWNhbWVudGUgbWVkaWFudGUgc3UgdHJhZHVjY2nDs24gYSBvdHJvcyBpZGlvbWFzKSB5IHBvbmVyIGEgZGlzcG9zaWNpw7NuIGRlbCBww7pibGljbyBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIChpbmNsdWlkbyBlbCByZXN1bWVuKSwgZW4gZm9ybWF0byBmw61zaWNvIG8gZGlnaXRhbCwgZW4gY3VhbHF1aWVyIG1lZGlvLCBjb25vY2lkbyBwb3IgY29ub2NlcnNlLCBhIHRyYXbDqXMgZGUgbG9zIGRpdmVyc29zIHNlcnZpY2lvcyBwcm92aXN0b3MgcG9yIGxhIFVuaXZlcnNpZGFkLCBjcmVhZG9zIG8gcG9yIGNyZWFyc2UsIHRhbGVzIGNvbW8gZWwgUmVwb3NpdG9yaW8gRGlnaXRhbCBkZSBUZXNpcyBQVUNQLCBjb2xlY2Npw7NuIGRlIHRyYWJham9zIGRlIGludmVzdGlnYWNpw7NuLCBlbnRyZSBvdHJvcywgZW4gZWwgUGVyw7ogeSBlbiBlbCBleHRyYW5qZXJvLCBwb3IgZWwgdGllbXBvIHkgdmVjZXMgcXVlIGNvbnNpZGVyZSBuZWNlc2FyaWFzLCB5IGxpYnJlIGRlIHJlbXVuZXJhY2lvbmVzLiBFbiB2aXJ0dWQgZGUgZGljaGEgbGljZW5jaWEsIGxhIFBvbnRpZmljaWEgVW5pdmVyc2lkYWQgQ2F0w7NsaWNhIGRlbCBQZXLDuiBwb2Ryw6EgcmVwcm9kdWNpciBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIGVuIGN1YWxxdWllciB0aXBvIGRlIHNvcG9ydGUgeSBlbiBtw6FzIGRlIHVuIGVqZW1wbGFyLCBzaW4gbW9kaWZpY2FyIHN1IGNvbnRlbmlkbywgc29sbyBjb24gcHJvcMOzc2l0b3MgZGUgc2VndXJpZGFkLCByZXNwYWxkbyB5IHByZXNlcnZhY2nDs24uIERlY2xhcm8gcXVlIGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gZXMgdW5hIGNyZWFjacOzbiBkZSBtaSBhdXRvcsOtYSB5IGV4Y2x1c2l2YSB0aXR1bGFyaWRhZCwgbyBjby1hdXRvcsOtYSBjb24gdGl0dWxhcmlkYWQgY29tcGFydGlkYSwgeSBtZSBlbmN1ZW50cm8gZmFjdWx0YWRvIGEgY29uY2VkZXIgbGEgcHJlc2VudGUgbGljZW5jaWEgeSwgYXNpbWlzbW8sIGdhcmFudGl6byBxdWUgZGljaG8gdHJhYmFqbyBkZSBpbnZlc3RpZ2FjacOzbiBubyBpbmZyaW5nZSBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJhcyBwZXJzb25hcy4gTGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBDYXTDs2xpY2EgZGVsIFBlcsO6IGNvbnNpZ25hcsOhIGVsIG5vbWJyZSBkZWwvIGxvcyBhdXRvci9lcyBkZWwgdHJhYmFqbyBkZSBpbnZlc3RpZ2FjacOzbiwgeSBubyBsZSBoYXLDoSBuaW5ndW5hIG1vZGlmaWNhY2nDs24gbcOhcyBxdWUgbGEgcGVybWl0aWRhIGVuIGxhIHByZXNlbnRlIGxpY2VuY2lhLgoK
score 13.934021
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).