Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Descripción del Articulo
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de proces...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2019 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/14983 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/14983 |
| Nivel de acceso: | acceso abierto |
| Materia: | Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_59e8b53938f56d21aff4d2770ab69159 |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/14983 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| title |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| spellingShingle |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes Bustamante Alvarez, Gina Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| title_full |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| title_fullStr |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| title_full_unstemmed |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| title_sort |
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes |
| author |
Bustamante Alvarez, Gina |
| author_facet |
Bustamante Alvarez, Gina |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Oncevay Marcos, Félix Arturo |
| dc.contributor.author.fl_str_mv |
Bustamante Alvarez, Gina |
| dc.subject.es_ES.fl_str_mv |
Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito |
| topic |
Interfaces de computadoras--Diseño y construcción Información--Almacenamiento y recuperación Algoritmos--Procesamiento de datos Análisis de datos Prevención del delito https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos. |
| publishDate |
2019 |
| dc.date.accessioned.es_ES.fl_str_mv |
2019-09-13T01:43:27Z |
| dc.date.available.es_ES.fl_str_mv |
2019-09-13T01:43:27Z |
| dc.date.created.es_ES.fl_str_mv |
2019 |
| dc.date.issued.fl_str_mv |
2019-09-12 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/14983 |
| url |
http://hdl.handle.net/20.500.12404/14983 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/2e57cd7d-e8da-4dd5-9094-0aa939f2c0bd/download https://tesis.pucp.edu.pe/bitstreams/b7057810-7757-4f63-8ef1-cc9fb1c82e0d/download https://tesis.pucp.edu.pe/bitstreams/b274b134-5781-49a8-bc36-732624f8112b/download https://tesis.pucp.edu.pe/bitstreams/d493110e-6a7d-42ad-8d6c-f97da3b11bc4/download https://tesis.pucp.edu.pe/bitstreams/e937f200-414a-45d4-b4d8-1bfa182a0f3e/download |
| bitstream.checksum.fl_str_mv |
c0c8ee7e117c8047a411bda86ff79b9e 25cd7e64ca0600de9c9eb4c1c406ca7d 35481b2c8d414f16a5a053be5878fdb5 e938267478d0bea7a27e4ca43553bc25 c3b175e6447566d3d8b83cb20170f099 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834736989394436096 |
| spelling |
Oncevay Marcos, Félix ArturoBustamante Alvarez, Gina2019-09-13T01:43:27Z2019-09-13T01:43:27Z20192019-09-12http://hdl.handle.net/20.500.12404/14983Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Interfaces de computadoras--Diseño y construcciónInformación--Almacenamiento y recuperaciónAlgoritmos--Procesamiento de datosAnálisis de datosPrevención del delitohttps://purl.org/pe-repo/ocde/ford#1.02.00Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenesinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática46440101https://orcid.org/0000-0001-7675-6208612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdfBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdfTexto completoapplication/pdf15349249https://tesis.pucp.edu.pe/bitstreams/2e57cd7d-e8da-4dd5-9094-0aa939f2c0bd/downloadc0c8ee7e117c8047a411bda86ff79b9eMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8919https://tesis.pucp.edu.pe/bitstreams/b7057810-7757-4f63-8ef1-cc9fb1c82e0d/download25cd7e64ca0600de9c9eb4c1c406ca7dMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81650https://tesis.pucp.edu.pe/bitstreams/b274b134-5781-49a8-bc36-732624f8112b/download35481b2c8d414f16a5a053be5878fdb5MD53falseAnonymousREADTHUMBNAILBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.jpgBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.jpgIM Thumbnailimage/jpeg12181https://tesis.pucp.edu.pe/bitstreams/d493110e-6a7d-42ad-8d6c-f97da3b11bc4/downloade938267478d0bea7a27e4ca43553bc25MD54falseAnonymousREADTEXTBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.txtBUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf.txtExtracted texttext/plain124699https://tesis.pucp.edu.pe/bitstreams/e937f200-414a-45d4-b4d8-1bfa182a0f3e/downloadc3b175e6447566d3d8b83cb20170f099MD55falseAnonymousREAD20.500.12404/14983oai:tesis.pucp.edu.pe:20.500.12404/149832025-03-12 17:56:52.179http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTElDRU5DSUEgRVNUw4FOREFSCgpCYWpvIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcywgYXV0b3Jpem8gZWwgZGVww7NzaXRvIGRlIG1pIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gZW4gZWwgUmVwb3NpdG9yaW8gRGlnaXRhbCBkZSBUZXNpcyBQVUNQLiAKCkNvbiBsYSBhdXRvcml6YWNpw7NuIGRlIGRlcMOzc2l0byBkZSBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuLCBvdG9yZ28gYSBsYSBQb250aWZpY2lhIFVuaXZlcnNpZGFkIENhdMOzbGljYSBkZWwgUGVyw7ogdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSBwYXJhIHJlcHJvZHVjaXIsIGRpc3RyaWJ1aXIsIGNvbXVuaWNhciBhbCBww7pibGljbyB0cmFuc2Zvcm1hciAow7puaWNhbWVudGUgbWVkaWFudGUgc3UgdHJhZHVjY2nDs24gYSBvdHJvcyBpZGlvbWFzKSB5IHBvbmVyIGEgZGlzcG9zaWNpw7NuIGRlbCBww7pibGljbyBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIChpbmNsdWlkbyBlbCByZXN1bWVuKSwgZW4gZm9ybWF0byBmw61zaWNvIG8gZGlnaXRhbCwgZW4gY3VhbHF1aWVyIG1lZGlvLCBjb25vY2lkbyBwb3IgY29ub2NlcnNlLCBhIHRyYXbDqXMgZGUgbG9zIGRpdmVyc29zIHNlcnZpY2lvcyBwcm92aXN0b3MgcG9yIGxhIFVuaXZlcnNpZGFkLCBjcmVhZG9zIG8gcG9yIGNyZWFyc2UsIHRhbGVzIGNvbW8gZWwgUmVwb3NpdG9yaW8gRGlnaXRhbCBkZSBUZXNpcyBQVUNQLCBjb2xlY2Npw7NuIGRlIHRyYWJham9zIGRlIGludmVzdGlnYWNpw7NuLCBlbnRyZSBvdHJvcywgZW4gZWwgUGVyw7ogeSBlbiBlbCBleHRyYW5qZXJvLCBwb3IgZWwgdGllbXBvIHkgdmVjZXMgcXVlIGNvbnNpZGVyZSBuZWNlc2FyaWFzLCB5IGxpYnJlIGRlIHJlbXVuZXJhY2lvbmVzLiBFbiB2aXJ0dWQgZGUgZGljaGEgbGljZW5jaWEsIGxhIFBvbnRpZmljaWEgVW5pdmVyc2lkYWQgQ2F0w7NsaWNhIGRlbCBQZXLDuiBwb2Ryw6EgcmVwcm9kdWNpciBtaSB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIGVuIGN1YWxxdWllciB0aXBvIGRlIHNvcG9ydGUgeSBlbiBtw6FzIGRlIHVuIGVqZW1wbGFyLCBzaW4gbW9kaWZpY2FyIHN1IGNvbnRlbmlkbywgc29sbyBjb24gcHJvcMOzc2l0b3MgZGUgc2VndXJpZGFkLCByZXNwYWxkbyB5IHByZXNlcnZhY2nDs24uIERlY2xhcm8gcXVlIGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gZXMgdW5hIGNyZWFjacOzbiBkZSBtaSBhdXRvcsOtYSB5IGV4Y2x1c2l2YSB0aXR1bGFyaWRhZCwgbyBjby1hdXRvcsOtYSBjb24gdGl0dWxhcmlkYWQgY29tcGFydGlkYSwgeSBtZSBlbmN1ZW50cm8gZmFjdWx0YWRvIGEgY29uY2VkZXIgbGEgcHJlc2VudGUgbGljZW5jaWEgeSwgYXNpbWlzbW8sIGdhcmFudGl6byBxdWUgZGljaG8gdHJhYmFqbyBkZSBpbnZlc3RpZ2FjacOzbiBubyBpbmZyaW5nZSBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJhcyBwZXJzb25hcy4gTGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBDYXTDs2xpY2EgZGVsIFBlcsO6IGNvbnNpZ25hcsOhIGVsIG5vbWJyZSBkZWwvIGxvcyBhdXRvci9lcyBkZWwgdHJhYmFqbyBkZSBpbnZlc3RpZ2FjacOzbiwgeSBubyBsZSBoYXLDoSBuaW5ndW5hIG1vZGlmaWNhY2nDs24gbcOhcyBxdWUgbGEgcGVybWl0aWRhIGVuIGxhIHByZXNlbnRlIGxpY2VuY2lhLgoK |
| score |
13.934021 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).