Classification of news categories using BERT
Descripción del Articulo
The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, po...
Autores: | , , |
---|---|
Formato: | artículo |
Fecha de Publicación: | 2023 |
Institución: | Universidad La Salle |
Repositorio: | Revistas - Universidad La Salle |
Lenguaje: | español |
OAI Identifier: | oai:ojs.revistas.ulasalle.edu.pe:article/98 |
Enlace del recurso: | https://revistas.ulasalle.edu.pe/innosoft/article/view/98 https://doi.org/10.48168/innosoft.s12.a98 https://purl.org/42411/s12/a98 https://n2t.net/ark:/42411/s12/a98 |
Nivel de acceso: | acceso abierto |
Materia: | News classification natural language processing BERT machine learning artificial intelligence clasificacion de noticias procesamiento de lenguaje natural inteligencia artificial |
id |
REVUSALLE_0739ce078349db1df20dfdfa7d20477d |
---|---|
oai_identifier_str |
oai:ojs.revistas.ulasalle.edu.pe:article/98 |
network_acronym_str |
REVUSALLE |
network_name_str |
Revistas - Universidad La Salle |
repository_id_str |
|
spelling |
Classification of news categories using BERTClasificación de categorías de noticias usando BERTMachado Medina, Bradlhy LuisSantillana Quirita, César AlonsoBautista Luque, Sharmelyn VioletaNews classificationnatural language processingBERTmachine learningartificial intelligenceclasificacion de noticiasprocesamiento de lenguaje naturalBERTmachine learninginteligencia artificialThe present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence.El presente proyecto consiste en desarrollar un modelo de Procesamiento del Lenguaje Natural para clasificar noticias utilizando un conjunto de datos o DataSets ya evaluados. El objetivo principal es crear un sistema que pueda identificar y asignar automáticamente las noticias a una de las categorías predefinidas: negocios, entretenimiento, política, deportes o tecnología. Esto implica el preprocesamiento de datos, extracción de características, entrenamiento de un modelo de machine learning y posteriormente su evaluación de rendimiento utilizando métricas como” precisión”,” recall 2” F1 − score”. Esto permitir ‘a determinar que tan bien el modelo puede predecir la categoría correcta para una noticia nueva o no etiquetada. Si el rendimiento del modelo es satisfactorio, se puede utilizar para clasificar noticias no etiquetadas en tiempo real. En resumen, se busca proporcionar una solución eficiente y precisa para organizar y etiquetar el contenido informativo de una noticia con ayuda de la Inteligencia Artificial.Universidad La Salle2023-09-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionJournal papertextArtículos originalesapplication/pdftext/htmlhttps://revistas.ulasalle.edu.pe/innosoft/article/view/98https://doi.org/10.48168/innosoft.s12.a98https://purl.org/42411/s12/a98https://n2t.net/ark:/42411/s12/a98Innovation and Software; Vol 4 No 2 (2023): September - February; 36-51Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 36-512708-09352708-0927https://doi.org/10.48168/innosoft.s12https://purl.org/42411/s12https://n2t.net/ark:/42411/s12reponame:Revistas - Universidad La Salleinstname:Universidad La Salleinstacron:USALLEspahttps://revistas.ulasalle.edu.pe/innosoft/article/view/98/134https://revistas.ulasalle.edu.pe/innosoft/article/view/98/148https://purl.org/42411/s12/a98/g134https://purl.org/42411/s12/a98/g148https://n2t.net/ark:/42411/s12/a98/g134https://n2t.net/ark:/42411/s12/a98/g14820232023Derechos de autor 2023 Innovación y Softwarehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.revistas.ulasalle.edu.pe:article/982025-07-03T08:02:15Z |
dc.title.none.fl_str_mv |
Classification of news categories using BERT Clasificación de categorías de noticias usando BERT |
title |
Classification of news categories using BERT |
spellingShingle |
Classification of news categories using BERT Machado Medina, Bradlhy Luis News classification natural language processing BERT machine learning artificial intelligence clasificacion de noticias procesamiento de lenguaje natural BERT machine learning inteligencia artificial |
title_short |
Classification of news categories using BERT |
title_full |
Classification of news categories using BERT |
title_fullStr |
Classification of news categories using BERT |
title_full_unstemmed |
Classification of news categories using BERT |
title_sort |
Classification of news categories using BERT |
dc.creator.none.fl_str_mv |
Machado Medina, Bradlhy Luis Santillana Quirita, César Alonso Bautista Luque, Sharmelyn Violeta |
author |
Machado Medina, Bradlhy Luis |
author_facet |
Machado Medina, Bradlhy Luis Santillana Quirita, César Alonso Bautista Luque, Sharmelyn Violeta |
author_role |
author |
author2 |
Santillana Quirita, César Alonso Bautista Luque, Sharmelyn Violeta |
author2_role |
author author |
dc.subject.none.fl_str_mv |
News classification natural language processing BERT machine learning artificial intelligence clasificacion de noticias procesamiento de lenguaje natural BERT machine learning inteligencia artificial |
topic |
News classification natural language processing BERT machine learning artificial intelligence clasificacion de noticias procesamiento de lenguaje natural BERT machine learning inteligencia artificial |
description |
The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-09-30 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Journal paper text Artículos originales |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://revistas.ulasalle.edu.pe/innosoft/article/view/98 https://doi.org/10.48168/innosoft.s12.a98 https://purl.org/42411/s12/a98 https://n2t.net/ark:/42411/s12/a98 |
url |
https://revistas.ulasalle.edu.pe/innosoft/article/view/98 https://doi.org/10.48168/innosoft.s12.a98 https://purl.org/42411/s12/a98 https://n2t.net/ark:/42411/s12/a98 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
https://revistas.ulasalle.edu.pe/innosoft/article/view/98/134 https://revistas.ulasalle.edu.pe/innosoft/article/view/98/148 https://purl.org/42411/s12/a98/g134 https://purl.org/42411/s12/a98/g148 https://n2t.net/ark:/42411/s12/a98/g134 https://n2t.net/ark:/42411/s12/a98/g148 |
dc.rights.none.fl_str_mv |
Derechos de autor 2023 Innovación y Software https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Derechos de autor 2023 Innovación y Software https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf text/html |
dc.coverage.none.fl_str_mv |
2023 2023 |
dc.publisher.none.fl_str_mv |
Universidad La Salle |
publisher.none.fl_str_mv |
Universidad La Salle |
dc.source.none.fl_str_mv |
Innovation and Software; Vol 4 No 2 (2023): September - February; 36-51 Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 36-51 2708-0935 2708-0927 https://doi.org/10.48168/innosoft.s12 https://purl.org/42411/s12 https://n2t.net/ark:/42411/s12 reponame:Revistas - Universidad La Salle instname:Universidad La Salle instacron:USALLE |
instname_str |
Universidad La Salle |
instacron_str |
USALLE |
institution |
USALLE |
reponame_str |
Revistas - Universidad La Salle |
collection |
Revistas - Universidad La Salle |
repository.name.fl_str_mv |
|
repository.mail.fl_str_mv |
|
_version_ |
1844626634433363968 |
score |
13.4165325 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).