Classification of news categories using BERT

Descripción del Articulo

The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, po...

Descripción completa

Detalles Bibliográficos
Autores: Machado Medina, Bradlhy Luis, Santillana Quirita, César Alonso, Bautista Luque, Sharmelyn Violeta
Formato: artículo
Fecha de Publicación:2023
Institución:Universidad La Salle
Repositorio:Revistas - Universidad La Salle
Lenguaje:español
OAI Identifier:oai:ojs.revistas.ulasalle.edu.pe:article/98
Enlace del recurso:https://revistas.ulasalle.edu.pe/innosoft/article/view/98
https://doi.org/10.48168/innosoft.s12.a98
https://purl.org/42411/s12/a98
https://n2t.net/ark:/42411/s12/a98
Nivel de acceso:acceso abierto
Materia:News classification
natural language processing
BERT
machine learning
artificial intelligence
clasificacion de noticias
procesamiento de lenguaje natural
inteligencia artificial
id REVUSALLE_0739ce078349db1df20dfdfa7d20477d
oai_identifier_str oai:ojs.revistas.ulasalle.edu.pe:article/98
network_acronym_str REVUSALLE
network_name_str Revistas - Universidad La Salle
repository_id_str
spelling Classification of news categories using BERTClasificación de categorías de noticias usando BERTMachado Medina, Bradlhy LuisSantillana Quirita, César AlonsoBautista Luque, Sharmelyn VioletaNews classificationnatural language processingBERTmachine learningartificial intelligenceclasificacion de noticiasprocesamiento de lenguaje naturalBERTmachine learninginteligencia artificialThe present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence.El presente proyecto consiste en desarrollar un modelo de Procesamiento del Lenguaje Natural para clasificar noticias utilizando un conjunto de datos o DataSets ya evaluados. El objetivo principal es crear un sistema que pueda identificar y asignar automáticamente las noticias a una de las categorías predefinidas: negocios, entretenimiento, política, deportes o tecnología. Esto implica el preprocesamiento de datos, extracción de características, entrenamiento de un modelo de machine learning y posteriormente su evaluación de rendimiento utilizando métricas como” precisión”,” recall 2” F1 − score”. Esto permitir ‘a determinar que tan bien el modelo puede predecir la categoría correcta para una noticia nueva o no etiquetada. Si el rendimiento del modelo es satisfactorio, se puede utilizar para clasificar noticias no etiquetadas en tiempo real. En resumen, se busca proporcionar una solución eficiente y precisa para organizar y etiquetar el contenido informativo de una noticia con ayuda de la Inteligencia Artificial.Universidad La Salle2023-09-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionJournal papertextArtículos originalesapplication/pdftext/htmlhttps://revistas.ulasalle.edu.pe/innosoft/article/view/98https://doi.org/10.48168/innosoft.s12.a98https://purl.org/42411/s12/a98https://n2t.net/ark:/42411/s12/a98Innovation and Software; Vol 4 No 2 (2023): September - February; 36-51Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 36-512708-09352708-0927https://doi.org/10.48168/innosoft.s12https://purl.org/42411/s12https://n2t.net/ark:/42411/s12reponame:Revistas - Universidad La Salleinstname:Universidad La Salleinstacron:USALLEspahttps://revistas.ulasalle.edu.pe/innosoft/article/view/98/134https://revistas.ulasalle.edu.pe/innosoft/article/view/98/148https://purl.org/42411/s12/a98/g134https://purl.org/42411/s12/a98/g148https://n2t.net/ark:/42411/s12/a98/g134https://n2t.net/ark:/42411/s12/a98/g14820232023Derechos de autor 2023 Innovación y Softwarehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.revistas.ulasalle.edu.pe:article/982025-07-03T08:02:15Z
dc.title.none.fl_str_mv Classification of news categories using BERT
Clasificación de categorías de noticias usando BERT
title Classification of news categories using BERT
spellingShingle Classification of news categories using BERT
Machado Medina, Bradlhy Luis
News classification
natural language processing
BERT
machine learning
artificial intelligence
clasificacion de noticias
procesamiento de lenguaje natural
BERT
machine learning
inteligencia artificial
title_short Classification of news categories using BERT
title_full Classification of news categories using BERT
title_fullStr Classification of news categories using BERT
title_full_unstemmed Classification of news categories using BERT
title_sort Classification of news categories using BERT
dc.creator.none.fl_str_mv Machado Medina, Bradlhy Luis
Santillana Quirita, César Alonso
Bautista Luque, Sharmelyn Violeta
author Machado Medina, Bradlhy Luis
author_facet Machado Medina, Bradlhy Luis
Santillana Quirita, César Alonso
Bautista Luque, Sharmelyn Violeta
author_role author
author2 Santillana Quirita, César Alonso
Bautista Luque, Sharmelyn Violeta
author2_role author
author
dc.subject.none.fl_str_mv News classification
natural language processing
BERT
machine learning
artificial intelligence
clasificacion de noticias
procesamiento de lenguaje natural
BERT
machine learning
inteligencia artificial
topic News classification
natural language processing
BERT
machine learning
artificial intelligence
clasificacion de noticias
procesamiento de lenguaje natural
BERT
machine learning
inteligencia artificial
description The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence.
publishDate 2023
dc.date.none.fl_str_mv 2023-09-30
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Journal paper
text
Artículos originales
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/98
https://doi.org/10.48168/innosoft.s12.a98
https://purl.org/42411/s12/a98
https://n2t.net/ark:/42411/s12/a98
url https://revistas.ulasalle.edu.pe/innosoft/article/view/98
https://doi.org/10.48168/innosoft.s12.a98
https://purl.org/42411/s12/a98
https://n2t.net/ark:/42411/s12/a98
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/98/134
https://revistas.ulasalle.edu.pe/innosoft/article/view/98/148
https://purl.org/42411/s12/a98/g134
https://purl.org/42411/s12/a98/g148
https://n2t.net/ark:/42411/s12/a98/g134
https://n2t.net/ark:/42411/s12/a98/g148
dc.rights.none.fl_str_mv Derechos de autor 2023 Innovación y Software
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Derechos de autor 2023 Innovación y Software
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/html
dc.coverage.none.fl_str_mv 2023
2023
dc.publisher.none.fl_str_mv Universidad La Salle
publisher.none.fl_str_mv Universidad La Salle
dc.source.none.fl_str_mv Innovation and Software; Vol 4 No 2 (2023): September - February; 36-51
Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 36-51
2708-0935
2708-0927
https://doi.org/10.48168/innosoft.s12
https://purl.org/42411/s12
https://n2t.net/ark:/42411/s12
reponame:Revistas - Universidad La Salle
instname:Universidad La Salle
instacron:USALLE
instname_str Universidad La Salle
instacron_str USALLE
institution USALLE
reponame_str Revistas - Universidad La Salle
collection Revistas - Universidad La Salle
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1844626634433363968
score 13.4165325
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).