Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo
Descripción del Articulo
Artificial intelligence (AI) has transformed numerous fields, including linguistics. Large Language Models (LLMs) have revolutionized interaction with text by providing responses that mimic human language. These models not only generate text, but also reflect their interpretation of the world. Howev...
| Autores: | , , |
|---|---|
| Formato: | artículo |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | Revistas - Universidad Nacional Mayor de San Marcos |
| Lenguaje: | español |
| OAI Identifier: | oai:revistasinvestigacion.unmsm.edu.pe:article/28336 |
| Enlace del recurso: | https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/28336 |
| Nivel de acceso: | acceso abierto |
| Materia: | modelo de mundo modelo de lenguaje inteligencia artificial diversidad léxica densidad léxica world model language model artificial intelligence lexical diversity lexical density modelo mundial modelo linguístico inteligência artificial diversidade lexical densidade lexical |
| id |
REVUNMSM_440c1ba7d0580f0079fd1dc658b658eb |
|---|---|
| oai_identifier_str |
oai:revistasinvestigacion.unmsm.edu.pe:article/28336 |
| network_acronym_str |
REVUNMSM |
| network_name_str |
Revistas - Universidad Nacional Mayor de San Marcos |
| repository_id_str |
|
| dc.title.none.fl_str_mv |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo Lexical analysis of texts generated by language models: reflection of their world models Análisis léxico de textos generados por modelos de lenguaje: reflejo de sus modelos de mundo |
| title |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| spellingShingle |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo Kotz, Gabriela modelo de mundo modelo de lenguaje inteligencia artificial diversidad léxica densidad léxica world model language model artificial intelligence lexical diversity lexical density modelo mundial modelo linguístico inteligência artificial diversidade lexical densidade lexical |
| title_short |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| title_full |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| title_fullStr |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| title_full_unstemmed |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| title_sort |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundo |
| dc.creator.none.fl_str_mv |
Kotz, Gabriela Salcedo, Pedro Fuentes, Karina Kotz, Gabriela Salcedo, Pedro Fuentes, Karina Kotz, Gabriela Salcedo, Pedro Fuentes, Karina |
| author |
Kotz, Gabriela |
| author_facet |
Kotz, Gabriela Salcedo, Pedro Fuentes, Karina |
| author_role |
author |
| author2 |
Salcedo, Pedro Fuentes, Karina |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
modelo de mundo modelo de lenguaje inteligencia artificial diversidad léxica densidad léxica world model language model artificial intelligence lexical diversity lexical density modelo mundial modelo linguístico inteligência artificial diversidade lexical densidade lexical |
| topic |
modelo de mundo modelo de lenguaje inteligencia artificial diversidad léxica densidad léxica world model language model artificial intelligence lexical diversity lexical density modelo mundial modelo linguístico inteligência artificial diversidade lexical densidade lexical |
| description |
Artificial intelligence (AI) has transformed numerous fields, including linguistics. Large Language Models (LLMs) have revolutionized interaction with text by providing responses that mimic human language. These models not only generate text, but also reflect their interpretation of the world. However, these models' understanding of the world is limited, which has led to the proposal of developing Large World Models (LWMs), which integrate textual, visual, and auditory data for a more complete understanding. This article employs a lexicostatistical perspective to analyze how LLMs articulate responses based on their world models. A comparative quasi-experimental design was utilized to evaluate six different LLMs. The methodology focused on measuring the diversity and lexical density of the texts generated by these models. The results demonstrated that ChatGPT-4 has high lexical density and moderate lexical diversity, while Copilot has the highest lexical diversity but lower lexical density. This analysis is of great importance for understanding the capabilities and limitations of LLMs, with implications for their applications in various areas. The concepts and methodology are presented, the findings are discussed , and the paper concludes with reflections on future research and practical applications. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-12-30 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/28336 10.15381/lengsoc.v23i2.28336 |
| url |
https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/28336 |
| identifier_str_mv |
10.15381/lengsoc.v23i2.28336 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/28336/21779 |
| dc.rights.none.fl_str_mv |
Derechos de autor 2024 Gabriela Kotz, Pedro Salcedo, Karina Fuentes https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Derechos de autor 2024 Gabriela Kotz, Pedro Salcedo, Karina Fuentes https://creativecommons.org/licenses/by/4.0 |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas |
| publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas |
| dc.source.none.fl_str_mv |
Lengua y Sociedad; Vol. 23 Núm. 2 (2024); 895-910 Lengua y Sociedad; v. 23 n. 2 (2024); 895-910 Lengua y Sociedad; Vol. 23 No. 2 (2024); 895-910 2413-2659 1729-9721 10.15381/lengsoc.v23i2 reponame:Revistas - Universidad Nacional Mayor de San Marcos instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
Revistas - Universidad Nacional Mayor de San Marcos |
| collection |
Revistas - Universidad Nacional Mayor de San Marcos |
| repository.name.fl_str_mv |
|
| repository.mail.fl_str_mv |
|
| _version_ |
1848424673762607104 |
| spelling |
Análise lexical de textos gerados por modelos linguísticos: reflexão sobre os seus modelos de mundoLexical analysis of texts generated by language models: reflection of their world modelsAnálisis léxico de textos generados por modelos de lenguaje: reflejo de sus modelos de mundoKotz, GabrielaSalcedo, PedroFuentes, KarinaKotz, GabrielaSalcedo, PedroFuentes, KarinaKotz, GabrielaSalcedo, PedroFuentes, Karinamodelo de mundomodelo de lenguajeinteligencia artificialdiversidad léxicadensidad léxicaworld modellanguage modelartificial intelligencelexical diversitylexical densitymodelo mundialmodelo linguísticointeligência artificialdiversidade lexicaldensidade lexicalArtificial intelligence (AI) has transformed numerous fields, including linguistics. Large Language Models (LLMs) have revolutionized interaction with text by providing responses that mimic human language. These models not only generate text, but also reflect their interpretation of the world. However, these models' understanding of the world is limited, which has led to the proposal of developing Large World Models (LWMs), which integrate textual, visual, and auditory data for a more complete understanding. This article employs a lexicostatistical perspective to analyze how LLMs articulate responses based on their world models. A comparative quasi-experimental design was utilized to evaluate six different LLMs. The methodology focused on measuring the diversity and lexical density of the texts generated by these models. The results demonstrated that ChatGPT-4 has high lexical density and moderate lexical diversity, while Copilot has the highest lexical diversity but lower lexical density. This analysis is of great importance for understanding the capabilities and limitations of LLMs, with implications for their applications in various areas. The concepts and methodology are presented, the findings are discussed , and the paper concludes with reflections on future research and practical applications.A inteligência artificial (IA) transformou vários domínios, incluindo a linguística. Os grandes modelos de linguagem (LLM) revolucionaram a interação com o texto, fornecendo respostas que imitam a linguagem humana. Estes modelos não só geram texto, como também reflectem a sua interpretação do mundo. No entanto, a compreensão do mundo por parte destes modelos é limitada, o que levou à proposta de desenvolvimento de Large World Models (LWMs), que integram dados textuais, visuais e auditivos para uma compreensão mais completa. Este artigo utiliza uma perspetiva léxico-estatística para analisar a forma como os LLM articulam as respostas com base nos seus modelos do mundo. Utilizou-se uma conceção quase-experimental comparativa para avaliar seis LLMs diferentes. A metodologia centrou-se na medição da diversidade e da densidade lexical dos textos gerados por esses modelos. Os resultados demonstraram que o ChatGPT-4 tem uma densidade lexical elevada e uma diversidade lexical moderada, enquanto o Copilot tem a maior diversidade lexical mas uma densidade lexical mais baixa. Esta análise é de grande importância para a compreensão das capacidades e limitações dos LLMs, com implicações para suas aplicações em diversas áreas. Os conceitos, a metodologia e os resultados são apresentados e discutidos, concluindo-se com reflexões sobre futuras investigações e aplicações práticas.La inteligencia artificial (IA) ha transformado numerosos campos, incluyendo la lingüística. Los Grandes Modelos de Lenguaje (LLM) han revolucionado la interacción con el texto al proporcionar respuestas que imitan el lenguaje humano. Estos modelos no solo generan texto, sino que también reflejan su interpretación del mundo. Sin embargo, la comprensión del mundo de estos modelos es limitada, lo que ha llevado a proponer el desarrollo de los Grandes Modelos del Mundo (LWM), que integran datos textuales, visuales y auditivos para una comprensión más completa. En este artículo, se analiza cómo los LLM articulan respuestas basadas en sus modelos de mundo mediante una perspectiva léxico-estadística. Mediante un diseño cuasiexperimental comparativo, se evaluaron seis LLM diferentes. La metodología se centró en medir la diversidad y densidad léxica de los textos generados por estos modelos. Los resultados mostraron que ChatGPT-4 tiene una alta densidad léxica y una diversidad léxica moderada, mientras que Copilot presenta la mayor diversidad léxica pero con una densidad léxica menor. Este análisis es crucial para entender las capacidades y limitaciones de los LLM, con implicaciones para aplicaciones en diversas áreas. Se presentan los conceptos y la metodología, se discuten los hallazgos y se concluye con reflexiones sobre futuras investigaciones y aplicaciones prácticas. Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas2024-12-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/2833610.15381/lengsoc.v23i2.28336Lengua y Sociedad; Vol. 23 Núm. 2 (2024); 895-910Lengua y Sociedad; v. 23 n. 2 (2024); 895-910Lengua y Sociedad; Vol. 23 No. 2 (2024); 895-9102413-26591729-972110.15381/lengsoc.v23i2reponame:Revistas - Universidad Nacional Mayor de San Marcosinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMspahttps://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/28336/21779Derechos de autor 2024 Gabriela Kotz, Pedro Salcedo, Karina Fuenteshttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:revistasinvestigacion.unmsm.edu.pe:article/283362025-01-21T19:36:34Z |
| score |
13.921622 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).