Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs

Descripción del Articulo

A presente investigação compara os quatro momentos espectrais e o pico de maior intensidade da fricativa alveolar [s] em posição de coda, entre a voz natural e artificial de um falante. Os dados de voz natural foram coletados em ambiente controlado e posteriormente segmentados com software Praat. Pa...

Descripción completa

Detalles Bibliográficos
Autores: Torres Castillo, Fernando Aarón, Cueva Sanchez, Oscar Esaul, Jimenez Peña, Jhon, Shicshi Romero, Erika Amalec
Formato: artículo
Fecha de Publicación:2024
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:Revistas - Universidad Nacional Mayor de San Marcos
Lenguaje:español
OAI Identifier:oai:revistasinvestigacion.unmsm.edu.pe:article/29209
Enlace del recurso:https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/29209
Nivel de acceso:acceso abierto
Materia:lingüística forense
fonética forense
Praat
Anova
estadística
forensic linguistics
forensic phonetics
statistics
linguística forense
estatística
id REVUNMSM_d1ab9c2ace7e81d5cb4ca2183544252a
oai_identifier_str oai:revistasinvestigacion.unmsm.edu.pe:article/29209
network_acronym_str REVUNMSM
network_name_str Revistas - Universidad Nacional Mayor de San Marcos
repository_id_str
dc.title.none.fl_str_mv Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
Un estudio de caso sobre los cuatro momentos espectrales y el pico de máxima intensidad de /s/ en una voz natural y una voz clonada por la IA Elevenlabs
A case study on the four spectral moments and the peak intensity of /s/ in a natural voice and a voice cloned by AI Elevenlabs
title Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
spellingShingle Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
Torres Castillo, Fernando Aarón
lingüística forense
fonética forense
Praat
Anova
estadística
forensic linguistics
forensic phonetics
Praat
Anova
statistics
linguística forense
fonética forense
Praat
Anova
estatística
title_short Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
title_full Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
title_fullStr Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
title_full_unstemmed Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
title_sort Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
dc.creator.none.fl_str_mv Torres Castillo, Fernando Aarón
Cueva Sanchez, Oscar Esaul
Jimenez Peña, Jhon
Shicshi Romero, Erika Amalec
Torres Castillo, Fernando Aarón
Cueva Sanchez, Oscar Esaul
Jimenez Peña, Jhon
Shicshi Romero, Erika Amalec
Torres Castillo, Fernando Aarón
Cueva Sanchez, Oscar Esaul
Jimenez Peña, Jhon
Shicshi Romero, Erika Amalec
author Torres Castillo, Fernando Aarón
author_facet Torres Castillo, Fernando Aarón
Cueva Sanchez, Oscar Esaul
Jimenez Peña, Jhon
Shicshi Romero, Erika Amalec
author_role author
author2 Cueva Sanchez, Oscar Esaul
Jimenez Peña, Jhon
Shicshi Romero, Erika Amalec
author2_role author
author
author
dc.subject.none.fl_str_mv lingüística forense
fonética forense
Praat
Anova
estadística
forensic linguistics
forensic phonetics
Praat
Anova
statistics
linguística forense
fonética forense
Praat
Anova
estatística
topic lingüística forense
fonética forense
Praat
Anova
estadística
forensic linguistics
forensic phonetics
Praat
Anova
statistics
linguística forense
fonética forense
Praat
Anova
estatística
description A presente investigação compara os quatro momentos espectrais e o pico de maior intensidade da fricativa alveolar [s] em posição de coda, entre a voz natural e artificial de um falante. Os dados de voz natural foram coletados em ambiente controlado e posteriormente segmentados com software Praat. Para a voz artificial foi utilizada a tecnologia de clonagem de voz da ElevenLabs. A análise de variância mostra diferenças significativas entre as médias dos parâmetros acústicos analisados ​​– centro de gravidade, desvio padrão, curtose, assimetria e pico de intensidade máxima – na voz natural e artificial. Porém, ao analisar os dados agrupados pela vogal que antecede a fricativa, observa-se que nem em todos os contextos existem diferenças significativas. Os resultados indicam que os parâmetros espectrais da fricativa alveolar /s/ – especialmente o centro de gravidade – são úteis na distinção entre a fala natural e a sua contraparte artificial.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-30
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/29209
10.15381/lengsoc.v23i2.29209
url https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/29209
identifier_str_mv 10.15381/lengsoc.v23i2.29209
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/29209/21865
dc.rights.none.fl_str_mv https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas
dc.source.none.fl_str_mv Lengua y Sociedad; Vol. 23 Núm. 2 (2024); 1069-1097
Lengua y Sociedad; v. 23 n. 2 (2024); 1069-1097
Lengua y Sociedad; Vol. 23 No. 2 (2024); 1069-1097
2413-2659
1729-9721
10.15381/lengsoc.v23i2
reponame:Revistas - Universidad Nacional Mayor de San Marcos
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str Revistas - Universidad Nacional Mayor de San Marcos
collection Revistas - Universidad Nacional Mayor de San Marcos
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1848424674354003968
spelling Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI ElevenlabsUn estudio de caso sobre los cuatro momentos espectrales y el pico de máxima intensidad de /s/ en una voz natural y una voz clonada por la IA ElevenlabsA case study on the four spectral moments and the peak intensity of /s/ in a natural voice and a voice cloned by AI ElevenlabsTorres Castillo, Fernando AarónCueva Sanchez, Oscar EsaulJimenez Peña, JhonShicshi Romero, Erika AmalecTorres Castillo, Fernando AarónCueva Sanchez, Oscar EsaulJimenez Peña, JhonShicshi Romero, Erika AmalecTorres Castillo, Fernando AarónCueva Sanchez, Oscar EsaulJimenez Peña, JhonShicshi Romero, Erika Amaleclingüística forensefonética forensePraatAnovaestadísticaforensic linguisticsforensic phoneticsPraatAnovastatisticslinguística forensefonética forensePraatAnovaestatísticaA presente investigação compara os quatro momentos espectrais e o pico de maior intensidade da fricativa alveolar [s] em posição de coda, entre a voz natural e artificial de um falante. Os dados de voz natural foram coletados em ambiente controlado e posteriormente segmentados com software Praat. Para a voz artificial foi utilizada a tecnologia de clonagem de voz da ElevenLabs. A análise de variância mostra diferenças significativas entre as médias dos parâmetros acústicos analisados ​​– centro de gravidade, desvio padrão, curtose, assimetria e pico de intensidade máxima – na voz natural e artificial. Porém, ao analisar os dados agrupados pela vogal que antecede a fricativa, observa-se que nem em todos os contextos existem diferenças significativas. Os resultados indicam que os parâmetros espectrais da fricativa alveolar /s/ – especialmente o centro de gravidade – são úteis na distinção entre a fala natural e a sua contraparte artificial.This research compares the four spectral moments and the peak of greatest intensity of the alveolar fricative [s] in coda position between the natural and artificial voice of a speaker. The data from the natural voice were collected in a controlled environment and subsequently segmented with Praat software. For the artificial voice, ElevenLabs' voice cloning technology was used. The analysis of variance shows significant differences between the means of the acoustic parameters analyzed—center of gravity, standard deviation, kurtosis, skewness, and the peak of maximum intensity—in the natural and artificial voices. However, when analyzing the data grouped by the vowel preceding the fricative, it is observed that not all contexts show significant differences. The results indicate that the spectral parameters of the alveolar fricative /s/—especially the center of gravity—are useful to distinguish between the natural voice and its artificial counterpart.La presente investigación compara los cuatro momentos espectrales y el pico de mayor intensidad de la fricativa alveolar [s] en posición de coda, entre la voz natural y la artificial de un locutor. Los datos de la voz natural fueron recolectados en un entorno controlado y segmentados posteriormente con el software Praat. Para la voz artificial, se utilizó la tecnología de clonación de voz de ElevenLabs. El análisis de varianza muestra diferencias significativas entre las medias de los parámetros acústicos analizados —centro de gravedad, desviación estándar, curtosis, asimetría y el pico de máxima intensidad— en la voz natural y artificial. Sin embargo, al analizar los datos agrupados por la vocal que precede a la fricativa, se observa que no en todos los contextos existen diferencias significativas. Los resultados indican que los parámetros espectrales de la fricativa alveolar /s/ —especialmente el centro de gravedad— son útiles para distinguir entre la voz natural y su contraparte artificial. Universidad Nacional Mayor de San Marcos, Facultad de Letras y Ciencias Humanas2024-12-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/2920910.15381/lengsoc.v23i2.29209Lengua y Sociedad; Vol. 23 Núm. 2 (2024); 1069-1097Lengua y Sociedad; v. 23 n. 2 (2024); 1069-1097Lengua y Sociedad; Vol. 23 No. 2 (2024); 1069-10972413-26591729-972110.15381/lengsoc.v23i2reponame:Revistas - Universidad Nacional Mayor de San Marcosinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMspahttps://revistasinvestigacion.unmsm.edu.pe/index.php/lenguaysociedad/article/view/29209/21865Derechos de autor 2024 Fernando Aarón Torres Castillo, Oscar Esaul Cueva Sanchez, Jhon Jimenez Peña, Erika Amalec Shicshi Romerohttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:revistasinvestigacion.unmsm.edu.pe:article/292092025-01-21T19:36:34Z
score 13.8703
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).