La transcripción automática de archivos de audio y vídeo con Inteligencia Artificial (IA) para la mejora de la interacción oral

Autores/as

Resumen

La lingüística de corpus es empleada para conocer con más exactitud el uso real de la lengua, pero para ello se han de transcribir los documentos orales. Hoy en día existen corpus orales accesibles en línea, pero cada uno de ellos ha sido creado con una finalidad específica. Actualmente, disponemos de la Inteligencia Artificial generativa para ayudarnos a crear estos corpus orales. En este artículo se analizan 13 programas gratuitos que se pueden emplear para hacer transcripciones orales y se estudia su precisión.

Palabras clave

transcripción automática, inteligencia artificial, interacción oral, improvisación teatral

Citas

AMERICAN COUNCIL ON THE TEACHING OF FOREIGN LANGUAGES (ACTFL) (2015 [2012]): Performance Descriptors for Language Learners. https://www.actfl.org/uploads/files/general/ACTFLPerformance_Descriptors.pdf

AMERICAN COUNCIL ON THE TEACHING OF FOREIGN LANGUAGES (ACTFL) (2024): ACTFL Proficiency Guidelines. https://www.actfl.org/uploads/files/general/Resources-Publications/ACTFL_Proficiency_Guidelines_2024.pdf

BAZÁN-GIL, V.; PÉREZ-CERNUDA, C.; MARROYO-NÚÑEZ, N.; SAMPEDRO-CANET, P.; DE-IGNACIO-LEDESMA, D. (2021): “Inteligencia artificial aplicada a programas informativos de radio. Estudio de caso de segmentación automática de noticias en RNE”. Profesional de la información, núm. 30 (33), pp. 1-12. Recuperado de https://doi.org/10.3145/epi.2021.may.20

BRIZ GÓMEZ, Antonio y Grupo Val. Es.Co (2002): “Sistema de transcripción”. Corpus de conversaciones coloquiales. Madrid: Arco Libros. https://www.uv.es/valesco/sistema.pdf

BRIZ GÓMEZ, Antonio y ALBELDA MARCO, Marta (2009): “Estado actual de los corpus de la lengua española hablada y escrita: I+D”. Anuario del Instituto Cervantes. Madrid: Instituto Cervantes, pp. 165-226.

CARCELÉN GUERRERO, Andrea y UCLÉS RAMADA, Gloria (2019): “Corpus y construcción de un corpus oral multidialectal. El corpus Ameresco”. Normas, 9, 17-36. https://doi.org/10.7203/Normas.v9i1.16007

CONSEJO DE EUROPA [2002 (2001)]: Marco común europeo de referencia para las lenguas: aprendizaje, enseñanza, evaluación. Madrid: MECD- Anaya. Recuperado de https://cvc.cervantes.es/ensenanza/biblioteca_ele/marco/

CONSEJO DE EUROPA [2020 (2018)]: Marco común europeo de referencia para las lenguas: aprendizaje, enseñanza, evaluación. Volumen complementario. Estrasburgo: Servicio de publicaciones del Consejo de Europa. Descargado de https://cvc.cervantes.es/ensenanza/biblioteca_ele/marco_complementario/mcer_volumen-complementario.pdf

GARCÍA RUIZ-CASTILLO, Carlos (2024): “Corpus orales de aprendientes de ELE para el estudio de la conversación en la L2 disponibles en Internet”. Hiroshima Studies in Language and Language Education, 37, 117-132.

INSTITUTO CERVANTES (2006): Plan curricular del Instituto Cervantes. Niveles de referencia para el español. Madrid: Instituto Cervantes- Biblioteca nueva. En https://cvc.cervantes.es/ensenanza/biblioteca_ele/plan_curricular/

CORPUS CITADOS

BULLOCK, Barbara E. y TORIBIO, Almeida Jackqueline (dirs.) (2024): Spanish in Texas Corpus, V1. https://doi.org/10.18738/T8/GBYLXB

DAVIES, Mark (2024): Corpus del Español de Mark Davies. Brigham Young University. https://www.corpusdelespanol.org/

DOMÍNGUEZ, Laura (2010): Spanish Learner Language Oral Corpora (SPLLOC 2). University of Southampton, University of Newcastle y University of York. https://web-archive.southampton.ac.uk/www.splloc.soton.ac.uk/

ESLORA (2023): Corpus para el estudio del español oral (ESLORA). Universidad de Santiago de Compostela. https://eslora.usc.es, versión 2.2 de noviembre de 2023, ISSN. 2444-1430.

FERNÁNDEZ ORDÓÑEZ, Inés (2024): Corpus Oral y Sonoro del Español Rural (COSER). Universidad Autónoma de Madrid. https://www.corpusrural.es/

JØRGENSEN, Annette Myre (2023): Corpus Oral de Lenguaje Adolescente (COLA). https://blogg.hiof.no/colam-esp/

MORENO FERNÁNDEZ, Francisco (dir.) (2024): Proyecto para el estudio Sociolingüistico del Español de España y de América (PRESEEA). Universidad de Alcalá https://preseea.uah.es/

PALACIOS ALCAINE, Azucena (dir.) (2017-): Corpus COREC (Corpus Oral de Referencia del Español en Contacto). Universidad Autónoma de Madrid. https://espanolcontacto.fe.uam.es/

PONS BORDERÍA, Salvador (dir.) (2024): Corpus Val.Es.Co. 3.0. Universitat de València https://valesco.es

REAL ACADEMIA ESPAÑOLA (2024a): Corpus de Referencia del Español Actual (CREA), https://corpus.rae.es/creanet.html

REAL ACADEMIA ESPAÑOLA (2024b): Corpus Diacrónico del Español (CORDE), https://corpus.rae.es/cordenet.html

REAL ACADEMIA ESPAÑOLA y ASOCIACIÓN DE ACADEMIAS DE LA LENGUA ESPAÑOLA (ASALE) (2024a): Corpus del Español del Siglo XXI, versión 1.1 (CORPES XXI). Real Academia Española. https://www.rae.es/corpes/

ROJO, Guillermo y PALACIOS, Ignacio (dirs.) (2022): Corpus de aprendices de español (CAES). Universidad de Santiago de Compostela. https://galvan.usc.es/caes

RUIZ FAJARDO, Guadalupe (dir.) (2017): Columbia Corpus de Conversaciones para E/LE (Columbia). https://edblogs.columbia.edu/corpusdeconversaciones/

Publicado

2024-12-11

Descargas