DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: http://dspace.uazuay.edu.ec/handle/datos/16261
Título : Ajuste fino de un modelo pre-entrenado para reconocimiento de voz infantil con validación semántica basada en modelos de lenguaje
Autor : Carvajal Vargas, Fabián Marcelo
García Peñaloza, James Rusbel
Palabras clave : APRENDIZAJE PROFUNDO;HABLA INFANTIL;MODELOS DE LENGUAJE;RECONOCIMIENTO AUTOMÁTICO DEL HABLA;VALIDACIÓN SEMÁNTICA
Fecha de publicación : 2025
Editorial : Universidad del Azuay
Resumen : La investigación tuvo como objetivo optimizar un modelo de reconocimiento automático de voz (ASR) adaptado al habla infantil en español mediante el ajuste fino del modelo pre-entrenado Whisper-Large-V3-Turbo. El estudio se fundamentó en la corriente teórica del aprendizaje profundo y el procesamiento del lenguaje natural, integrando una validación semántica basada en modelos de lenguaje (LLM) mediante Meta/Llama 3.3. Se empleó un corpus de 299 clips de voz infantil, segmentados y anotados para entrenamiento en Google Colab con la biblioteca datasets de Hugging Face. Los resultados mostraron una reducción del Word Error Rate (WER) hasta un 81.74 % y valores semánticos adecuados en tono (0.8) y toxicidad (0.0). Se concluyó que la combinación del ajuste fino y la validación semántica permitió mejorar la comprensión contextual del habla infantil, aportando una metodología innovadora para el desarrollo de sistemas ASR con aplicaciones educativas y terapéuticas.
metadata.dc.description.degree: Ingeniero en Ciencias de la Computación
URI : http://dspace.uazuay.edu.ec/handle/datos/16261
Aparece en las colecciones: Facultad de Ciencias de la Administración

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
21776.pdfTrabajo de Graduación246,39 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.