Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.uazuay.edu.ec/handle/datos/16261| Título : | Ajuste fino de un modelo pre-entrenado para reconocimiento de voz infantil con validación semántica basada en modelos de lenguaje |
| Autor : | Carvajal Vargas, Fabián Marcelo García Peñaloza, James Rusbel |
| Palabras clave : | APRENDIZAJE PROFUNDO;HABLA INFANTIL;MODELOS DE LENGUAJE;RECONOCIMIENTO AUTOMÁTICO DEL HABLA;VALIDACIÓN SEMÁNTICA |
| Fecha de publicación : | 2025 |
| Editorial : | Universidad del Azuay |
| Resumen : | La investigación tuvo como objetivo optimizar un modelo de reconocimiento automático de voz (ASR) adaptado al habla infantil en español mediante el ajuste fino del modelo pre-entrenado Whisper-Large-V3-Turbo. El estudio se fundamentó en la corriente teórica del aprendizaje profundo y el procesamiento del lenguaje natural, integrando una validación semántica basada en modelos de lenguaje (LLM) mediante Meta/Llama 3.3. Se empleó un corpus de 299 clips de voz infantil, segmentados y anotados para entrenamiento en Google Colab con la biblioteca datasets de Hugging Face. Los resultados mostraron una reducción del Word Error Rate (WER) hasta un 81.74 % y valores semánticos adecuados en tono (0.8) y toxicidad (0.0). Se concluyó que la combinación del ajuste fino y la validación semántica permitió mejorar la comprensión contextual del habla infantil, aportando una metodología innovadora para el desarrollo de sistemas ASR con aplicaciones educativas y terapéuticas. |
| metadata.dc.description.degree: | Ingeniero en Ciencias de la Computación |
| URI : | http://dspace.uazuay.edu.ec/handle/datos/16261 |
| Aparece en las colecciones: | Facultad de Ciencias de la Administración |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 21776.pdf | Trabajo de Graduación | 246,39 kB | Adobe PDF | ![]() Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
