Please use this identifier to cite or link to this item:
http://dspace.uazuay.edu.ec/handle/datos/16261| Title: | Ajuste fino de un modelo pre-entrenado para reconocimiento de voz infantil con validación semántica basada en modelos de lenguaje |
| Authors: | Carvajal Vargas, Fabián Marcelo García Peñaloza, James Rusbel |
| Keywords: | APRENDIZAJE PROFUNDO;HABLA INFANTIL;MODELOS DE LENGUAJE;RECONOCIMIENTO AUTOMÁTICO DEL HABLA;VALIDACIÓN SEMÁNTICA |
| Issue Date: | 2025 |
| Publisher: | Universidad del Azuay |
| Abstract: | La investigación tuvo como objetivo optimizar un modelo de reconocimiento automático de voz (ASR) adaptado al habla infantil en español mediante el ajuste fino del modelo pre-entrenado Whisper-Large-V3-Turbo. El estudio se fundamentó en la corriente teórica del aprendizaje profundo y el procesamiento del lenguaje natural, integrando una validación semántica basada en modelos de lenguaje (LLM) mediante Meta/Llama 3.3. Se empleó un corpus de 299 clips de voz infantil, segmentados y anotados para entrenamiento en Google Colab con la biblioteca datasets de Hugging Face. Los resultados mostraron una reducción del Word Error Rate (WER) hasta un 81.74 % y valores semánticos adecuados en tono (0.8) y toxicidad (0.0). Se concluyó que la combinación del ajuste fino y la validación semántica permitió mejorar la comprensión contextual del habla infantil, aportando una metodología innovadora para el desarrollo de sistemas ASR con aplicaciones educativas y terapéuticas. |
| metadata.dc.description.degree: | Ingeniero en Ciencias de la Computación |
| URI: | http://dspace.uazuay.edu.ec/handle/datos/16261 |
| Appears in Collections: | Facultad de Ciencias de la Administración |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 21776.pdf | Trabajo de Graduación | 246,39 kB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
