Skip to content

El Traductor Multi-idioma de Voz procesa audio en español y lo traduce a inglés, italiano, francés y japonés, devolviendo el resultado como audio generado por inteligencia artificial.

Notifications You must be signed in to change notification settings

Martin-S-Romero/Traductor_multi-idioma

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Traductor Multi-idioma de Voz

Este proyecto se enfoca en el procesamiento de audio en español, proporcionando la capacidad de traducirlo a varios idiomas, incluyendo inglés, italiano, francés y japonés. El sistema devuelve el resultado traducido en formato de audio, generado mediante inteligencia artificial de voz, ofreciendo una experiencia eficiente y precisa en la conversión de texto a voz.

Librerias

Para ejecutar este proyecto, es necesario configurar varias variables de entorno, las cuales son:

gradio openai-whisper translate python-dotenv elevenlabs

A continuación, se proporcionan los enlaces a los sitios oficiales de las herramientas utilizadas, aunque también se mencionan brevemente en la documentación del código:

Capturas de Pantalla

WEB

Ejecución Local

Clona el proyecto:

git clone https://github.com/Martin-S-Romero/Traductor_multi-idioma.git

Accede al directorio del proyecto:

cd Traductor_multi-idioma

Crea un entorno virtual:

python -m venv {nombre-del-entorno-virtual}

Inicia el entorno virtual:

.\{nombre-del-entorno-virtual}\Scripts\Activate.ps1

Instala las dependencias:

pip install -r .\requirements.txt

¡Listo!

NOTA: Es posible que necesites instalar ffmpeg.

Lección Aprendida

El mayor reto durante la realización de este proyecto fue comprender y dominar las diversas herramientas involucradas. En particular, tuve la oportunidad de conocer Gradio, una biblioteca de Python que facilita la creación de interfaces web interactivas sin la necesidad de recurrir a frameworks de desarrollo web tradicionales. Esto me permitió simplificar el proceso de construcción de la interfaz y enfocar mis esfuerzos en otras áreas del proyecto. Además, fue especialmente enriquecedor explorar las capacidades de la inteligencia artificial aplicada a la conversión de texto a voz, lo que añadió un elemento innovador y dinámico a la solución. A lo largo del desarrollo, pude profundizar en la integración de tecnologías avanzadas para ofrecer una experiencia fluida y efectiva al usuario.

Futuras Mejoras

  • Despliegue en la nube.
  • Selección de idiomas adicionales.
  • Carga de archivos de audio.
  • Corrección de ortografía en los comentarios del código.
  • Visualización de la traducción.

Autores

  • @mouredev
  • @Martin-S-Romero
    (La base del código es de otro autor, pero con las actualizaciones me he ganado el crédito de "autor" 😄)

Agradecimientos

Feedback

Si tienes alguna retroalimentación, no dudes en contactarme al correo: [email protected]

About

El Traductor Multi-idioma de Voz procesa audio en español y lo traduce a inglés, italiano, francés y japonés, devolviendo el resultado como audio generado por inteligencia artificial.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages