Meta Platforms, el cerebro detrás de Facebook, Instagram y más, acaba de lanzar su asombroso programa de clonado vocal, Audiobox. ¡Y aquí te contamos todo sobre esta innovación!

Audiobox es un modelo de investigación de Meta para generación de audio basado en su trabajo previo con Voicebox. Esta joyita puede replicar voces y efectos de sonido mediante la combinación de entradas de voz y texto. ¡Es como magia, pero en la tecnología!

Detalles técnicos impresionantes

Con modelos dedicados para imitar el habla y generar sonidos ambientales, Audiobox utiliza el modelo self-supervised Audiobox SSL. ¿Qué significa eso? Es un enfoque de aprendizaje profundo donde los algoritmos de inteligencia artificial generan sus propias etiquetas para datos no etiquetados. ¡Así es, se enseña a sí mismo!

La magia de los datos y las demostraciones interactivas

Los investigadores de Meta utilizaron datos de más de 160.000 horas de habla, 20.000 horas de música y 6.000 horas de muestras de sonido. La diversidad es clave, ¡con hablantes de más de 150 países y más de 200 idiomas!

¡Pruébalo tú mismo!

Meta te permite experimentar con Audiobox a través de demos interactivas. Puedes grabar tu voz y clonarla, o incluso generar nuevas voces a partir de descripciones de texto. ¡Es tan divertido como útil!

Reflexiones finales: Emoción y limitaciones

¡La capacidad de Audiobox es increíble! Sin embargo, hay una advertencia: no es open-source, solo es para fines de investigación y no puede usarse comercialmente. Además, está restringido en algunos estados de EE. UU. ¡Así que a disfrutarlo, pero con responsabilidad!

399
Suscribirse
Notificación
0 Comments
Inline Feedbacks
Ver todos los comentarios
0
¡Aquí puedes dejar tus comentarios!x