Karaoke generado mediante IA
Jaén
Las técnicas actuales de separación de fuentes basadas en aprendizaje profundo permiten generar automáticamente versiones karaoke de la mayoría de las canciones comerciales con una calidad suficientemente alta para aplicaciones de entretenimiento y producción musical. Además, la integración de modelos avanzados de reconocimiento automático del habla y del canto, como las versiones recientes de Whisper con información temporal a nivel de palabra o frase, permite obtener de forma automática la letra de la canción sincronizada con la música. Esto facilita la generación de sistemas karaoke completos que incluyen tanto la pista instrumental como el resaltado temporal de las palabras durante la reproducción, sin necesidad de intervención manual.
Grupo/Departamento de investigación:
Teoría de la Señal y Comunicaciones