3 formas en que la IA está transformando la música

Advertisement

Cada otoño, comienzo mi curso sobre la intersección entre la música y la inteligencia artificial preguntando a mis estudiantes si les preocupa el papel de la IA en la composición o producción musical. Hasta ahora, la pregunta siempre ha provocado un rotundo “sí”. Sus temores se pueden resumir en una oración: la IA creará un mundo donde la música es abundante, pero los músicos serán dejados de lado.

En el próximo semestre, espero una discusión sobre Paul McCartney, quien en junio de 2023 anunció que él y un equipo de ingenieros de audio habían utilizado el aprendizaje automático para descubrir una pista vocal “perdida” de John Lennon, separando los instrumentos de una grabación de demostración. Pero resucitar las voces de artistas fallecidos es solo la punta del iceberg en términos de lo que es posible y lo que ya se está haciendo.

En una entrevista, McCartney admitió que la IA representa un futuro “aterrador” pero “emocionante” para la música. Para mí, su mezcla de consternación y excitación es precisa. Aquí hay tres formas en las que la IA está cambiando la manera en que se crea música, cada una de las cuales podría amenazar a los músicos humanos de diversas formas:

Muchos programas ya pueden generar música con una simple indicación del usuario, como “Danza Electrónica con un Ritmo de Almacén”. Las aplicaciones completamente generativas entrenan modelos de IA en extensas bases de datos de música existente. Esto les permite aprender estructuras musicales, armonías, melodías, ritmos, dinámicas, timbres y forma, generando nuevo contenido que estilísticamente coincide con el material en la base de datos.

Existen muchos ejemplos de este tipo de aplicaciones. Pero las más exitosas, como Boomy, permiten a personas sin formación musical generar música y luego publicar los resultados generados por IA en Spotify para ganar dinero. Spotify recientemente eliminó muchas de estas pistas generadas por Boomy, alegando que esto protegería los derechos y regalías de los artistas humanos.

Las dos empresas rápidamente llegaron a un acuerdo que permitió a Boomy volver a subir las pistas. Pero los algoritmos que impulsan estas aplicaciones todavía tienen una capacidad inquietante para infringir los derechos de autor existentes, lo que podría pasar desapercibido para la mayoría de los usuarios. Después de todo, basar nueva música en un conjunto de datos de música existente está destinado a causar similitudes notables entre la música en el conjunto de datos y el contenido generado.

Además, los servicios de streaming como Spotify y Amazon Music están naturalmente incentivados para desarrollar su propia tecnología de generación musical por IA. Spotify, por ejemplo, paga el 70% de los ingresos de cada reproducción al artista que la creó. Si la empresa pudiera generar esa música con sus propios algoritmos, podría eliminar a los artistas humanos de la ecuación por completo.

Con el tiempo, esto podría significar más dinero para los gigantes del streaming, menos dinero para los músicos, y un enfoque menos humano para hacer música.

Las aplicaciones habilitadas por aprendizaje automático que ayudan a los músicos a equilibrar todos los instrumentos y limpiar el audio de una canción -lo que se conoce como mezcla y masterización- son herramientas valiosas para aquellos que carecen de la experiencia, habilidad o recursos para lograr pistas de sonido profesional.

Durante la última década, la integración de la IA en la producción musical ha revolucionado cómo se mezclan y masterizan las canciones. Las aplicaciones impulsadas por IA como Landr, Cryo Mix y Neutron de iZotope pueden analizar automáticamente las pistas, equilibrar los niveles de audio y eliminar el ruido.

Estas tecnologías agilizan el proceso de producción, permitiendo a los músicos y productores centrarse en los aspectos creativos de su trabajo y dejar parte de la carga técnica a la IA. Si bien estas aplicaciones indudablemente quitan parte del trabajo a los mezcladores y productores profesionales, también les permiten completar rápidamente trabajos menos lucrativos, como la mezcla o masterización de una banda local, y centrarse en encargos bien remunerados que requieren más destreza. Estas aplicaciones también permiten a los músicos producir trabajos de sonido más profesional sin involucrar a un ingeniero de audio que no pueden costear.

Mediante el uso de algoritmos de “transferencia de tono” a través de aplicaciones como Mawf, los músicos pueden transformar el sonido de un instrumento en otro.

La canción “Enter Demons & Gods” del músico e ingeniero tailandés Yaboi Hanoi, que ganó el tercer Concurso Internacional de Canciones de IA en 2022, fue única porque estuvo influenciada no solo por la mitología tailandesa, sino también por los sonidos de instrumentos musicales nativos de Tailandia, que tienen un sistema de entonación no occidental. Uno de los aspectos técnicamente más emocionantes de la participación de Yaboi Hanoi fue la reproducción de un instrumento de viento de madera tradicional tailandés, el pi nai, que fue resintetizado para interpretar la pista.

Una variante de esta tecnología se encuentra en el núcleo del software de síntesis de voz Vocaloid, que permite a los usuarios producir pistas vocales convincentemente humanas con voces intercambiables.

Aplicaciones indeseables de esta técnica están surgiendo fuera del ámbito musical. Por ejemplo, el intercambio de voces por IA se ha utilizado para estafar a las personas con dinero.
Sin embargo, los músicos y productores ya pueden usarla para reproducir de manera realista el sonido de cualquier instrumento o voz imaginable. La desventaja, por supuesto, es que esta tecnología puede robar a los instrumentistas la oportunidad de interpretar en una pista grabada.

Aunque aplaudo la victoria de Yaboi Hanoi, me pregunto si alentará a los músicos a utilizar la IA para fingir una conexión cultural donde no existe.

En 2021, Capitol Music Group protagonizó titulares al firmar un “rapero de IA” que había recibido el avatar de un ciborg negro, pero que realmente era obra de ingenieros de software no negros de Factory New. La reacción fue rápida, con la discográfica ampliamente condenada por una flagrante apropiación cultural.

Pero la apropiación cultural musical mediante la IA es más fácil de causar de lo que podría pensarse. Con el extraordinario tamaño de las canciones y muestras que componen los conjuntos de datos utilizados por aplicaciones como Boomy -vea el conjunto de datos de código abierto “Million Song Dataset” para hacerse una idea de la magnitud-, existe una buena probabilidad de que un usuario cargue sin saberlo una pista recién generada que extrae de una cultura que no es la suya, o tome de un artista de una manera que imita demasiado de cerca al original.

Peor aún, no siempre estará claro a quién culpar por la ofensa, y las leyes de derechos de autor actuales en Estados Unidos son contradictorias y terriblemente inadecuadas para regular estos problemas.

Estos son todos temas que han surgido en mi propia clase, lo que me ha permitido al menos informar a mis estudiantes sobre los peligros de una IA sin control y cómo evitar mejor estos escollos.

Al mismo tiempo, al final de cada semestre de otoño, vuelvo a preguntar a mis estudiantes si les preocupa una toma de control de la música por parte de la IA. En ese momento, y con toda una experiencia semestral investigando estas tecnologías, la mayoría de ellos dicen estar emocionados por ver cómo evolucionará la tecnología y hacia dónde irá el campo.

Algunas posibilidades oscuras nos esperan para la humanidad y la IA. No obstante, al menos en el reino de la IA musical, hay razones para cierto optimismo, asumiendo que se evitan los escollos.

Advertisement
Advertisement