El uso de la Inteligencia Artificial en el ámbito de la voz en auge: ¿Qué derechos tienen empresas y locutores?

Bird & Bird e Intelivoz han analizado hoy junto a diferentes expertos los riesgos de seguridad y las nuevas oportunidades que abre la Inteligencia Artificial Generativa en el ámbito de la voz

Los ponentes también han comentado la normativa aplicable al uso de IA en el ámbito de la voz: una parte se regulará con normativa que ya existe (Propiedad Intelectual, Protección de Datos…) mientras que el Reglamento de Inteligencia Artificial de la UE seguirá un enfoque basado en los riesgos

La Inteligencia Artificial está entrando en la industria editorial mediante voces humanas clonadas para narrar audiolibros. En una industria, la del audio en español, que ha crecido un 75% en un año, el uso de IA generativa despierta todavía muchas incógnitas. Precisamente a las diversas cuestiones que suscita el uso de esta tecnología en el ámbito de la voz han respondido diferentes expertos del sector editorial, del sector de la voz y del sector legal en el evento ‘Aspectos legales de la IA generativa en el ámbito de la voz’, que ha organizado el despacho de abogados internacional Bird & Bird en sus oficinas de Madrid de la mano de Intelivoz, compañía especializada en la creación de valor para las empresas a través de la voz.

La jornada ha contado con la participación de Manuel Monterrubio y Antonio Quirós (Socios de Intelivoz), Teresa Marcos (Locutora de La General de Locutores), Raúl Lara (Presidente del sindicato de doblaje ADOMA), Maribel Riaza (Content Acquisition Manager, Storytel), Joaquín Muñoz (Socio de Bird & Bird), María Paz García Rubio, (Catedrática de Derecho Civil, Universidad de Santiago de Compostela) y Julia Ammerman Yebra, (Profesora de Derecho Civil, Universidad de Santiago de Compostela).

Aunque el uso de la Inteligencia Artificial sigue siendo motivo de controversia, la postura de los actores de voz frente a la expansión de esta tecnología en su trabajo “se ha vuelto más optimista que respecto a enero del año pasado”, ha indicado Teresa Marcos, de La General de Locutores. Según Marcos, fue entonces cuando se produjo una auténtica explosión en el uso de estas tecnologías.

“Las voces sintéticas existen desde hace mucho tiempo, lo veíamos por ejemplo en los contestadores automáticos, pero conseguir un modelo que replicara de forma parecida la voz de las personas era un proceso muy costoso, que requería grabar más de 10.000 frases y cuyo resultado tampoco era muy bueno. Todo esto cambió en enero de 2023 con la aparición de tecnología que, con tres minutos de captura de voz fonética, clonaba la voz con una calidad mucho más parecida a la natural”, ha indicado Antonio Quirós, de Intelivoz.

Una calidad que despierta muchas incógnitas respecto al derecho fundamental a la propia voz. En palabras de Teresa Marcos, “la voz nos parece un bien cultural. Por lo tanto, no se puede y no se debe creer que todos los libros se deben leer de la misma manera. Es necesario defender la identidad propia y de ámbito cultural de la voz, que cuando la Inteligencia Artificial comenzó a usarse en el sector no se tenía en cuenta”.

Además, la mayor sofisticación de Inteligencia Artificial Generativa suscita otra serie de riesgos de seguridad a nivel de biometría. “Si la voz sintética tiene la capacidad de imitar la manera de actuar, la cadencia y la entonación propias de una persona, se produce una brecha de seguridad”.

Hace unos meses se viralizaba en redes sociales el uso de una IA que doblaba automáticamente a otros idiomas las voces de personajes famosos. También se les atribuían frases que no habían pronunciado. “No se le dio importancia porque eran memes que se entendían como una broma, pero esa era una vulneración de los de derechos de imagen. Hay muchos riesgos y muy completos detrás de todo esto” ha advertido Raúl Lara, de ADOMA. “Nos preocupa que un derecho fundamental como es la voz pueda ser clonada y entre un circuito que se escape a nuestro control”. A los ya mencionados, Lara suma además otra serie de peligros que afectarían a los derechos laborales y a nivel sociocultural. “La tecnología avanza tan deprisa que no sabemos qué consecuencias va a tener”.

No obstante, el uso de Inteligencia Artificial generativa en el ámbito de la voz puede representar también una serie de oportunidades. Para Maribel Riaza, de Storytel, el uso de esta tecnología aporta en términos de “cantidad, diversidad y rentabilidad”, aunque este último punto con matices. “El uso de Inteligencia Artificial nos permite narrar un libro no sólo en castellano, sino que, si el usuario quiere escucharlo, por ejemplo, con acento argentino, la IA nos permite hacerlo. También escoger entre una voz masculina y una femenina. Esa diversificación de otro modo sería imposible”. No obstante, y aunque a día de hoy las voces sintéticas imitan a la voz humana, no están en el mismo nivel de entonación y se requiere de mucho trabajo de posproducción, lo que en muchos casos no es rentable.

¿Aportará más seguridad el Reglamento de IA que prepara la Unión Europea?

La Unión Europea trabaja en un Reglamento de Inteligencia Artificial, que tiene por objeto garantizar que los sistemas de esta tecnología introducidos en el mercado europeo y utilizados en la UE sean seguros y respeten los derechos fundamentales y los valores de la UE. No obstante, “este reglamento que viene, probablemente no vaya atajar muchas de las dudas que suscita el uso de IA en el ámbito de la voz”, ha indicado Joaquín Muñoz, socio del departamento de Commercial de Bird & Bird. “El uso de la Inteligencia Artificial en el ámbito de la voz se atajará con la normativa que ya existe, relativa a Propiedad Intelectual, Protección de Datos…” Y es que, tal y como ha explicado Muñoz, “el reglamento europeo se centra en determinar los usos o los riesgos que esos usos pueden tener”. Es decir, regulará lo que se puede y no se puede hacer, sin embargo, señala, “se han determinado una serie de usos de alto riesgo en los que probablemente la voz pueda entrar, por ejemplo, si la IA se utiliza para influir en colectivos vulnerables”.

Para Joaquin Muñoz, en el futuro la regulación irá en el sentido de identificar los contenidos. “El camino será dotar de transparencia a estos contenidos, que el usuario tenga la libertad de consumir el contenido que quiera siempre que esté informado de si lo que está escuchando está generado por una máquina o por una persona”.

¿Y cómo se protege la voz en nuestro ordenamiento jurídico? ¿Qué deben incluir los contratos entre profesionales de la voz y empresas de IA? Julia Ammerman, de la Universidad de Santiago de Compostela, ha señalado que: “El consentimiento tiene que incluir tanto el permiso para la grabación como para ceder los derechos de voz. Tiene que ser un consentimiento acotado, en el que se autoriza expresamente esa intromisión en los derechos a la voz. Acotado en el tiempo y también en cuanto al contenido y los usos determinados. Será una cuestión de negociar en el ámbito contractual a qué cede cada locutor, cada actor de voz”.

Además, Ammerman ha indicado la necesidad de que exista una facultad de revocación: “Si es una revocación sin causa habría que indemnizar a la otra parte los perjuicios causados”. Además, la cesión de derechos se hará una empresa concreta o empresas del mismo grupo, y siempre que en el contrato se especifique cuáles son.

¿Se estás cumpliendo estas condiciones? Para María Paz García Rubio, a día de hoy existe “un batiburrillo” contractual donde se mezclan diferentes áreas que complican dotar de seguridad a la industria. “Hay una cantidad de copias literales de cláusulas procedentes de contractos anglosajones que son inadaptables al derecho español, y cuando tienes que interpretar ese contrato, te enfrentas a una inseguridad jurídica total”.