Criado com recurso a tecnologia de Inteligência Artificial, as Eternity são dos mais recentes artistas sul-coreanos a ultrapassar a fronteira entre o entretenimento real e o virtual. E a empresa Pulse9, criadora e gestora do grupo, acredita que as estrelas geradas por computador têm uma vantagem significativa sobre as suas congéneres reais
No videoclipe do seu último single "DTDTGMGN" os membros da banda sul-coreana Eternity dançam ao ritmo de uma batida pop bubblegum [chiclete] numa sala cor-de-rosa néon decorada com uniformes escolares e cartazes de celebridades. Os movimentos vertiginosos da câmara e as mudanças rápidas de cena são típicos do género K-pop, que se tornou um fenómeno global nos últimos anos.
"Abraça-me com força, encosta-te ao meu ombro", canta um dos membros.
Mas os fãs do grupo não podem fazer nenhuma destas coisas, fisicamente falando - porque nenhum dos 11 membros da banda Eternity é real.
Criado com recurso a tecnologia de Inteligência Artificial (IA), as Eternity são dos mais recentes artistas sul-coreanos a ultrapassar a fronteira entre o entretenimento real e o virtual. E a empresa Pulse9, criadora e gestora do grupo, acredita que as estrelas geradas por computador têm uma vantagem significativa sobre as suas congéneres reais.
Tal como acontece com a maioria dos grupos populares de K-pop, os membros da Eternity incluem um líder de grupo, vocalistas, rappers e dançarinos. Mas um membro em particular, Zae-in, consegue fazer tudo. "Zae-in tem (uma combinação de) características que a maioria dos artistas humanos dificilmente conseguiria", disse o diretor executivo da empresa, Park Ji-eun. "Ela canta muito bem, faz rap muito bem e consegue ser criativa como designer (de moda). E é uma atriz nata."
Com a ajuda da tecnologia de troca de rosto em tempo real e de uma voz gerada por IA, Zae-in é interpretada por dez pessoas diferentes, incluindo atores, cantores e bailarinos, que emprestam os seus talentos ao seu avatar conforme necessário. Num vídeo publicado na conta de Instagram de Zae-in, por exemplo, ela conduz habilmente um skate longboard junto ao rio Han, em Seul. Para o vídeo, os seus criadores filmaram a acrobacia com um substituto cujo rosto foi depois trocado pelo de Zae-in.
"Há a Zae-in da música pop, a Zae-in atriz, a Zae-in repórter", disse a estrela virtual à CNN numa entrevista por Zoom, durante a qual foi interpretada por um ator (embora a Pulse9 tenha dito que o seu software de IA consegue recriar a voz de Zae-in e gerar discurso sem intervenção humana). "Existem vários Zae-ins. A nossa única vantagem é que podemos fazer o que uma pessoa não pode."
"A única coisa que não podemos fazer é dar um autógrafo", acrescentou, com os olhos a sorrir.
A troca de rostos em tempo real e as primeiras formas de tecnologia deepfake existem há quase uma década. Durante esse tempo, influenciadores virtuais como Lil Miquela e Rozy, da Coreia do Sul, ganharam grandes seguidores online nos espaços da moda e da música.
Mas os últimos avanços em vídeo e áudio gerados por IA estão a tornar mais fácil a empresas como a Pulse9 criar personagens virtuais convincentes, enquanto os avanços em programas de IA generativa como o ChatGPT estão a eliminar a necessidade de estrelas como Zae-in serem "interpretadas" por alguém.
Como foram criados
A equipa da Pulse9 começou o processo de dar "vida" desenhando o visual dos seus membros. A equipa de Park criou 101 rostos digitais únicos, inspirados em celebridades coreanas existentes, antes de os dividir em quatro categorias - designadas por "sexy", "giro", "inteligente" e "inocente" - e reduzir a seleção a 11 através de uma sondagem online.
Utilizando tecnologia deepfake e de captura de movimentos, a Pulse9 produziu então o primeiro videoclipe da banda (para acompanhar a faixa ironicamente intitulada "I'm Real") em 2021. A reação ao vídeo foi mista. Muitos utilizadores das redes sociais acharam que as expressões faciais dos membros da banda pareciam pouco naturais e separadas dos seus corpos, enquanto outros citaram o efeito uncanny valley, em que os espectadores se sentem desconfortáveis com coisas que se assemelham a humanos mas não o são.
Mas cinco meses depois, quando a Pulse9 lançou o videoclipe seguinte das Eternity, "No Filter", os seguidores notaram que o grupo era quase indistinguível do real. "Estou surpreendido com o quão realistas eles soam, e os visuais parecem mais realistas do que a canção de estreia", lê-se no comentário mais apreciado no YouTube.
"DTDTGMGN", lançado em outubro passado, representou outro grande salto de qualidade. "Até ao ano passado, o rosto era a única parte virtual do artista, mas hoje podemos fazer (imagens) de corpo inteiro com base na tecnologia de IA", indicou Park, acrescentando que "No Filter" também foi composta com recurso a IA (embora os humanos tenham editado a canção e escrito a letra).
A SM Entertainment, a agência por detrás de megaestrelas do K-pop como Super Junior, Girls' Generation e Exo, entre outras, também tem vindo a fazer experiências com IA. Em 2020, a empresa estreou o Aespa, um grupo composto por quatro artistas humanos e os seus homólogos virtuais. Após o lançamento da banda, o fundador da SM, Lee Soo-man, declarou que o futuro do entretenimento é "celebridades e robôs".
Por outro lado, a empresa de gestão dos BTS, Hybe, utilizou a IA para ajustar a pronúncia e o tom de voz de um dos seus cantores, antes de lançar uma das suas canções em seis línguas - coreano, inglês, espanhol, chinês, japonês e vietnamita.
E no início deste ano, a Metaverse Entertainment, uma agência formada pela editora de videojogos Netmarble e pela empresa-mãe da SM Entertainment, a Kakao Entertainment, estreou um grupo feminino virtual, MAVE. Ao contrário das Eternity, que se baseia em trocas diretas de rostos, os quatro membros do MAVE foram criados de raiz usando CGI.
A Metaverse Entertainment utilizou tecnologia de IA para gerar rostos, fundindo as características e os penteados considerados mais desejáveis em quatro personagens finais. A empresa utilizou tecnologia de captura de movimentos para gravar atuações reais de K-pop que um programa utilizou depois para animar os vídeos musicais. As vozes do grupo são parte humanas e parte geradas por IA, afirmou o diretor técnico da Metaverse Entertainment, Kang Sung-ku.
"O nosso objetivo é criar seres humanos virtuais totalmente orientados para a IA (que sejam) realmente credíveis", assumiu à CNN.
O videoclipe do primeiro single do MAVE, "Pandora", já acumulou 25 milhões de visualizações no YouTube desde o seu lançamento em janeiro.
O futuro do K-pop
As estrelas pop virtuais podem ter uma vantagem sobre as humanas quando se trata de interagir com as suas bases de fãs. Os avanços nos programas de linguagem de IA podem tornar possível aos fãs "falarem" com os seus ídolos - e até construírem a sua própria relação pessoal com eles, lembrou Kang.
"Eles vão lembrar-se do que falámos ontem e podem continuar a falar sobre coisas de conversas anteriores", disse, fazendo uma comparação entre as criações de IA da sua empresa e o assistente virtual do iPhone, Siri. "Lembrar-se-ão de si e saberão sobre si - e falarão (consigo) com base nessa informação."
A Metaverse Entertainment já está a experimentar esta ideia através de aplicações que permitem aos utilizadores interagir diretamente com o MAVE. Atualmente, os membros da banda falam coreano, inglês, francês e indonésio - indicativos das principais bases de fãs e mercados-alvo - embora, teoricamente, possam falar qualquer número de línguas.
"Há coisas que não posso dizer (nem mesmo aos meus melhores amigos), mas talvez possa dizer a uma IA personalizada, que me pode confortar e preocupar-se comigo", observoi Kang. "Acho que vai ser bom para toda a gente."
O desenvolvimento pode certamente ser bom para empresas como a de Kang. A indústria do K-pop é sustentada por um laborioso sistema de estagiários, no qual os aspirantes são moldados desde tenra idade, muitas vezes passando por anos de dispendiosas aulas de dança e música antes de se estrearem. (De acordo com o Wall Street Journal, a SM Entertainment gastou cerca de 3 milhões de dólares para levar o Girls Generation ao mercado em 2007). As agências têm de investir em aulas, espaço de estúdio, styling e, por vezes, até em procedimentos cosméticos para os potenciais membros da banda - custos que não são necessários para os talentos virtuais.
Além disso, as estrelas pop geradas por computador nunca adoecem, envelhecem ou envolvem-se em disputas contratuais ou escândalos nos tabloides. Mas há poucas hipóteses de as grandes agências substituírem as suas bandas reais em breve, sublinhou Kang, reconhecendo que alguns sectores da comunidade K-pop reagiram mal aos grupos de IA.
"As críticas referiam-se à substituição dos ídolos atuais por virtuais - pensavam que os ídolos atuais poderiam perder os seus empregos", disse Kang, acrescentando que alguns fãs preferirão sempre artistas humanos.
O criador de Eternity, Park, concordou, comparando o aparecimento da IA com a invenção da fotografia no século XIX: "Muitos pintores tinham medo da (nova) tecnologia, mas hoje ainda temos pintores. Acho que os BTS nunca terão medo dos ídolos virtuais - são apenas novos conteúdos."