Olá! Eu vejo o que você está a fazer, quero falar consigo e ouço a sua respiração. Acalme-se

CNN , Clare Duffy
14 mai 2024, 10:45
GPT-4o (Getty)

A inteligência artificial dá um novo passo. Um enorme novo passo

OpenAI revela o mais recente modelo de IA, GPT-4o

por Clare Duffy, CNN
 

O ChatGPT está prestes a tornar-se muito mais útil.

A OpenAI anunciou um novo modelo de linguagem de grande dimensão de inteligência artificial que, segundo a empresa, tornará o ChatGPT mais inteligente e fácil de utilizar.

O novo modelo, denominado GPT-4o, é uma atualização do anterior modelo GPT-4 da empresa, lançado há pouco mais de um ano. O modelo estará disponível gratuitamente para os clientes, o que significa que qualquer pessoa terá acesso à tecnologia mais avançada da OpenAI através do ChatGPT.

Com base na demonstração feita pela empresa na segunda-feira, o GPT-4o transformará efetivamente o ChatGPT num assistente pessoal digital que pode participar em conversas em tempo real. Também será capaz de interagir utilizando texto e “visão”, o que significa que pode ver capturas de ecrã, fotografias, documentos ou gráficos carregados pelos utilizadores e ter uma conversa sobre os mesmos.

Mira Murati, diretora de tecnologia da OpenAI, explicou que a versão atualizada do ChatGPT terá também capacidade de memória, o que significa que pode aprender com as anteriores conversas com os utilizadores, e pode fazer traduções em tempo real.

“Esta é a primeira vez que estamos a dar um grande passo no que diz respeito à facilidade de utilização”, afirmou Murati durante a demonstração ao vivo a partir da sede da empresa em São Francisco. “Esta interação torna-se muito mais natural e muito, muito mais fácil”.

A nova versão surge num momento em que a OpenAI procura manter-se à frente da crescente concorrência na corrida às armas da Inteligência Artificial. Rivais como Google e Meta têm trabalhado para construir modelos de linguagem ampla cada vez mais poderosos que alimentam os chatbots e podem ser usados para trazer a tecnologia de IA para vários outros produtos.

O evento OpenAI realizou-se um dia antes da conferência anual de programadores I/O da Google, na qual se espera que sejam anunciadas atualizações do modelo Gemini AI. Tal como o novo GPT-4o, o Gemini da Google também é multimodal, o que significa que pode interpretar e gerar texto, imagens e áudio. A atualização da OpenAI também surge antes dos anúncios de IA esperados pela Apple na Conferência Mundial de Programadores no próximo mês, que poderão incluir novas formas de incorporar a IA nas próximas versões do iPhone ou iOS.

Entretanto, a mais recente versão do GPT pode ser uma vantagem para a Microsoft, que investiu milhares de milhões de euros na OpenAI para incorporar a tecnologia de IA nos produtos da própria Microsoft.

Executivos da OpenAI demonstram o mais recente modelo de linguagem alargada da empresa, o GPT-4o. Fonte: OpenAI

Os executivos da OpenAI apresentaram uma conversa oral com o ChatGPT para obter instruções em tempo real para resolver um problema de matemática, para contar uma história de embalar e para obter conselhos de codificação. O ChatGPT foi capaz de falar com uma voz natural e humana, bem como com uma voz de robot - e até cantou parte de uma resposta. A ferramenta também foi capaz de olhar para uma imagem de um gráfico e discuti-la.

Mostraram também que o modelo detetava as emoções dos utilizadores; num caso, ouviu a respiração de um executivo e encorajou-o a acalmar-se.

“A voz feminina do ChatGPT (que soa notavelmente semelhante à voz da companheira digital de Scarlett Johansson do filme ‘Her’, de 2013) disse o novo GPT ao executivo em tom de brincadeira.

O ChatGPT também foi capaz de manter uma conversa em várias línguas, traduzindo e respondendo automaticamente. Atualmente, segundo a OpenAI, a ferramenta suporta mais de 50 idiomas.

“O novo modo de voz (e vídeo) é a melhor interface de computador que já usei”, declarou o CEO da OpenAI, Sam Altman, numa publicação no blogue após o anúncio. “Parece a IA dos filmes; e ainda me surpreende o facto de ser real. Chegar a tempos de resposta e expressividade ao nível humano acaba por ser uma grande mudança”.

Murati disse que a OpenAI vai lançar uma aplicação de desktop ChatGPT com as capacidades do GPT-4o, dando aos utilizadores outra plataforma para interagir com a tecnologia da empresa. O GPT-4o também estará disponível para programadores que procuram construir os próprios chatbots personalizados a partir da loja GPT da OpenAI, uma funcionalidade que agora também estará disponível para os utilizadores não pagantes.

A tecnologia e os recursos atualizados estão prontos para serem lançados no ChatGPT nos próximos meses. Os utilizadores gratuitos do ChatGPT terão um número limitado de utilizações com o novo modelo GPT-4o antes da ferramenta voltar a utilizar automaticamente o antigo modelo GPT-3.5; os utilizadores pagos terão acesso a um maior número de mensagens com o modelo mais recente.

A OpenAI afirmou que mais de 100 milhões de pessoas já estão a utilizar o ChatGPT. Mas uma experiência ChatGPT atualizada - e a capacidade de interagir com ele no ambiente de trabalho e através de conversas de voz melhoradas - pode dar ainda mais razões para as pessoas utilizarem a tecnologia. As mudanças surgem numa altura em que as integrações de IA em produtos de consumo mais amplamente utilizados pela Google e pela Meta, como o Instagram e o Google Assistant, podem tornar a tecnologia dessas empresas mais ampla e facilmente acessível.

Tecnologia

Mais Tecnologia

Patrocinados