![]() Vídeo, imagem, discurso e música. O Google Cloud (GOGL34) reivindicou o título de primeira empresa a disponibilizar modelos de IA para a criação de todos os tipos de mídia em uma plataforma. Nesta quarta-feira (9), a companhia incluiu a Lyria, um modelo que transforma comandos de texto em música, ao seu catálogo do Vertex AI. O novo modelo promete produzir “áudios em alta-definição, capturando meticulosamente nuances e entregando composições ricas e detalhadas por uma vasta série de gêneros”. Em uma demonstração feita no evento Google Cloud Next 25′, uma música com descrições subjetivas como “capturar o sentimento do tardar da noite em um clube de jazz esfumaçado”, bem como orientações objetivas como “priorizar solos vertiginosos de saxofone e trompete”.
“Hoje disponibilizamos a Lyria no Google Cloud para transformar prompts de texto em clipes faixas musicais de 30 segundos e somos o primeiro hyperscaler [grandes empresas de processamento de dados em nuvem] a oferecer essa possibilidade”, disse o CEO do Google Cloud, Thomas Kurian, em uma apresentação no evento. Segundo o Google Cloud, a ferramenta deve levar empresas a criar rapidamente trilhas sonoras para campanhas de marketing, lançamentos de produtos ou experiências imersivas. Também deve atender à produção de vídeo, podcasts e criação de conteúdos digitais. Vídeo, imagem e vozEm uma exibição de teste de seus modelos de IA para criação de mídia, o Google exibiu o clássico “O Mágico de Oz” (1939) no “The Sphere”, uma tela esférica gigante em Las Vegas. Cenas do filme original foram reconstituídas e pedaços que escapavam da dimensão original em que foi filmado foram criadas do zero. Uma tomada do original mostrando a cabeça da protagonista Dorothy (interpretada por Judy Garland), por exemplo, foi incluído um corpo dançando para preencher as dimensões da tela. ![]() Além da Lyria, os modelos Veo 2, de criação de vídeo, Chirp 3, de áudio, e Imagen 3, também estão disponíveis no Vertex AI, plataforma para implementação e treinamento de modelos de linguagem do Google Cloud. Atualizações das ferramentas também foram anunciadas no evento. O Veo 2 agora conta com uma opção de controle de câmera. Usuários podem, pode exemplo, subir uma imagem no aplicativo e pedir para que ele a anime com um determinado movimento, como um sobrevoo de um drone. A atualização do Chirp 2 permite criar vozes personalizadas com base em 10 segundos de áudios enviados ao modelo. Também é possível adicionar narrações às gravações existentes e transcrever falar com identificação automática dos locutores. Pelo Imagen 3, usuários podem agora retocar e reconstituir áreas ausentes ou danificadas de uma imagem. Entre os parceiros, a Adobe fechou uma parceria para a inclusão dos modelos Imagen 3 na plataforma Adobe Express; Kraft Heinz, L’Oreal e Bending Spoons já usam ferramentas do Vertex AI na criação de campanha, clipes e fotos. *O repórter viajou até Las Vegas a convite do Google Cloud |
Seu endereço de e-mail não será publicado. Os campos obrigatórios estão marcados *