O Whisk, ferramenta de geração de imagens com inteligência artificial do Google, agora está disponível em mais de 100 países — incluindo o Brasil. Ainda em fase experimental, o serviço combina as capacidades multimodais do Gemini com a criação do Imagen 3 para criar imagens totalmente novas a partir de inspirações fornecidas pelo usuário.

Lançado em dezembro apenas nos Estados Unidos, o Whisk é mais um experimento do Google Labs, plataforma dedicada a soluções experimentais da gigante das buscas. Na última terça-feira (11), a exclusividade chegou ao fim, permitindo que usuários de diversos países testem a ferramenta.

Diferente dos geradores de imagens tradicionais, o processo de criação no Whisk começa com o envio de uma imagem para análise. Após ser processada pelo Gemini, o usuário descreve em texto as alterações desejadas e o Imagen 3 gera o resultado esperado. É possível fornecer uma única imagem e complementar a solicitação com descrições em texto, ou pedir que a IA combine elementos de diferentes arquivos.

STORYBOARD
Essa imagem foi gerada no Whisk a partir de sugestões entregues pelo Google. (Fonte: Whisk/Reprodução)

O método do Whisk tende a ser mais acessível para usuários com pouca experiência na criação de prompts, algo essencial em ferramentas de geração de imagens. O processo de edição é intuitivo e simplificado, contando até mesmo com sugestões para quem precisa de inspiração.

Como funciona a IA Whisk do Google?

A IA Whisk é alimentada pelo Gemini, modelo multimodal do Google capaz de interpretar imagens enviadas pelo usuário. A partir do arquivo, a IA gera uma descrição em texto (processo conhecido como “Image to Text”, ou I2T), destacando elementos como estilo, personagens, cenário e cores.

O Whisk trabalha em três frentes simultaneamente: assunto, ambiente e estilo. (Fonte: Whisk/Reprodução)

Essa descrição é usada para criar um prompt detalhado que servirá de base para a nova imagem. O usuário deve descrever o que deseja na composição final, seja no assunto principal, na ambientação ou no estilo da figura. A partir disso, o Imagen 3 transforma a solicitação em uma nova imagem (Text-to-Image, ou T2I).

Whisk é gratuito

O Whisk é totalmente gratuito, mas requer login no Google Labs com uma conta do Google. Além da IA de edição de imagens, a plataforma oferece outras ferramentas experimentais, como o Daily Listen, um Discover narrado por vozes sintéticas; o NotebookLM, um assistente para estudos; e o Jules, um assistente de programação.

Para explorar todas as funcionalidades, basta acessar o site oficial do Google Labs. Você também pode continuar no TecMundo para conferir mais sobre o NotebookLM e suas aplicações nos estudos diários ou brincar com o gerador de imagens nativo do Docs.


Previous post Home office: 70 vagas para trabalho remoto internacional [18/02]
Next post Corta corta de Trump: NASA e NSF sofrem cortes severos – The BRIEF