O Whisk, ferramenta de geração de imagens com inteligência artificial do Google, agora está disponível em mais de 100 países — incluindo o Brasil. Ainda em fase experimental, o serviço combina as capacidades multimodais do Gemini com a criação do Imagen 3 para criar imagens totalmente novas a partir de inspirações fornecidas pelo usuário.
Lançado em dezembro apenas nos Estados Unidos, o Whisk é mais um experimento do Google Labs, plataforma dedicada a soluções experimentais da gigante das buscas. Na última terça-feira (11), a exclusividade chegou ao fim, permitindo que usuários de diversos países testem a ferramenta.
Diferente dos geradores de imagens tradicionais, o processo de criação no Whisk começa com o envio de uma imagem para análise. Após ser processada pelo Gemini, o usuário descreve em texto as alterações desejadas e o Imagen 3 gera o resultado esperado. É possível fornecer uma única imagem e complementar a solicitação com descrições em texto, ou pedir que a IA combine elementos de diferentes arquivos.

O método do Whisk tende a ser mais acessível para usuários com pouca experiência na criação de prompts, algo essencial em ferramentas de geração de imagens. O processo de edição é intuitivo e simplificado, contando até mesmo com sugestões para quem precisa de inspiração.
Como funciona a IA Whisk do Google?
A IA Whisk é alimentada pelo Gemini, modelo multimodal do Google capaz de interpretar imagens enviadas pelo usuário. A partir do arquivo, a IA gera uma descrição em texto (processo conhecido como “Image to Text”, ou I2T), destacando elementos como estilo, personagens, cenário e cores.

Essa descrição é usada para criar um prompt detalhado que servirá de base para a nova imagem. O usuário deve descrever o que deseja na composição final, seja no assunto principal, na ambientação ou no estilo da figura. A partir disso, o Imagen 3 transforma a solicitação em uma nova imagem (Text-to-Image, ou T2I).
Whisk é gratuito
O Whisk é totalmente gratuito, mas requer login no Google Labs com uma conta do Google. Além da IA de edição de imagens, a plataforma oferece outras ferramentas experimentais, como o Daily Listen, um Discover narrado por vozes sintéticas; o NotebookLM, um assistente para estudos; e o Jules, um assistente de programação.
Para explorar todas as funcionalidades, basta acessar o site oficial do Google Labs. Você também pode continuar no TecMundo para conferir mais sobre o NotebookLM e suas aplicações nos estudos diários ou brincar com o gerador de imagens nativo do Docs.