Google Whisk

软件描述

与其使用冗长详细的文本提示生成图像,Whisk 让你通过图像进行提示。只需拖入图片,即可开始创作。

官方网站

访问软件的官方网站了解更多信息

官方认证

labs.google

安全链接HTTPS
立即访问

什么是 Google Whisk?

与其使用冗长详细的文本提示生成图像,Whisk 让你通过图像进行提示。只需拖入图像,即可开始创作。
Whisk 允许你输入一张图像作为主体,另一张作为场景,再添加一张作为风格。随后,你可以将它们混合搭配,创造出属于你自己的独特作品,如数字毛绒玩具、珐琅徽章或贴纸。
幕后,Gemini 模型会自动为你的图像生成详细描述,再将这些描述输入谷歌最新的图像生成模型。这一过程捕捉了主体的核心特征,而非完全复制。因此,你可以轻松地以新颖方式重新组合主体、场景与风格。

🔄 替代方案

60 个选择
4

Craiyon 是此前名为 DALL·E mini 的重新品牌化 AI 模型,利用先进的人工智能将文本转换为图像,同时积极应对来自未过滤互联网数据的偏见。该模型由 Boris Dayma 领衔,并获得 Google TRC 支持,在创意图像生成方面应用广泛。

5

一款先进的AI图像生成模型,可根据任意文本提示创作出复杂且细节丰富的视觉图像,操作简便,助力创意人士提升设计项目质量。

5

DALL-E 3 在文本到图像的转换上表现出色,具备细腻的理解力,并结合了 ChatGPT 生成的细节。可自由重印与商品化。安全功能降低风险,拒绝不当请求,确保视觉呈现的平衡性。

5

先进的自回归模型,用于统一的多模态理解与生成,具备视觉路径解耦、优化的训练策略以及校正流整合,实现卓越且灵活的任务表现。

5

Flux.1 是由黑森林实验室开发的前沿文本生成图像模型。它利用先进的AI技术,从文本描述中生成高质量图像,推动了图像生成在创意性、效率和多样性方面的边界。

2

Imagen 是谷歌最先进的文本到图像扩散技术,能够生成与用户提示高度一致且连贯的高质量、逼真图像。它可通过利用训练数据的自然分布,生成更加逼真的图像……

Stable Diffusion Online

Stable Diffusion Online

4

基于Stable Diffusion是一种潜在的文本到图像扩散模型。得益于Stability AI提供的慷慨计算资源捐赠以及LAION的支持,我们得以在LAION-5B数据库的一个子集中的512x512图像上训练了一个潜在扩散模型。

4

体验在几秒钟内将文本描述转化为精美图像的神奇效果。Ideogram 直接在您的浏览器中运行,无需下载任何应用程序或软件。

下一页