Google Whisk
软件描述
Whisk 不需要使用长而详细的文本提示来生成图像,你只需拖入图像即可开始创作。
官方网站
访问软件的官方网站了解更多信息
labs.google
什么是 Google Whisk?
Whisk 不再需要使用长而详细的文本提示来生成图像,而是允许你通过图像进行提示。只需拖入图像,即可开始创作。
你可以为创作输入主体图像、场景图像以及风格图像,然后将它们混合重组,创造出属于你自己的独特作品,例如数字毛绒玩具、徽章或贴纸。
在后台,Gemini 模型会自动为你的图像生成详细的描述。随后,这些描述会被输入到谷歌最新的图像生成模型中。这一过程捕捉了图像的精髓,而非完全复制原图。因此,你可以轻松地以新颖的方式重新组合主体、场景和风格。
🔄 替代方案
62 个选择
Craiyon
曾被称为 DALL·E mini 的新一代 AI 模型 Craiyon,利用先进的人工智能技术将文本转化为图像,同时积极应对来自未经过滤的互联网数据中的偏见。该模型由谷歌 TRC 支持,由 Boris Dayma 领军,广泛应用于创意图像生成领域。
一种先进的基于人工智能的图像生成模型,能够从任意文本提示中创作出复杂且细节丰富的视觉内容,对创意人员友好,可提升设计项目的效率。

DALL-E 3
DALL-E 3 在文本到图像的准确转换方面表现出色,融合了对细节的深入理解以及由 ChatGPT 生成的丰富细节。用户可自由创作,支持重新生成和商品化。安全功能可降低风险,拒绝不安全请求,并确保视觉表现的均衡性。

FLUX.1
Flux.1 是由 Black Forest Labs 开发的最先进的文生图合成模型。它采用先进的AI技术,能够根据文本描述生成高质量图像,推动图像生成在创意性、效率和多样性方面的边界。

Google Imagen
Imagen 是谷歌最先进的文本到图像扩散技术,能够生成高质量、高度逼真的图像,这些图像与用户的提示内容高度契合且保持一致。通过利用其训练数据的自然分布,Imagen 可以生成更加逼真的图像……

Stable Diffusion Online
基于稳定扩散,是一种潜在的文本到图像扩散模型。得益于Stability AI慷慨的算力捐赠以及LAION的支持,我们能够在LAION-5B数据库的一个子集上,基于512x512图像训练了一个潜在扩散模型。