Google Whisk
软件描述
与其使用冗长详细的文本提示生成图像,Whisk 让你通过图像进行提示。只需拖入图片,即可开始创作。
官方网站
访问软件的官方网站了解更多信息
labs.google
什么是 Google Whisk?
与其使用冗长详细的文本提示生成图像,Whisk 让你通过图像进行提示。只需拖入图像,即可开始创作。
Whisk 允许你输入一张图像作为主体,另一张作为场景,再添加一张作为风格。随后,你可以将它们混合搭配,创造出属于你自己的独特作品,如数字毛绒玩具、珐琅徽章或贴纸。
幕后,Gemini 模型会自动为你的图像生成详细描述,再将这些描述输入谷歌最新的图像生成模型。这一过程捕捉了主体的核心特征,而非完全复制。因此,你可以轻松地以新颖方式重新组合主体、场景与风格。
🔄 替代方案
60 个选择
Craiyon
Craiyon 是此前名为 DALL·E mini 的重新品牌化 AI 模型,利用先进的人工智能将文本转换为图像,同时积极应对来自未过滤互联网数据的偏见。该模型由 Boris Dayma 领衔,并获得 Google TRC 支持,在创意图像生成方面应用广泛。

DALL-E 3
DALL-E 3 在文本到图像的转换上表现出色,具备细腻的理解力,并结合了 ChatGPT 生成的细节。可自由重印与商品化。安全功能降低风险,拒绝不当请求,确保视觉呈现的平衡性。
Janus
先进的自回归模型,用于统一的多模态理解与生成,具备视觉路径解耦、优化的训练策略以及校正流整合,实现卓越且灵活的任务表现。

FLUX.1
Flux.1 是由黑森林实验室开发的前沿文本生成图像模型。它利用先进的AI技术,从文本描述中生成高质量图像,推动了图像生成在创意性、效率和多样性方面的边界。

Google Imagen
Imagen 是谷歌最先进的文本到图像扩散技术,能够生成与用户提示高度一致且连贯的高质量、逼真图像。它可通过利用训练数据的自然分布,生成更加逼真的图像……

Stable Diffusion Online
基于Stable Diffusion是一种潜在的文本到图像扩散模型。得益于Stability AI提供的慷慨计算资源捐赠以及LAION的支持,我们得以在LAION-5B数据库的一个子集中的512x512图像上训练了一个潜在扩散模型。


