Google Whisk

软件描述

Whisk 不需要使用长而详细的文本提示来生成图像,你只需拖入图像即可开始创作。

官方网站

访问软件的官方网站了解更多信息

官方认证

labs.google

安全链接HTTPS

什么是 Google Whisk?

Whisk 不再需要使用长而详细的文本提示来生成图像,而是允许你通过图像进行提示。只需拖入图像,即可开始创作。
你可以为创作输入主体图像、场景图像以及风格图像,然后将它们混合重组,创造出属于你自己的独特作品,例如数字毛绒玩具、徽章或贴纸。
在后台,Gemini 模型会自动为你的图像生成详细的描述。随后,这些描述会被输入到谷歌最新的图像生成模型中。这一过程捕捉了图像的精髓,而非完全复制原图。因此,你可以轻松地以新颖的方式重新组合主体、场景和风格。

🔄 替代方案

62 个选择

曾被称为 DALL·E mini 的新一代 AI 模型 Craiyon,利用先进的人工智能技术将文本转化为图像,同时积极应对来自未经过滤的互联网数据中的偏见。该模型由谷歌 TRC 支持,由 Boris Dayma 领军,广泛应用于创意图像生成领域。

免费增值 • 开源
查看详情

一种先进的基于人工智能的图像生成模型,能够从任意文本提示中创作出复杂且细节丰富的视觉内容,对创意人员友好,可提升设计项目的效率。

付费 • 专有
查看详情

DALL-E 3 在文本到图像的准确转换方面表现出色,融合了对细节的深入理解以及由 ChatGPT 生成的丰富细节。用户可自由创作,支持重新生成和商品化。安全功能可降低风险,拒绝不安全请求,并确保视觉表现的均衡性。

付费 • 专有
查看详情

面向统一多模态理解与生成的先进自回归模型,具备视觉路径解耦、优化训练策略以及修正流整合特性,可实现卓越且灵活的任务性能。

免费 • 开源
查看详情

Flux.1 是由 Black Forest Labs 开发的最先进的文生图合成模型。它采用先进的AI技术,能够根据文本描述生成高质量图像,推动图像生成在创意性、效率和多样性方面的边界。

免费 • 开源
查看详情

Imagen 是谷歌最先进的文本到图像扩散技术,能够生成高质量、高度逼真的图像,这些图像与用户的提示内容高度契合且保持一致。通过利用其训练数据的自然分布,Imagen 可以生成更加逼真的图像……

付费 • 专有
查看详情
Stable Diffusion Online

Stable Diffusion Online

人工智能图像生成器

4

基于稳定扩散,是一种潜在的文本到图像扩散模型。得益于Stability AI慷慨的算力捐赠以及LAION的支持,我们能够在LAION-5B数据库的一个子集上,基于512x512图像训练了一个潜在扩散模型。

免费增值 • 专有
查看详情

几秒钟内即可将文本描述转化为美丽的图像,体验这一奇妙过程。Ideogram 直接在您的浏览器中运行,无需下载任何应用程序或软件。

免费增值 • 专有
查看详情
上一页
下一页