谷歌 Gemini Advanced 图片生成(文生图)方法及技巧

· 7分钟阅读
谷歌 Gemini Advanced 图片生成(文生图)方法及技巧
Gemini Advanced 生成的高分辨率图片

谷歌最近给其 AI 聊天机器人起了个新名字:Gemini。这款机器人正在经历一系列升级,其中也包括新增了一个非常实用的功能——根据文字提示生成图片(Text To Image)。

这个新技术是归功于谷歌的 Imagen 2 模型,这个模型是由 DeepMind 实验室开发的,用于生成及制作高清晰度的图片。

使用这项技术生成艺术品就像其他利用人工智能创作的产品一样简单。您只需输入一个提示,Gemini 就能根据这个提示为您生成独特的 AI 图片,帮您的创意灵感变成现实。

值得一提的是,Gemini 生成的图片上不会附带任何水印。不过,这些图片会被一种名为 SynthID 的数字标签标记,以表明这些图像是由 AI 生成的。目前,图像生成功能仅在少数国家提供,包括美国、澳大利亚和新西兰等地。

想在 Gemini 里进行图片创作,您只需要一个谷歌账号和一点点创意。只需几步简单操作,就能开始创作各种风格的图片,为您撰写的任何文本配上相应的图像。基于 Ultra 模型的 Gemini Advanced 服务,目前提供两个月的免费试用期,您可以参考这篇文章来进行订阅。

小编今天就来讲提供一些如何利用 Gemini 生成图片的小技巧。

1. 使用提示词进行图片生成

使用 Gemini 生成两个人在被一只金毛犬追赶的欢乐场景图片

进入 Gemini 网页版或者 APP 后,就可以立刻开始免费图片创作了。无论是免费版本还是高级版本,都提供图片生成功能。您只需要简单输入你的想法,让 Gemini 帮你把它变成图片。比如,生成一张快乐周末的图片,您可以让它给你展示两个人在球场被一只金毛犬追赶的欢乐场景。

2. 查看 Gemini 生成的图片

金毛犬欢乐球场,两张图片示例。

一旦 Gemini 获取了您的指令,它将快速生成两张或多张图片集。并在页面中展示给您。

Gemini 生成6张火星图片示例

3. 下载生成的单张图片

下载 Gemini 生成的单张图片

如果您对其中某张图片感到满意,点击该图片进行浏览,并可通过点击屏幕右上角的下载图标来保存到本地。

4. 为提示词生成更多的图片

为提示词生成更多的图片

如果您觉得 Gemini 完全理解了你的提示词要求,但你还想从更多图片中进行选择,那么可以点击生成图片下方的“生成更多”选项来生成更多的图片,新生成的图片会在几秒钟内快速合并显示到之前生成的图片区域。这个功能简单快捷,相比 ChatGPT 略胜一筹。

5. 一键下载所有图片

一键下载所有图片

如果您对生成的所有图片都很满意,可以选择批量保存。只需在图片下方点击“分享与导出”,然后在弹出的菜单中选择“下载所有图片”。这里需要注意,如果您想要下载图片的高分辨率版本,就需要按照第3步的操作,一张一张进行下载。

6. 生成不同风格的图片

漫画风格披戴着斗篷飞翔的热狗

就像其他 AI 图像生成器一样,Gemini 也能根据不同的艺术风格来创作图片。想要尝试不同风格,只需在输入给 Gemini 的提示中指明您的偏好。比如,您想要一个漫画风格披戴着斗篷飞翔的热狗吗,直接告诉 Gemini 就行!

7. 对指定图片进行编辑

使用 Gemini 对指定图片进行编辑

如果您希望对 Gemini 生成的某张图片进行一些小改动,只需要在接下来的提示中明确指出想要修改的是哪张图片,并详细描述您的修改需求即可。比如,您可以对上面生成的第一张热狗图片进行修改,为其加上特定文本。

8. 生成指定色调的图片

使用 Gemini 生成黑白色调的汽车图片

您可以要求 Gemini 生成特定色调的图片,直接给出色调描述即可。比如,生成黑白色调的汽车图片。

9. 修改指定的图片色调

修改图片色调

如果您对生成的图片比较满意,只是想修改一下图片的色调,直接要求 Gemini 进行修改即可。比如,您可以为步骤8中生成的汽车添加紫色色调。

10. 图文生成

成图文并茂的旅行博文

Gemini 相比 ChatGPT 最大的特色在于能够直接生成图文并茂的文章,您只需要明确给出要求即可。 比如,您可以按照上图示例,要求 Gemini 为写一篇与狗狗一起畅游纽约的旅行博文。提示词可以这么写:

Please create a blog post about a trip to New York, where a dog and his owner had lots of fun. Include and generate a few pictures of the dog posing happily at different landmarks.

11. 替换生成内容中指定的图片

重新生成内容中指定的图片

您可以随时对步骤10生成内容中的图片进行修改和替换,只需点击对应图片的“替换图片”标签,便可生成更多的图片并选取您满意的图片。

最后,小编认为 Gemini 在图片生成方面的能力可圈可点,特别是对于语意的理解,可以说是相当的准确,生成速度也很快(快于 ChatGPT)。另外,一键生成更多图片的功能以及生成图文并茂长文的能力非常实用。

💡
如您已订阅 Gemini Advanced 服务,切记使用英语与其交流,Gemini Ultra 能力目前尚不支持中文语境。