您现在的位置是:时尚 >>正文
Gemini 2
时尚1人已围观
简介Gemini 2.0说话可以一键P图功能爆炸,玩不了的大家都贪哭!比如一辆小车:输入指令“将车改装成敞篷车”,即可立即将文字指令与图片结合,完成一键P图。让我们找茬,发现除了车变成敞篷车,其他元素都变 ...
Gemini 2.0说话可以一键P图功能爆炸,玩不了的大家都贪哭!
比如一辆小车:

输入指令“将车改装成敞篷车”,即可立即将文字指令与图片结合,完成一键P图。

让我们找茬,发现除了车变成敞篷车,其他元素都变了,很好保持一致性。
不仅于此,Gemini 2.0还有一点“多模态版o1”的味道。
继续输入指令:想象一下,这辆车里装满了海滩用品。然后,将车身的颜色改为一种与夏季相关的颜色,并在变化过程中进行解释。
然后Gemini 2.0开始图文并茂一步一步推理生成先把车变成亮黄色,然后车里装满了遮阳伞等海滩用品

这就是Gemini 原生图像输出能力2.0系列。
在评论区下,一水儿都在寻找具体的上线时间:

OpenAI大将Logan被谷歌挖走 Kilpatrick回应,大家不用担心,明年年初会更广泛的推出。

各种P图都是一句话的事
除了上面显示的简单P图,你甚至可以与此同时,P图片中的多个元素,还能把一个物体变成另一个物体。
例如,把蓬松的夹克变成一个小枕头,把毯子拿出来:

这还没完,P结合不同的图片也行。
猫与枕头的结合,得到了一个非常有质感的猫枕头:

将猫和滑板结合起来,得到猫代言滑板。
遵守文字指令,Gemini 2.0成功地将猫变成了插图贴纸。

除此之外,Gemini 2.0 P图时还能更有想象力。
例如,当一个盒子打开时,它变成了酱阿姨:

开头展示的车也可以变成“飞车”:

另外,还有一种玩法。
在图像中圈出需要P的区域,只需“Open this”,Gemini 2.0可以直接结合文字指令理解图像,知道“this”的指代:

不得不说,那些有内测资格的玩家,可算是大伙儿贪得无厌。

参考链接:https://x.com/OfficialLoganK/status/1868364831948251419
来源:量子位
Tags:
上一篇:春日出街,你一定要看的穿搭指南
下一篇:春夏穿衣自由从背心开始
相关文章
揭开糖尿病“神药”迷局
时尚干细胞杀疯了。国际学术期刊The Lancet11月14日刊出了一个爆炸性的成果:日本大阪大学眼科专家西田幸二团队使用干细胞疗法成功令盲人复明,属全球首例。根据上述论文,有4名视力严重受损的患者,在两 ...
【时尚】
阅读更多减少盲区,高清看护-萤石C7室内云台摄像机双摄 AI 版评测
时尚前言 以前人们对家庭安防的概念不是很强,需求也很小,但是随着越来越多社会事件的发生,大家也开始注重这方面了。只用一个摄像头,发现有死角拍不全,又增加多个,导致家里摆满了摄像头,成本高还影响美观。所以 ...
【时尚】
阅读更多双11存储好物推荐:铠侠优质存储,要的就是性价比!
时尚一年一度的双11活动又来了,不知道小伙伴们最近有没有存储的需求呢?作为自媒体,我每天都需要处理大量的图片以及视频,各种各样的文件体积越来越大, 对于存储的需求日益增长,像是固态硬盘以及U盘都是存储文件 ...
【时尚】
阅读更多
热门文章
最新文章
友情链接
- 拼优势、顺大势,小米汽车的快与慢
- Kimi开源底层推理框架,1小时GitHub揽星1.2k
- 使用大模型自动搜索人工生命
- 雷军进厂打螺丝,越来越马斯克!
- “黑神话:悟空”成功拿下 2024 TGA 的“最佳动作游戏
- 今年内第三次来华!库克:没中国就没现在的苹果!公司第四财季净利润下降超35%
- 美国宇航员瘦到脱相,究竟该怪谁?
- Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
- “球堆积”纪录被打破与几何朗兰兹猜测不同
- UpHonest 欧美IP卡公司Capital被投资“Cro
- 索尼新旗舰发布,售价近五万,这是一台普通人「不需要」的相机
- OpenAI CEO炮轰马斯克是恶霸,2025年ChatGPT最受期待的新功能也来了
- 造车、造火箭、办网站,马斯克是如何“降本”的
- 震惊!不消费了?全民提前进入“铁公鸡”时代?遍地是低价经济的温床…
- 知名“独角兽”正式破产!曾发布全球首款折叠屏手机,估值一度超500亿元!
- 华为只打高端局,和苹果、奔驰硬碰硬
- “球堆积”纪录被打破与几何朗兰兹猜测不同
- 给大型智能体组一桌“大富翁”,他们会选择合作还是互相拆台?