谷歌 Gemini原生圖像生成功能又雙叒升級了!
與之前的實驗版本相比(Gemini 2.0 Flash Experimental),這一次主打圖像質量更好、文本渲染更準確,生成速度更快。
只需一句話,就能將兩張圖片中的元素絲滑融合在一起。
p.s. 這個需要在 Google AI Studio 的 Starter Apps 板塊體驗
現在,這些功能都可以在 Google AI Studio 免費試玩,模型請認準"gemini-2.0-flash-preview-image-generation"。
實際上,本次升級距離谷歌首次推出 Gemini 原生圖像生成功能,僅過去一個多月時間。
網友們的感受也都體現在了下面這張梗圖中:
谷歌最近真是火力全開啊!
據谷歌 AI Studio 開發者平臺產品負責人透露, 本次升級主要體現在以下幾個方面:
更好的視覺質量
更準確的文本渲染
顯著降低濾波器阻塞率(延遲和卡頓更低)
更高的速率限制(更快生成圖像或能同時處理更多圖像)
首先,在谷歌提供的 demo 中,我們看到了它能很好地將完全不同的元素自然融合在一起。
盡管 logo 的顏色還有細微偏差,但整體構圖已經很成熟了,處理摳圖以及融合都比較干凈。
同時可以看到,在秒速生圖過程中,它還會在接收用戶指令后給出自己的理解。
新生成的部分看起來也非常合理,從一根藍色肩帶擴展到了背帶褲穿搭。
最終結果如下,人物的比例和姿態都很完美,生成效果著實驚艷。
我們先隨意畫了一個太陽的草圖,要求它為太陽加上笑臉,結果立馬就搞定了。
當然,除了我們的測試,更多網友也第一時間分享了各自的玩法。
比較經典的就是用來搞裝修設計,可以一鍵測試自己想要的裝修風格。
值得一提的是,谷歌最新生圖功能還能搭配 Gemini 2.5 Pro(近期以強悍的代碼能力而出圈)食用。
Transform this image into a code-based representation of its natural behavior. ( 將此圖像轉換為基于代碼的自然行為表示 )
最終就能得到一段視頻演示。
在線體驗:
https://aistudio.google.com/
參考鏈接:
[ 1 ] https://x.com/OfficialLoganK/status/1920151503349711061
[ 2 ] https://developers.googleblog.com/en/generate-images-gemini-2-0-flash-preview/
[ 3 ] https://x.com/Google/status/1920233829219840487
[ 4 ] https://x.com/Temjinck/status/1920234959346020664
— 完 —
量子位 AI 主題策劃正在征集中!歡迎參與專題365 行 AI 落地方案,一千零一個 AI 應用,或與我們分享你在尋找的 AI 產品,或發現的AI 新動向。
也歡迎你加入量子位每日 AI 交流群,一起來暢聊 AI 吧~
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!