Nano Banana圖像生成新突破!告別「AI修圖會變臉」的惡夢

【104職場力】

08/29 16:54

Nano Banana圖像生成新突破!告別「AI修圖會變臉」的惡夢

Nano Banana帶來AI圖像生成的重大變革!不僅大幅提升生成速度、輕鬆修改圖片細節,更解決了「修圖會變臉」的痛點!想知道這項技術有多厲害?小編實測並分享心得給你看!

文/《104職場力

本文導覽

Nano BananaGemini 2.5 Flash Image)打造專屬視覺助理

Google近日發布了最新的AI模型更新,推出了「Nano Banana(Gemini 2.5 Flash Image)」讓大家免費試用,這款號稱擁有強大圖像編修能力的模型,著重於改善過去AI「圖片生成品質不佳、創作靈活度不足」等痛點,試圖讓使用者能用更快速、精準、便利的方式完成自己的視覺設計。

Nano Banana的特點

Gemini這次的更新亮點可簡單分成以下4點:

1.圖像生成不延遲、速度快

Nano Banana改善了AI生成圖片會「延遲」的缺點,不用再花數分鐘的漫長等待就能立即看到成品,這項技術的突破,讓使用者能快速把腦海中的想法視覺化,大幅提升創作效率和流暢度。

2.支援自然語言,可用簡單指令生成/編修圖像

相較於過去需要嚴謹複雜的指令,支援「口語化的自然語言」的Nano Banana簡化了過程,大幅降低使用門檻,創作者即便只給出「把這張照片背景變成星空」這類精簡的需求,Nano Banana也能理解並執行,這種直覺式的互動模式,讓沒有專業繪圖背景的人也能輕鬆上手

3.編修圖像人物或背景,仍可維持角色一致性

之前AI圖像生成最讓人頭痛的點是「只是修改一處小細節,重新生成後主體或背景就會長得不一樣,以至於無法連貫」,但模型更新後,Nano Banana能夠保持該人物主體的樣貌不變,不僅可以「在不同場景中展示同樣的人物或產品」,還能做到「改變主體動作、角度、更換衣服」等更細緻地變動,不僅對需要創作多張系列圖片的使用者來說夠友善,對於行銷、商業廣告圖的製作,也能大幅提升效率

4.可將多張圖片的人物或元素融合進同一張

終於擺脫一張張手動去背的繁瑣過程,現在只要提供單張或多張圖片給Nano Banana,明確告知要擷取哪部分的人物或元素融入新圖片中,AI模型就能理解並立即生成融合後的成品,這讓「拼貼」創作變得自然、流暢且更有彈性

如何開始使用Nano Banana

因為Google目前開放用戶免費試用,只需登入Gemini,點選「圖片」並按下跳出視窗的「立即試用」即可。
如果已在頁面中或無彈出視窗,只要點擊左上角模型選單,選取「2.5 Flash」即可開始使用。

了解使用路徑後,以下就讓小編帶大家進行實測,看這款最新AI圖像生成模型的應用效果如何吧!


【實測】Nano Banana的功能與使用效果

這段主要分享幾個人物圖像的編修,包含:更換衣服、動作、背景、色調,以及加入新元素等,只要在AI對話框中上傳照片及輸入指令,等待幾秒後就能得到成品。

快跟著小編的實測圖,一同感受Nano Banana的強大功能吧!

實測1. 幫人物更換及搭配衣服

成果顯示:無論是換衣服或改變穿搭,都能自然呈現並維持人物的原貌。

實測2. 更改人物的動作

成果顯示:動作不僅自然更換,連外套都有跟著姿勢自然微調。

實測3. 更換人物照的背景圖

成果顯示:雖然融合後人物依舊保持完整,但並沒有處理好色調跟飽和度,因此看起來有點突兀。

實測4. 統一人物及背景的色調、亮度及顏色飽和度

成果顯示:調整後效果有自然一點,不過要融合得更好,可以請AI統一這兩張圖片的光源角度與陰影會更佳。

實測5. 加入新元素進圖像中

成果顯示:加入新的元素也可以完美融合,同樣不影響人物的呈現效果。


Nano Banana使用心得

整體而言,Nano Banana大多數的優點都符合Google的官方陳述,特別是人物的統一性令人印象深刻!不過在實際體驗過程中,還是有一些值得分享的小誤差與改進方法,希望統整出來後能先幫使用者打個預防針,後續操作時能少走一點冤枉路。

圖片尺寸的不穩定性

雖然人物主體維持得很好,但每一次生成出的圖片尺寸都不太相同,導致小編在製作前後對照圖時必須手動調整。

如果要解決這個問題,建議大家可以事先在指令中明確給出所需的圖片大小,例如:「請統一生成尺寸為16:9的圖」,這樣能大幅提高圖片尺寸的穩定性。

生成速度隨著使用量變慢

一開始確實如官方所說的「生成速度相當快」,但隨著往下延伸超過3次對話後,會明顯感受到圖片生成的時間拉長,這其實還是AI模型難以避免的問題。

如果遇到這種情況,建議重新開啟一個新的對話框,就能立即恢復其應有的高速生成能力。

語意理解仍有出錯可能

雖然Nano Banana對自然語言的理解能力已經算很強了,但偶爾還是會出現理解偏差,例如:小編一開始請AI處理「讓女孩提著公事包」,生成結果是包包直接擋在女孩手前面,後來微調成「讓女孩手提這款公事包」後才成功生成出想要的結果。

因此,倘若初次生成狀況跟預期不符,可以按下「重整鍵」或微調指令後重新生成,通常不出3次都能獲得滿意的成果。

以上是小編以一般使用者的操作模式,針對這次Gemini模型更新的實測分享,非常推薦對AI圖像生成有興趣的大家去體驗看看,感受一下這項技術帶來的便利與樂趣,也許還能得到靈感,幫自己提升工作效率。

(參考資料來源:Introducing Gemini 2.5 Flash Image, our state-of-the-art image model;圖片來源:Unsplash)


延伸閱讀:

0 0 168 0