08/29 16:54
Nano Banana圖像生成新突破!告別「AI修圖會變臉」的惡夢
Nano Banana帶來AI圖像生成的重大變革!不僅大幅提升生成速度、輕鬆修改圖片細節,更解決了「修圖會變臉」的痛點!想知道這項技術有多厲害?小編實測並分享心得給你看!
文/《104職場力》
本文導覽
Google近日發布了最新的AI模型更新,推出了「Nano Banana(Gemini 2.5 Flash Image)」讓大家免費試用,這款號稱擁有強大圖像編修能力的模型,著重於改善過去AI「圖片生成品質不佳、創作靈活度不足」等痛點,試圖讓使用者能用更快速、精準、便利的方式完成自己的視覺設計。
Gemini這次的更新亮點可簡單分成以下4點:
Nano Banana改善了AI生成圖片會「延遲」的缺點,不用再花數分鐘的漫長等待就能立即看到成品,這項技術的突破,讓使用者能快速把腦海中的想法視覺化,大幅提升創作效率和流暢度。
相較於過去需要嚴謹複雜的指令,支援「口語化的自然語言」的Nano Banana簡化了過程,大幅降低使用門檻,創作者即便只給出「把這張照片背景變成星空」這類精簡的需求,Nano Banana也能理解並執行,這種直覺式的互動模式,讓沒有專業繪圖背景的人也能輕鬆上手。
之前AI圖像生成最讓人頭痛的點是「只是修改一處小細節,重新生成後主體或背景就會長得不一樣,以至於無法連貫」,但模型更新後,Nano Banana能夠保持該人物主體的樣貌不變,不僅可以「在不同場景中展示同樣的人物或產品」,還能做到「改變主體動作、角度、更換衣服」等更細緻地變動,不僅對需要創作多張系列圖片的使用者來說夠友善,對於行銷、商業廣告圖的製作,也能大幅提升效率。
終於擺脫一張張手動去背的繁瑣過程,現在只要提供單張或多張圖片給Nano Banana,明確告知要擷取哪部分的人物或元素融入新圖片中,AI模型就能理解並立即生成融合後的成品,這讓「拼貼」創作變得自然、流暢且更有彈性。
因為Google目前開放用戶免費試用,只需登入Gemini,點選「圖片」並按下跳出視窗的「立即試用」即可。
如果已在頁面中或無彈出視窗,只要點擊左上角模型選單,選取「2.5 Flash」即可開始使用。
了解使用路徑後,以下就讓小編帶大家進行實測,看這款最新AI圖像生成模型的應用效果如何吧!
這段主要分享幾個人物圖像的編修,包含:更換衣服、動作、背景、色調,以及加入新元素等,只要在AI對話框中上傳照片及輸入指令,等待幾秒後就能得到成品。
快跟著小編的實測圖,一同感受Nano Banana的強大功能吧!
成果顯示:無論是換衣服或改變穿搭,都能自然呈現並維持人物的原貌。
成果顯示:動作不僅自然更換,連外套都有跟著姿勢自然微調。
成果顯示:雖然融合後人物依舊保持完整,但並沒有處理好色調跟飽和度,因此看起來有點突兀。
成果顯示:調整後效果有自然一點,不過要融合得更好,可以請AI統一這兩張圖片的光源角度與陰影會更佳。
成果顯示:加入新的元素也可以完美融合,同樣不影響人物的呈現效果。
整體而言,Nano Banana大多數的優點都符合Google的官方陳述,特別是人物的統一性令人印象深刻!不過在實際體驗過程中,還是有一些值得分享的小誤差與改進方法,希望統整出來後能先幫使用者打個預防針,後續操作時能少走一點冤枉路。
雖然人物主體維持得很好,但每一次生成出的圖片尺寸都不太相同,導致小編在製作前後對照圖時必須手動調整。
如果要解決這個問題,建議大家可以事先在指令中明確給出所需的圖片大小,例如:「請統一生成尺寸為16:9的圖」,這樣能大幅提高圖片尺寸的穩定性。
一開始確實如官方所說的「生成速度相當快」,但隨著往下延伸超過3次對話後,會明顯感受到圖片生成的時間拉長,這其實還是AI模型難以避免的問題。
如果遇到這種情況,建議重新開啟一個新的對話框,就能立即恢復其應有的高速生成能力。
雖然Nano Banana對自然語言的理解能力已經算很強了,但偶爾還是會出現理解偏差,例如:小編一開始請AI處理「讓女孩提著公事包」,生成結果是包包直接擋在女孩手前面,後來微調成「讓女孩手提這款公事包」後才成功生成出想要的結果。
因此,倘若初次生成狀況跟預期不符,可以按下「重整鍵」或微調指令後重新生成,通常不出3次都能獲得滿意的成果。
以上是小編以一般使用者的操作模式,針對這次Gemini模型更新的實測分享,非常推薦對AI圖像生成有興趣的大家去體驗看看,感受一下這項技術帶來的便利與樂趣,也許還能得到靈感,幫自己提升工作效率。
(參考資料來源:Introducing Gemini 2.5 Flash Image, our state-of-the-art image model;圖片來源:Unsplash)
延伸閱讀: