Chỉ vài tháng trước, Google đã ra mắt Nano Banana – mô hình hình ảnh thuộc thế hệ Gemini 2.5 Flash. Từ khả năng phục chế ảnh cũ đến tạo hình nhân vật tí hon, Nano Banana đã đánh dấu một bước tiến lớn trong lĩnh vực chỉnh sửa ảnh, trao quyền sáng tạo cho cả những người dùng không chuyên.
Hôm nay, Google chính thức công bố Nano Banana Pro (Gemini 3 Pro Image), mô hình tạo và chỉnh sửa ảnh tiên tiến nhất hiện nay. Thừa hưởng sức mạnh từ Gemini 3 Pro, Nano Banana Pro tận dụng khả năng suy luận vượt trội và vốn kiến thức thực tế sâu rộng để trực quan hóa thông tin một cách đột phá chưa từng có.
Nano Banana Pro hiện thực hóa ý tưởng thiết kế như thế nào?
Nano Banana Pro giúp người dùng biến mọi ý tưởng thành hình ảnh trực quan – từ các bản nguyên mẫu (prototype), đồ họa thông tin (infographic) trình bày dữ liệu, cho đến việc chuyển đổi ghi chú tay thành sơ đồ chuyên nghiệp. Những khả năng mới của Nano Banana Pro:
Tạo Infographic chính xác, giàu thông tin nhờ khả năng suy luận và dữ liệu thời gian thực
Nhờ khả năng suy luận nâng cao của Gemini 3, Nano Banana Pro không dừng lại ở việc tạo ra những bức ảnh đẹp mắt, mà còn tạo ra nội dung thực sự hữu ích. Người dùng có thể tạo ra các tài liệu giáo dục chính xác để tìm hiểu chủ đề mới, ví dụ như các infographic hay sơ đồ chi tiết dựa trên dữ liệu đầu vào hoặc các sự kiện thực tế.
Đặc biệt, Nano Banana Pro có khả năng kết nối với kho tri thức khổng lồ của Google Search. Điều này cho phép tạo nhanh hình ảnh minh họa cho công thức nấu ăn hoặc trực quan hóa các thông tin thời gian thực như dự báo thời tiết hay tỷ số thể thao.

Prompt mẫu: “Infographic of the common house plant, String of Turtles, with information on origins, care essentials and growth patterns” – “Tạo infographic về loài cây String of Turtles, bao gồm thông tin nguồn gốc, cách chăm sóc cơ bản và đặc điểm sinh trưởng.” (Ảnh trên)
Prompt mẫu: “Create an infographic that shows how to make elaichi chai” – “Tạo một infographic hướng dẫn các bước pha trà elaichi chai.” (Ảnh dưới)

Hiển thị văn bản đa ngôn ngữ sắc nét ngay trên ảnh
Nano Banana Pro hiện là mô hình tối ưu nhất để xử lý văn bản trong ảnh, đảm bảo độ chính xác và tính dễ đọc, bất kể là slogan ngắn hay một đoạn văn dài. Khả năng thấu hiểu chiều sâu và ngữ cảnh của Gemini 3 mở ra chân trời mới cho việc chỉnh sửa ảnh có chứa chữ viết.
Giờ đây, người dùng có thể thiết kế các bản mockup hay poster với văn bản chi tiết, phong phú về kết cấu (texture), phông chữ và phong cách thư pháp. Với tư duy đa ngôn ngữ, Gemini hỗ trợ tạo văn bản bằng nhiều thứ tiếng, giúp bản địa hóa và dịch thuật nội dung dễ dàng để tiếp cận khán giả quốc tế hoặc chia sẻ với người thân.
Prompt mẫu (Kiến trúc chữ cái): “View of a cozy street in Berlin on a bright sunny day, stark shadows. the old houses are oddly shaped like letters that spell out “BERLIN” Colored in Blue, Red, White and black. The houses still look like houses and the resemblance to letters is subtle”. – “Một con phố ấm cúng ở Berlin trong nắng sớm, bóng đổ rõ nét. Những ngôi nhà cổ có hình dáng khéo léo tạo thành chữ “BERLIN” với các tông màu Xanh, Đỏ, Trắng và Đen. Kiến trúc vẫn giữ nét tự nhiên của nhà ở, sự cách điệu chữ cái rất tinh tế.

Một số prompt mẫu khác mà các bán có thể thử:
- “Make 8 minimalistic logos, each is an expressive word, and make letters convey a message or sound visually to express the meaning of this word in a dramatic way. composition: flat vector rendering of all logos in black on a single white background” – “Tạo 8 logo tối giản dạng vector phẳng màu đen trên nền trắng. Mỗi logo là một từ biểu cảm, các chữ cái được cách điệu để truyền tải âm thanh hoặc ý nghĩa của từ đó một cách ấn tượng.”
- “Translate all the English text on the three yellow and blue cans into Korean, while keeping everything else the same” – “Dịch toàn bộ tiếng Anh trên ba lon nước màu vàng-xanh sang tiếng Hàn, giữ nguyên mọi chi tiết khác của ảnh.”
- “A vibrant, eye-catching “TYPOGRAPHY” design on a textured off-white background. The letters are bold, blocky, extra condensed and create a 3D effect with overlapping layers of bright blue and hot pink, each with a halftone dot pattern, evoking a retro print aesthetic. 16:9 aspect ratio” – “Thiết kế chữ “TYPOGRAPHY” rực rỡ trên nền trắng ngà có vân. Chữ in đậm, khối hộp, xếp chồng lớp tạo hiệu ứng 3D với màu xanh sáng và hồng neon, sử dụng họa tiết chấm halftone mang phong cách in ấn retro. Tỷ lệ 16:9.”
- “Create an image showing the phrase “How much wood would a woodchuck chuck if a woodchuck could chuck wood” made out of wood chucked by a woodchuck.” – “Tạo hình ảnh thể hiện câu nói lẹo lưỡi về con chồn (woodchuck), với dòng chữ được xếp từ chính những khúc gỗ do con chồn ném ra.”
Nâng tầm sáng tạo với chất lượng hình ảnh trung thực
Thiết kế nhất quán (Consistency): Nano Banana Pro cho phép kết hợp phức tạp tới 14 hình ảnh đầu vào mà vẫn duy trì tính nhất quán về đặc điểm nhận dạng của tối đa 5 nhân vật. Dù là chuyển phác thảo thành sản phẩm thật hay biến bản vẽ kỹ thuật thành công trình 3D, khoảng cách giữa ý tưởng và hiện thực đã được xóa bỏ. Việc áp dụng phong cách hình ảnh (look and feel) cho các bản mockup trở nên mượt mà, đảm bảo nhận diện thương hiệu đồng nhất trên mọi điểm chạm.
Prompt mẫu (Nhân vật hoạt hình): “A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor… The overall atmosphere is warm, cozy, and amused.”
(Dịch: Cảnh trung cận 14 nhân vật lông xù ngồi chen chúc trên ghế sofa cũ và dưới sàn xem TV cổ điển… Bầu không khí ấm cúng, vui vẻ trong căn phòng khách hơi bừa bộn nhưng thân thuộc.)
Prompt mẫu (Ghép ảnh thời trang): “Combine these images into one appropriately arranged cinematic image in 16:9 format and change the dress on the mannequin to the dress in the image”
(Dịch: Ghép các ảnh này thành một khung hình điện ảnh tỷ lệ 16:9, thay chiếc váy trên ma-nơ-canh bằng chiếc váy trong ảnh mẫu.)
Prompt mẫu (Ghép ảnh phong cảnh): “Combine these images into one appropriately arranged cinematic image in 16:9 format”
(Dịch: Kết hợp các yếu tố này thành một bức ảnh điện ảnh hoàn chỉnh tỷ lệ 16:9.)
Prompt mẫu (Editorial Fashion): “Put these five people and this dog into a single image, they should fit into a stunning award-winning shot in the style if a fashion editorial… Make the colour and lighting look natural on them all…”
(Dịch: Đặt 5 người và chú chó này vào một bức ảnh thời trang cao cấp (editorial). Giữ nguyên danh tính và trang phục nhưng thay đổi góc độ sao cho tự nhiên nhất. Ánh sáng và màu sắc cần hài hòa như thể họ đang thực sự ở trong buổi chụp hình đó.)
Quyền kiểm soát chuẩn Studio: Google trao quyền kiểm soát tối đa cho người dùng. Bạn có thể khoanh vùng, tinh chỉnh bất kỳ chi tiết nào với công cụ chỉnh sửa cục bộ (localized editing) cải tiến. Từ việc thay đổi góc máy, tiêu cự, chỉnh màu (color grading) đến biến đổi ánh sáng môi trường (như chuyển ngày thành đêm, tạo hiệu ứng bokeh xóa phông). Các tác phẩm xuất ra hỗ trợ độ phân giải 2K, 4K cùng nhiều tỷ lệ khung hình, sẵn sàng cho mọi nền tảng từ mạng xã hội đến in ấn.
Prompt mẫu (Chỉnh tỷ lệ): “change aspect ratio to 1:1 by reducing background. The character, remains exactly locked in its current position”
(Dịch: Chuyển tỷ lệ ảnh sang 1:1 bằng cách thu gọn nền, giữ nguyên vị trí nhân vật.)
Prompt mẫu (Chuyển đổi thời gian): “Turn this scene into nighttime”
(Dịch: Biến khung cảnh này thành ban đêm.)
Prompt mẫu (Ánh sáng Chiaroscuro): “Generate an image with an intense chiaroscuro effect. The man should retain his original features and expression… Only slivers of light illuminating his eyes and cheekbones…”
(Dịch: Tạo hiệu ứng tương phản sáng tối (chiaroscuro) mạnh. Giữ nguyên nét mặt người đàn ông nhưng thêm ánh sáng gắt từ trên cao chếch trái, tạo bóng đổ sâu, chỉ để lộ đôi mắt và gò má trong ánh sáng.)
Prompt mẫu (Lấy nét): “Focus on the flowers”
(Dịch: Lấy nét vào những bông hoa, làm mờ hậu cảnh.)
Trải nghiệm Nano Banana Pro ngay hôm nay
Google mang đến hai lựa chọn linh hoạt trên hệ sinh thái của mình: Nano Banana cho các tác vụ nhanh, giải trí và Nano Banana Pro cho các yêu cầu chuyên sâu, đòi hỏi độ chính xác cao.
- Người dùng cá nhân & Học sinh/Sinh viên: Đã bắt đầu triển khai toàn cầu trên ứng dụng Gemini (chọn mục ‘Create images’ với mô hình ‘Thinking’). Người dùng miễn phí có hạn mức sử dụng giới hạn trước khi chuyển về bản thường. Người dùng gói Google AI Plus, Pro và Ultra sẽ có hạn mức cao hơn.
- Lưu ý: Chế độ AI trong Tìm kiếm (Search) hiện khả dụng tại Mỹ cho gói Pro và Ultra. NotebookLM hỗ trợ Nano Banana Pro cho người đăng ký trên toàn cầu.
- Chuyên gia: Tính năng tạo ảnh trong Google Ads được nâng cấp lên Nano Banana Pro, giúp các nhà quảng cáo toàn cầu tự do sáng tạo. Khách hàng Workspace sử dụng Google Slides và Vids cũng được cập nhật từ hôm nay.
- Lập trình viên & Doanh nghiệp: Đang triển khai trên Gemini API, Google AI Studio và Google Antigravity (hỗ trợ thiết kế UX). Doanh nghiệp có thể xây dựng ứng dụng quy mô lớn trên Vertex AI ngay hôm nay.
- Nhà sáng tạo nội dung: Triển khai cho gói Google AI Ultra trong Flow – công cụ làm phim AI, mang lại quyền kiểm soát khung hình chính xác tuyệt đối cho các nhà làm phim và marketer.
Minh bạch hóa hình ảnh AI trong ứng dụng Gemini
Google cam kết minh bạch trong việc phân biệt hình ảnh do AI tạo ra. Mọi sản phẩm từ công cụ của Google đều được nhúng SynthID – dấu vân tay kỹ thuật số (watermark) vô hình.
Từ hôm nay, người dùng có thể tải ảnh lên ứng dụng Gemini và hỏi trực tiếp xem ảnh đó có phải do Google AI tạo ra hay không nhờ công nghệ SynthID (hiện hỗ trợ prompt tiếng Anh, sắp mở rộng thêm ngôn ngữ và định dạng video/âm thanh).
Ngoài ra, hình ảnh từ tài khoản miễn phí và gói Pro sẽ vẫn có dấu hiệu nhận biết trực quan (biểu tượng lấp lánh Gemini). Để phục vụ nhu cầu chuyên nghiệp, Google sẽ loại bỏ dấu hiệu này đối với ảnh tạo bởi người dùng gói Ultra và trong Google AI Studio.