Google vừa chính thức giới thiệu Gemini 2.5 Flash Image, phiên bản mới nhất của công nghệ chỉnh sửa ảnh dựa trên AI. Với khả năng xử lý yêu cầu ngôn ngữ tự nhiên và duy trì sự nhất quán về khuôn mặt cũng như động vật, Gemini 2.5 hứa hẹn mang đến trải nghiệm chỉnh sửa hình ảnh linh hoạt và chính xác hơn. Tuy nhiên, những điểm nổi bật cụ thể của công nghệ này vẫn còn nhiều điều để khám phá.
Những điểm chính
- Google ra mắt Gemini 2.5 Flash Image vào ngày 26/8/2025, nâng cao khả năng chỉnh sửa hình ảnh AI đột phá.
- Gemini 2.5 hỗ trợ chỉnh sửa ảnh chi tiết bằng ngôn ngữ tự nhiên, giữ nguyên tính nhất quán khuôn mặt và động vật.
- Công nghệ mới cho phép pha trộn ảnh liền mạch, tạo hình ảnh chính xác và phong phú hơn với kiến thức thế giới mở rộng.
- Người dùng đánh giá Gemini 2.5 đạt hiệu suất hàng đầu, chất lượng hình ảnh trực quan vượt trội so với các sản phẩm AI khác.
- Google áp dụng biện pháp bảo vệ nghiêm ngặt, bao gồm watermark và metadata, đảm bảo đạo đức và trách nhiệm trong chỉnh sửa ảnh AI.
Google vừa ra mắt phiên bản cải tiến của chatbot Gemini với mô hình AI hình ảnh mới mang tên Gemini 2.5 Flash Image, chính thức triển khai từ ngày 26 tháng 8 năm 2025. Phiên bản này được cung cấp rộng rãi cho người dùng thông qua ứng dụng Gemini, cũng như các nhà phát triển qua Gemini API, Google AI Studio và Vertex AI. Mục tiêu của Google là nâng cao khả năng chỉnh sửa ảnh, tạo ra công cụ cạnh tranh trực tiếp với các sản phẩm của OpenAI, đặc biệt tập trung vào việc kiểm soát và độ chính xác trong quá trình chỉnh sửa hình ảnh.
Gemini 2.5 Flash Image được thiết kế để thực hiện các chỉnh sửa chi tiết dựa trên các yêu cầu ngôn ngữ tự nhiên, giúp giữ nguyên tính nhất quán của các yếu tố như khuôn mặt, động vật và các chi tiết quan trọng khác trong ảnh gốc. Khả năng này vượt trội hơn nhiều so với các đối thủ như ChatGPT hay xAI’s Grok, khi cho phép người dùng thực hiện việc pha trộn ảnh một cách liền mạch mà vẫn giữ được sự giống thật. Công nghệ còn tích hợp kiến thức thế giới mở rộng, cho phép kết hợp nhiều tham chiếu trong cùng một lời nhắc, từ đó đưa ra kết quả hình ảnh chính xác và phong phú hơn.
Gemini 2.5 Flash Image delivers seamless, realistic photo edits with advanced natural language understanding and rich world knowledge integration.
Phản hồi từ người dùng trên nền tảng đánh giá LMArena rất tích cực, với nhiều nhận xét cho rằng Gemini 2.5 Flash Image đạt hiệu suất hàng đầu trong lĩnh vực AI hình ảnh. Trước khi chính thức công bố, mô hình này từng được đánh giá dưới tên gọi “nano-banana”. Google nhấn mạnh việc cải thiện chất lượng hình ảnh trực quan và khả năng tuân thủ hướng dẫn, nhằm phục vụ tốt hơn cho các dự án tiêu dùng đa dạng như mô phỏng trang trí nhà cửa và cảnh quan.
Bên cạnh việc nâng cao trải nghiệm người dùng, Google cũng triển khai các biện pháp bảo vệ nghiêm ngặt nhằm hạn chế việc tạo ra nội dung không phù hợp, cấm các hình ảnh nhạy cảm không được sự đồng thuận, đồng thời áp dụng watermark và metadata để định danh ảnh do AI tạo ra. Qua đó, Google hướng tới cân bằng giữa sự sáng tạo của người dùng và trách nhiệm trong việc duy trì tính chính xác và đạo đức trong công nghệ AI.