SV24h – OpenAI vừa phát hành bản cập nhật GPT Image 1.5, mang lại khả năng tuân thủ hướng dẫn tốt hơn, chỉnh sửa hình ảnh chính xác hơn và tốc độ tạo ảnh nhanh gấp bốn lần so với phiên bản trước.
Theo OpenAI, GPT Image 1.5 bắt đầu được triển khai cho toàn bộ người dùng ChatGPT cũng như thông qua API ngay trong tuần này. Tương tự công cụ Nano Banana Pro của Google, phiên bản mới cho phép kiểm soát hậu kỳ chi tiết hơn, giúp duy trì tính nhất quán về khuôn mặt, ánh sáng, bố cục và tông màu trong suốt quá trình chỉnh sửa.
Đây đươc xem là bước tiến đáng kể trong lĩnh vực AI tạo ảnh, vốn lâu nay gặp hạn chế về khả năng lặp lại. Trước đó, khi người dùng yêu cầu chỉnh sửa một chi tiết nhỏ như biểu cảm khuôn mặt hay nhiệt độ ánh sáng, nhiều mô hình AI thường “vẽ lại” toàn bộ hình ảnh, dẫn đến sai lệch và thiếu đồng nhất. GPT Image 1.5 được thiết kế để khắc phục điểm yếu này.

ChatGPT Image 1.5 có thể chỉnh sửa từng thành phần trong hình ảnh mà không làm thay đổi các yếu tố còn lại
Bên cạnh cải tiến về công nghệ, OpenAI cũng bổ sung một mục riêng cho tính năng tạo ảnh trên thanh công cụ của ChatGPT, giúp người dùng truy cập và thao tác thuận tiện hơn. Theo bà Fidji Simo, Giám đốc điều hành mảng ứng dụng tại OpenAI, ChatGPT đang dần trở thành một “studio sáng tạo”. “Giao diện xem và chỉnh sửa ảnh mới cho phép người dùng dễ dàng tạo ra hình ảnh đúng với ý tưởng ban đầu, hoặc lấy cảm hứng từ các prompt thịnh hành và bộ lọc có sẵn”, bà cho biết.
Không dừng lại ở đó, OpenAI còn đặt mục tiêu nâng cao trải nghiệm trực quan tổng thể của ChatGPT. Trong thời gian tới, nền tảng này sẽ hiển thị nhiều hình ảnh kèm nguồn rõ ràng hơn trong các truy vấn tìm kiếm, đặc biệt hữu ích cho những tác vụ như chuyển đổi đơn vị đo lường hay theo dõi tỷ số thể thao. “Khi sáng tạo, người dùng cần được nhìn thấy và định hình những gì mình đang làm. Nếu hình ảnh truyền tải câu chuyện tốt hơn ngôn từ, ChatGPT nên đưa chúng vào”, bà Simo nhấn mạnh.

Hình ảnh tạo bằng GPT Image 1.5. Ảnh: OpenAI
GPT Image 1.5 là động thái mới nhất của OpenAI sau khi ra mắt mô hình GPT-5.2, trong bối cảnh cạnh tranh ngày càng gay gắt với Google. Trước đó một tháng, CEO OpenAI Sam Altman được cho là đã kích hoạt trạng thái “báo động đỏ”, nhằm củng cố vị thế dẫn đầu của công ty trong lĩnh vực AI, sau khi Google công bố Gemini 3 và trình tạo ảnh Nano Banana Pro – những sản phẩm đang đứng đầu nhiều hạng mục đánh giá trên bảng xếp hạng LMArena.
Hà Vy
