ChatGPT Ra Mắt Tính Năng Tạo Ảnh Chân Thực

27/03/2025

Trong thời đại công nghệ số hiện nay, việc tạo ra hình ảnh chân thực từ trí tuệ nhân tạo đang trở thành một xu hướng nổi bật. Mới đây, OpenAI đã công bố tính năng mới mang tên Images in ChatGPT, cho phép người dùng tạo ra những bức ảnh sống động ngay trong chatbot, nhờ vào sức mạnh của mô hình GPT-4o.

Vào ngày 26/3, OpenAI đã thông báo rằng phiên bản đầu tiên của tính năng Images in ChatGPT chủ yếu tập trung vào khả năng tạo hình ảnh. Người dùng có thể trải nghiệm tính năng này thông qua các gói đăng ký Plus, Pro, Team hoặc thậm chí là phiên bản miễn phí. Trước đây, ChatGPT đã cho phép tạo ảnh nhưng chỉ thông qua mô hình Dall-E với nhiều hạn chế, như chỉ cho phép tạo ba bức ảnh miễn phí mỗi ngày.

Nhiều người dùng trên mạng xã hội đã nhanh chóng thử nghiệm và bày tỏ sự ngạc nhiên trước công cụ mới này. Một người dùng tên Hoàng Vy chia sẻ: “Hình ảnh chân thực đến mức tôi không thể tin rằng đó là sản phẩm của AI. Nếu không có ghi chú, tôi có thể đã nhầm lẫn với ảnh thật.” Trong khi đó, tài khoản Công Tâm cảnh báo rằng: “Sắp tới, những hình ảnh bạn thấy trên mạng có thể không phải là thật.” Một số người khác cũng cho rằng các nhà thiết kế đồ họa sẽ cần phải nâng cấp kỹ năng của mình để thích ứng với sự phát triển của AI.

Bức ảnh Newton cầm lăng kính ở Công viên Quảng trường Washington do ChatGPT tạo.

Hình ảnh “Nhà khoa học Isaac Newton cầm lăng kính ở Công viên Quảng trường Washington” là một ví dụ điển hình cho khả năng tạo ảnh của ChatGPT. Theo thông tin từ OpenAI, mặc dù phiên bản miễn phí có một số giới hạn, nhưng vẫn vượt trội hơn so với Dall-E.

Người phát ngôn của OpenAI, Taya Christianson, cho biết rằng tính năng mới này đã có những bước tiến đáng kể so với các mô hình trước đó. Trưởng nhóm nghiên cứu Gabriel Goh cũng nhấn mạnh rằng đội ngũ của ông đã áp dụng nền tảng đa phương thức GPT-4o, một trong những mô hình ngôn ngữ tiên tiến nhất của OpenAI, để phát triển khả năng tạo ảnh cho ChatGPT.

Goh cũng giới thiệu một cải tiến quan trọng trong khả năng tạo ảnh của ChatGPT, được gọi là “Binding”. Đây là thuật ngữ chỉ mức độ mà AI có thể duy trì mối liên kết chính xác giữa các thuộc tính và đối tượng. Ví dụ, nếu yêu cầu tạo một ngôi sao màu xanh và một hình tam giác màu đỏ, một mô hình kém sẽ chỉ tạo ra ngôi sao màu đỏ mà không có hình tam giác. Goh cho biết hầu hết các mô hình hình ảnh hiện tại đều gặp khó khăn trong việc này.

“Công cụ tạo hình ảnh mới với Binding có thể liên kết chính xác các thuộc tính cho từ 15 đến 20 đối tượng mà không gây nhầm lẫn, cho thấy sự cải thiện đáng kể về độ chính xác và độ tin cậy,” Goh cho biết thêm.

Trình tạo ảnh trên ChatGPT cũng đã được cải thiện về khả năng hiển thị văn bản trong hình ảnh, giúp tạo ra văn bản rõ ràng hơn mà không bị méo mó. Goh nhấn mạnh rằng đây là một thách thức lớn, vì nếu các thành phần văn bản có lỗi, toàn bộ hình ảnh sẽ không thể sử dụng được.

Hơn nữa, công cụ mới sử dụng phương pháp hồi quy tự động, tức là tạo ảnh tuần tự từ trái sang phải và từ trên xuống dưới, tương tự như cách viết văn bản. Khác biệt này giúp Images in ChatGPT có khả năng kết xuất và liên kết văn bản trong ảnh tốt hơn.

“Quá trình phát triển tính năng này đã trải qua nhiều tháng lặp đi lặp lại để hoàn thiện,” Goh nhấn mạnh. Ông cũng cho biết rằng mặc dù chưa hoàn hảo, khả năng tạo ảnh trên ChatGPT đã đạt đến mức mà chất lượng sản phẩm có thể sử dụng ngay lập tức.

Trong buổi trình diễn tính năng mới, OpenAI đã giới thiệu một số ví dụ cho thấy khả năng tạo ảnh của ChatGPT rất mượt mà, như sơ đồ khoa học thí nghiệm lăng kính Newton với các thành phần được dán nhãn chính xác, truyện tranh nhiều khung với các nhân vật và bong bóng lời thoại nhất quán, hay hình nền trong suốt cho nhãn dán, logo và thực đơn nhà hàng.

Ảnh sơ đồ thí nghiệm lăng kính Newton do ChatGPT tạo.

Ảnh sơ đồ thí nghiệm lăng kính Newton là một trong những sản phẩm nổi bật do ChatGPT tạo ra. Tuy nhiên, so với các mô hình khác, Images in ChatGPT vẫn mất nhiều thời gian hơn để tạo ảnh. Jackie Shannon, người phụ trách sản phẩm đa phương thức của ChatGPT, cho biết đây là “sự đánh đổi xứng đáng”.

“Chúng tôi chắc chắn sẽ cải thiện độ trễ, nhưng khả năng hiện tại về tạo ảnh và chất lượng hình ảnh thực sự có thể bù đắp cho thời gian chờ đợi,” Shannon chia sẻ trên blog.

Về vấn đề tạo ảnh giả mạo, Shannon cho biết Images in ChatGPT có các tính năng bảo vệ mạnh mẽ, ngăn chặn nội dung khiêu dâm và từ chối các yêu cầu lừa đảo, mặc dù không đi vào chi tiết. Hình ảnh được tạo ra cũng tích hợp siêu dữ liệu chuẩn C2PA để đánh dấu là do AI tạo ra, có thể được kiểm tra bằng các công cụ phát hiện.

“Tất nhiên, không có hệ thống nào hoàn hảo, nhưng chúng tôi luôn nỗ lực cải thiện các biện pháp bảo vệ của mình,” Shannon nhấn mạnh.

Bài viết này đã cung cấp cái nhìn tổng quan về tính năng mới của ChatGPT trong việc tạo ảnh chân thực, mở ra nhiều cơ hội và thách thức cho người dùng trong tương lai.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *