Mô hình tạo ảnh AI tốt hơn ChatGPT
Ra mắt một tuần sau Images in ChatGPT, mô hình mới của MidJourney được nâng cấp về chất lượng hình ảnh và nhiều tính ứng dụng.

V7, mô hình của MidJourney, được cho là có khả năng tạo ra những chi tiết như bàn tay một cách nhất quán hơn. Ảnh: Xeophon.
Midjourney, một trong những công cụ tạo ảnh bằng AI đầu tiên trên web, vừa ra mắt mô hình mới đầu tiên sau gần một năm.
Mô hình có tên là V7, được phát hành ở giai đoạn thử nghiệm vào nửa đêm 4/4 (theo giờ Mỹ). Trước đó một tuần, OpenAI cũng ra mắt tính năng tương tự với ChatGPT và nhanh chóng gây sốt mạng xã hội mới trào lưu tạo ảnh theo phong cách Ghibli.
Nếu chưa từng sử dụng Midjourney, đầu tiên bạn sẽ cần đánh giá 200 hình ảnh mà công cụ gợi ý, theo sở thích của bạn. Sau đó, công cụ sẽ tạo ra một hồ sơ cá nhân hóa, nhằm tạo ảnh phù hợp với thẩm mỹ người dùng. V7 là mô hình đầu tiên của Midjourney được bật tính năng cá nhân hóa mặc định.
Bạn có thể bật hoặc tắt V7 bằng cách ấn vào thanh công cụ “version” trên trang web. Ngoài ra, mô hình này có thể được sử dụng trong máy chủ Discord của Midjourney.
CEO của Midjourney, David Holz, mô tả V7 là một “kiến trúc hoàn toàn khác biệt” trong một bài đăng trên X. “V7 thông minh hơn rất nhiều khi xử lý các câu lệnh bằng văn bản”, Holz tiếp tục thông báo trên Discord.
Anh nhận xét rằng mô hình cũng có khả năng xử lý từ ảnh gốc khá tốt. Chất lượng ảnh được cải thiện rõ rệt với độ hoàn thiện cao. Từ các bộ phận cơ thể như tay, chân, đến tàn nhang, họa tiết gốm sứ đều có sự nhất quán đến từng chi tiết.

Một số ảnh mẫu được tạo từ mô hình V7. Ảnh: X/MidJourney.
Ngoài hai chế độ: Turbo (tốn chi phí hơn) và Relax, V7 hỗ trợ một công cụ mới có tên là Draft Mode, cho phép tạo ảnh với tốc độ nhanh gấp 10 lần và chi phí chỉ bằng một nửa so với chế độ tiêu chuẩn. Ảnh ở chế độ Draft sẽ có chất lượng thấp hơn, nhưng người dùng có thể nâng cấp và tái tạo lại ảnh chỉ với một cú nhấp chuột.
Theo Holz, hiện tại một số tính năng tiêu chuẩn của Midjourney vẫn chưa khả dụng với V7, bao gồm nâng cấp độ phân giải ảnh (upscaling) và tái tạo bề mặt (retexturing). Ông cho biết các tính năng này sẽ được bổ sung trong tương lai gần, có thể trong vòng hai tháng tới.
“Đây là một mô hình hoàn toàn mới với những điểm mạnh riêng biệt, và có lẽ cũng tồn tại một vài điểm yếu”, Holz viết trên Discord. Ông lưu ý rằng V7 có thể sẽ yêu cầu một phong cách viết câu lệnh mới và khuyến khích mọi người dùng thử phiên bản để giúp đưa ra các nhận xét chính sửa.
Phóng viên Kyle Wiggers của Techcrunch nhận xét rằng V7 có thể thực hiện tốt các câu lệnh cơ bản của ông. “Mô hình của Midjourney không được tối ưu hóa riêng cho phong cách Ghibli, ít nhất là chưa chính thức, nhưng vẫn có thể tạo ra những tác phẩm mang tính thẩm mỹ cao”, ông cho biết thêm.
Theo các chuyên gia AI tại Việt Nam, tính năng tạo ảnh của ChatGPT có thể dễ dùng và tiện dụng hơn các trình tạo ảnh đời đầu như MidJourney, Stable Diffusion. Tuy nhiên, mô hình của OpenAI vẫn chưa tạo ra sự đột phá về chất lượng hình ảnh, có thể kém hơn so với các công cụ trước.
Midjourney là một công ty khá đặc biệt. Được thành lập vào năm 2022 bởi Holz, người đồng sáng lập công ty sản xuất thiết bị ngoại vi PC Leap Motion, Midjourney chưa hề nhận khoản đầu tư nào từ bên ngoài.
Công ty này cũng không tiết lộ tình hình kinh doanh, nhưng CBInsights vào cuối năm 2023 ước tính Midjourney đạt doanh thu khoảng 200 triệu USD. Gần đây, công ty cho biết đang thành lập một nhóm phần cứng để làm việc trên một số dự án mà họ chưa tiết lộ, và tiếp tục huấn luyện các mô hình đã công bố trước đó để tạo video và vật thể 3D.
Giống như ChatGPT, MidJourney đang đối mặt với một số vụ kiện, cáo buộc vi phạm quyền lợi của hàng triệu nghệ sĩ khi huấn luyện các công cụ AI trên những hình ảnh thu thập từ web mà không có sự đồng ý của người sáng tạo ra các hình ảnh đó.