ChatGPT thêm tính năng chỉnh sửa ảnh dễ hơn, tạo biểu đồ và infographic cho công việc tốt hơn
Các tính năng mới này có sẵn cho cả người dùng ChatGPT miễn phí và trả phí thông qua mô hình GPT-4o của OpenAI.
OpenAI đang giúp việc chỉnh sửa hình ảnh trong ChatGPT trở nên dễ dàng hơn và tạo ra biểu đồ trực quan cho công việc, gồm cả văn bản dài. Điều này có thể mở rộng sức hút của chatbot trí tuệ nhân tạo (AI) này với các doanh nghiệp và người dùng hằng ngày.
Trong một sự kiện livestream hôm 25.3 có sự tham gia của Giám đốc điều hành Sam Altman, OpenAI (có trụ sở tại thành phố San Francisco, Mỹ) trình diễn cách người dùng ChatGPT có thể tinh chỉnh hình ảnh bằng cách trò chuyện liên tục với chatbot này. Ví dụ, người dùng có thể yêu cầu ChatGPT chuyển ảnh dạng selfie thành hoạt hình, sau đó thêm vào tiêu đề.
Ngoài ra, ChatGPT cũng giúp tạo hình ảnh kèm văn bản rõ ràng và mạch lạc hơn. Cụ thể hơn, nó hỗ trợ tạo ra các biểu đồ, đồ họa thông tin (infographic) và logo phục vụ cho mục đích chuyên nghiệp. Ví dụ, người dùng yêu cầu chatbot của OpenAI tạo hình ảnh thực tế về thực đơn tùy chỉnh hoặc một bản đồ.
OpenAI ngày càng định vị ChatGPT như ứng dụng đa năng, cung cấp công cụ tìm kiếm, trợ lý giọng nói và trình tạo video. Với những cải tiến mới nhất, OpenAI đang cố gắng tích hợp thêm các tính năng hình ảnh tiên tiến, có thể áp dụng cho cả mục đích cá nhân và công việc. Điều này cũng giúp ChatGPT duy trì lợi thế trước đối thủ như xAI của Elon Musk, vốn cũng đã bổ sung các công cụ tạo hình ảnh.
Tuy nhiên, giống các ứng dụng AI khác, ChatGPT có thể đưa ra thông tin sai lệch khi tạo hình ảnh, chẳng hạn như chèn văn bản với tên quốc gia sai. Trong một bài đăng trên blog, OpenAI cho biết những lỗi này có thể xảy ra khi người dùng nhập các yêu cầu chưa đủ chi tiết. Công ty cũng thừa nhận chatbot AI của họ gặp khó khăn khi tạo văn bản có kích thước nhỏ và văn bản sử dụng bảng chữ cái phi Latin, cùng với một số hạn chế khác.
Các tính năng mới sẽ có sẵn từ ngày 25.3 thông qua mô hình AI GPT-4o của OpenAI dành cho cả người dùng miễn phí và trả phí. Công ty cho biết sẽ triển khai các tính năng này trong vài tuần tới cho nhà phát triển phần mềm sử dụng API (giao diện lập trình ứng dụng) của OpenAI.

Giám đốc điều hành Sam Alman (phải) tham gia buổi livestream hôm 25.3 cùng hai kỹ sư OpenAI, yêu cầu ChatGPT tạo ảnh hoạt hình từ ảnh chụp selfie của họ - Ảnh chụp màn hình

Sau đó, họ yêu cầu ChatGPT chuyển ảnh hoạt hình thành meme với tiêu đề Feel the AGI (cách diễn đạt thể hiện sự phấn khích về sự phát triển của AI, gần với trí thông minh con người)
"Tăng trưởng nhanh nhất hai năm qua"
ChatGPT đã thu hút hàng triệu người dùng mới trong những tuần và tháng gần đây, giúp OpenAI trở thành một đối thủ đáng gờm hơn với Google và các gã khổng lồ internet khác.
"Dường như có điều gì đó đã thúc đẩy việc ứng dụng sản phẩm AI lên một tầm cao mới", các nhà phân tích công nghệ của Barclays viết trong một báo cáo gửi đến các nhà đầu tư. Họ lưu ý ChatGPT vừa có thêm 100 triệu người dùng chỉ trong hai tháng, tốc độ tăng trưởng nhanh nhất hai năm qua.
"Do đó, chúng tôi đã nâng dự báo về mức độ phổ biến của AI trong cả lĩnh vực tiêu dùng và doanh nghiệp", các nhà phân tích công nghệ của Barclays viết.
Barclays là tập đoàn dịch vụ tài chính và ngân hàng đa quốc gia có trụ sở tại London, thủ đô Anh. Công ty cung cấp nhiều dịch vụ tài chính, gồm ngân hàng đầu tư, quản lý tài sản, ngân hàng doanh nghiệp và cá nhân.
Trang Insider đã hỏi OpenAI về điều gì đang thúc đẩy sự bùng nổ này nhưng công ty khởi nghiệp AI này không phản hồi. Tuy nhiên, các nhà phân tích của Barclays đã đưa ra một số giả thuyết.
OpenAI đã ra mắt loại mô hình AI suy luận mới có tên o1 cuối năm ngoái. Nó sử dụng phương pháp gọi là tính toán thời gian suy luận (test-time compute), chia nhỏ các truy vấn thành những nhiệm vụ nhỏ hơn, sau đó biến mỗi nhiệm vụ thành một lời nhắc mới mà mô hình sẽ xử lý. Không lâu sau, OpenAI nhanh chóng tung ra phiên bản cập nhật o3.
Các nhà phân tích của Barclays cũng ghi nhận một số sản phẩm mới khác của OpenAI, gồm tác tử AI Deep Research và mô hình AI đa phương thức GPT-4.5 có thể xử lý nhiều loại truy vấn ngoài văn bản.
Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.
Deep Research được tối ưu hóa cho duyệt web và phân tích dữ liệu, có khả năng thực hiện nghiên cứu nhiều bước trên internet cho các nhiệm vụ phức tạp mà theo OpenAI, "hoàn thành trong vài chục phút những gì con người phải mất nhiều giờ".
Bạn chỉ cần cung cấp một yêu cầu là Deep Research sẽ "tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một báo cáo toàn diện ở cấp độ của nhà phân tích nghiên cứu".
Deep Research phục vụ cho các chuyên gia trong lĩnh vực tài chính, khoa học, chính sách và kỹ thuật, cung cấp những thông tin chi tiết đáng tin cậy và toàn diện. Tính năng này cũng hữu ích với những người mua sắm đang tìm kiếm các đề xuất được cá nhân hóa về giao dịch mua đòi hỏi phải nghiên cứu cẩn thận, chẳng hạn ô tô, đồ gia dụng và đồ nội thất.
Kết quả gồm các trích dẫn và tóm tắt rõ ràng, giúp dễ dàng xác minh. Về cơ bản, Deep Research giúp tinh giản quá trình nghiên cứu tốn thời gian, cung cấp thông tin chuyên sâu hiệu quả chỉ từ một truy vấn.
Trong loạt bài đăng trên mạng xã hội X, Sam Altman đã mô tả Deep Research là "giống một siêu năng lực, hoạt động như nhóm chuyên gia sẵn sàng hỗ trợ bạn".
Sam Altman cho biết Deep Research có thể "sử dụng internet, thực hiện nghiên cứu, lập luận phức tạp và trả về cho bạn một báo cáo", xử lý các nhiệm vụ "mất nhiều giờ/ngày và tốn hàng trăm USD".
Dù rất tốn nhiều tài nguyên tính toán và hoạt động còn chậm, ông tuyên bố "Deep Research là hệ thống AI đầu tiên có thể thực hiện nhiều nhiệm vụ phức tạp, có giá trị như vậy".
Deep Research mất từ 5 đến 30 phút để hoàn thành công việc và bạn sẽ nhận được thông báo khi nghiên cứu xong. Kết quả cuối cùng là một báo cáo được gửi qua ChatGPT.
Sam Altman kêu gọi mọi người "hãy thử nghiệm Deep Research với công việc khó khăn nhất mà bạn phải giải quyết bằng cách sử dụng internet và xem điều gì sẽ xảy ra".
Ông tin rằng Deep Research sẽ có tác động đáng kể và có thể thực hiện "khoảng 5% nhiệm vụ trong nền kinh tế hiện nay".
Công nghệ rất quan trọng, nhưng kinh doanh internet chủ yếu xoay quanh phân phối. Bạn có một sản phẩm tuyệt vời, nhưng làm thế nào để đưa nó đến với 1 tỉ người dùng?
Công cụ phân phối mạnh nhất ở phương Tây hiện nay chính là iPhone. Hơn 1 tỉ người dành hàng giờ mỗi ngày trên iPhone, vì vậy có được một vị trí nổi bật trên smartphone của Apple là chìa khóa.
Khoảng 9 tháng trước, Sam Altman đã tạo ra một bước đột phá khi OpenAI công bố quan hệ đối tác với Apple. Kết quả là OpenAI tích hợp sâu ChatGPT vào iPhone và các thiết bị Apple khác.
Các nhà phân tích của Barclays cho rằng điều này là yếu tố quan trọng góp phần vào tốc độ tăng trưởng mạnh mẽ của ChatGPT.
Mark Mahaney, một trong những nhà phân tích internet hàng đầu tại hãng Evercore ISI, phát hiện thêm tin tốt cho OpenAI.
"ChatGPT đang dẫn đầu với tỷ lệ áp dụng AI tạo sinh lên tới 37% (so với 23% vào tháng 6.2024), tiếp theo là Google (Gemini hoặc AI Overview) với 27% (so với 17% vào tháng 6.2024). Đặc biệt đáng chú ý là mức độ sử dụng ChatGPT ngày càng tăng trong Gen Z (thế hệ sinh từ năm 1997 đến 2012)", các nhà phân tích của Evercore ISI cho hay.
Theo dữ liệu khảo sát của Evercore ISI, ChatGPT đã đạt tỷ lệ phổ biến 55% trong nhóm Gen Z và 50% trong nhóm Millennials (thế hệ sinh từ năm 1981 đến 1996). Trong khi đó, Google chỉ đạt 33%.
Google đã thống trị tìm kiếm trực tuyến trong suốt một thời gian dài, nên những con số này thực sự đáng kinh ngạc.