DeepSeek: Mọi thứ cần biết về chatbot AI mới nhất

DeepSeek đã gây chấn động trong giới công nghệ tuần này khi ứng dụng chatbot AI trở nên rất phổ biến và đứng đầu bảng xếp hạng Apple App Store.

Một người dùng tại Việt Nam hỏi DeepSeek về Thần số học. Hình ảnh: Phan Hải

DeepSeek đạt vị trí số 1 trên US Play Store

Ứng dụng DeepSeek đã đứng đầu Google Play Store chỉ vài ngày sau khi chiếm vị trí số một trên Apple App Store.

Theo công ty phân tích ứng dụng AppFigures, từ khi ra mắt giữa tháng 1, ứng dụng DeepSeek đã có hơn 1,2 triệu lượt tải trên Play Store và 1,9 triệu lượt trên App Store toàn cầu. Số lượng cài đặt thực tế có thể cao hơn vì DeepSeek cho biết đã có hơn 5 triệu lượt tải trên Play Store.

Sự gia tăng nhanh chóng của DeepSeek trên bảng xếp hạng diễn ra nhờ vào các mô hình AI nguồn mở cạnh tranh với sản phẩm của các công ty AI phương Tây như Anthropic, OpenAI, Meta và Google.

Công ty Trung Quốc này khẳng định rằng các mô hình AI của họ được đào tạo với chi phí chỉ một phần nhỏ so với những mô hình của OpenAI và Meta, sử dụng chip AI kém hơn đáng kể.

DeepSeek là một giải pháp thay thế ChatGPT, được hỗ trợ bởi mô hình V3 của phòng thí nghiệm. Người dùng có thể sử dụng bot để phân tích tệp, trả lời câu hỏi và tìm thông tin trực tuyến. Ứng dụng miễn phí, cho phép tải tệp lên và đồng bộ hóa lịch sử trò chuyện trên nhiều thiết bị.

Mặc dù DeepSeek hiện đang đứng đầu bảng xếp hạng, nhưng để duy trì vị trí này lâu dài, nó cần đạt 300 triệu người dùng hàng tuần để vượt qua ChatGPT của OpenAI.

DeepSeek cùng các mô hình của nó đã thu hút nhiều sự chú ý từ ngành công nghiệp trong những ngày qua, với các công ty khởi nghiệp như Perplexity và Gloo đã tích hợp DeepSeek vào hệ thống của họ.

Các mô hình AI của DeepSeek được đào tạo bằng các kỹ thuật hiệu quả về tính toán, đã khiến các nhà phân tích Phố Wall và các nhà công nghệ đặt câu hỏi liệu Hoa Kỳ có thể duy trì vị trí dẫn đầu trong cuộc đua AI hay không và liệu nhu cầu về chip AI có duy trì được hay không?

Ứng dụng DeepSeek đã làm chấn động giới công nghệ toàn cầu. Hình ảnh: Getty Images

Ứng dụng DeepSeek đã làm chấn động giới công nghệ toàn cầu. Hình ảnh: Getty Images

Nguồn gốc của DeepSeek

DeepSeek, được hỗ trợ bởi High-Flyer Capital Management - một quỹ đầu cơ của Trung Quốc sử dụng AI trong các quyết định giao dịch.

Liang Wenfeng là một người đam mê AI, đồng sáng lập High-Flyer vào năm 2015. Ông bắt đầu dấn thân vào giao dịch khi còn là sinh viên Đại học Chiết Giang và ra mắt High-Flyer Capital Management như một quỹ đầu cơ vào năm 2019, tập trung phát triển và triển khai các thuật toán AI.

Năm 2023, High-Flyer thành lập DeepSeek như một phòng thí nghiệm nghiên cứu công cụ AI độc lập với hoạt động tài chính. Phòng thí nghiệm này đã tách ra thành công ty riêng mang tên DeepSeek.

Ngay từ đầu, DeepSeek đã xây dựng các cụm trung tâm dữ liệu riêng để đào tạo mô hình. Tuy nhiên, giống như nhiều công ty AI khác ở Trung Quốc, DeepSeek bị ảnh hưởng bởi lệnh cấm xuất khẩu phần cứng của Hoa Kỳ. Để đào tạo một trong những mô hình mới nhất, công ty phải sử dụng chip Nvidia H800, phiên bản yếu hơn H100 dành cho các công ty Hoa Kỳ.

Đội ngũ kỹ thuật của DeepSeek chủ yếu là những người trẻ và công ty đang tích cực tuyển dụng các nhà nghiên cứu AI có bằng tiến sĩ từ các trường đại học hàng đầu Trung Quốc.

Theo The New York Times, DeepSeek cũng tuyển dụng những người không có kiến thức nền tảng về khoa học máy tính để mở rộng hiểu biết về nhiều chủ đề cho công nghệ của mình.

Các mô hình mạnh mẽ của DeepSeek theo dòng thời gian

Tháng 11/2023, DeepSeek ra mắt bộ mô hình đầu tiên mang tên DeepSeek Coder, DeepSeek LLM và DeepSeek Chat. Tuy nhiên, chỉ sau khi công ty giới thiệu dòng mô hình DeepSeek-V2 vào đầu năm 2024, ngành AI mới bắt đầu chú ý đến cái tên này.

DeepSeek-V2 được giới thiệu là một hệ thống phân tích hình ảnh và văn bản đa năng, hoạt động xuất sắc trong nhiều tiêu chuẩn AI và có chi phí thấp hơn so với các mô hình tương tự vào thời điểm đó. Sự thành công này đã khiến các đối thủ trong nước như ByteDance và Alibaba phải giảm giá và thậm chí cung cấp một số mô hình miễn phí.

Tháng 12/2024, DeepSeek-V3 ra mắt công chúng và làm tăng thêm danh tiếng cho DeepSeek. Theo thử nghiệm nội bộ, DeepSeek V3 vượt trội hơn so với các mô hình tải xuống công khai như Llama của Meta và các mô hình "đóng" như GPT-4o của OpenAI.

Cho đến tháng 1/2025, mô hình "lý luận" R1 của DeepSeek được tuyên bố hoạt động ngang bằng với mô hình o1 của OpenAI trên các tiêu chuẩn chính. R1 tự kiểm tra thực tế hiệu quả, giúp tránh một số lỗi mà các mô hình khác thường gặp. Mặc dù lý luận mất nhiều thời gian hơn để đưa ra giải pháp từ vài giây đến vài phút nhưng chúng thường đáng tin cậy hơn trong các lĩnh vực như vật lý, khoa học và toán học.

Thành công của DeepSeek trước những đối thủ lớn hơn và lâu đời hơn đã "làm đảo lộn AI" và mở ra "kỷ nguyên mới của chính sách cạnh tranh khốc liệt" trong lĩnh vực này.

Chưa có kết luận về việc công ty AI mới nổi DeepSeek có phải là một công ty thay đổi cuộc chơi hay chỉ là phần trong kế hoạch phức tạp của quỹ đầu cơ mẹ nhằm bán khống Nvidia và các cổ phiếu công nghệ khác. Dù sao đi nữa DeepSeek cùng với mô hình ngôn ngữ lớn của nó đã gây ra nhiều tiếng vang và hiện đang thu hút sự chú ý của các cơ quan giám sát bảo vệ dữ liệu.

Minh Phú

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/deepseek-moi-thu-can-biet-ve-chatbot-ai-moi-nhat-179250129164945254.htm
Zalo