Gia tăng nhu cầu tuyển nhà đào tạo trình độ tiến sĩ, thạc sĩ để giúp mô hình AI thông minh hơn
Trong những năm đầu, để các mô hình trí tuệ nhân tạo (AI) đưa ra những phản hồi giống con người thì cần có các đội ngũ lớn người lao động giá rẻ giúp chúng phân biệt sự kiện cơ bản như liệu bên trong hình ảnh là chiếc ô tô hay củ cà rốt.
Thế nhưng, bản cập nhật tinh vi hơn cho các mô hình AI trong lĩnh vực cạnh tranh khốc liệt hiện nay đòi hỏi mạng lưới ngày càng mở rộng những người đào tạo có kiến thức chuyên môn cao, từ nhà sử học đến khoa học, thậm chí một số có bằng tiến sĩ.
"Một năm trước, chúng tôi có thể thuê sinh viên đại học, chỉ để dạy AI cách cải thiện. Bây giờ, chúng tôi có các bác sĩ được cấp phép dạy các mô hình cách ứng xử trong môi trường y tế, hoặc những nhà phân tích tài chính hoặc kế toán", Ivan Zhang (đồng sáng lập công ty khởi nghiệp Cohere) cho biết, khi nhắc về những người đào tạo AI nội bộ của công ty. Cohere là một trong những đối thủ chính của OpenAI và chuyên cung cấp AI cho doanh nghiệp.
Để đào tạo thêm mô hình AI, Cohere (được định giá hơn 5 tỉ USD) hợp tác với công ty khởi nghiệp Invisible Tech.
Invisible Tech tuyển dụng hàng nghìn người, làm việc từ xa và trở thành một trong những đối tác chính của các công ty AI từ AI21 đến Microsoft để đào tạo các mô hình AI của họ nhằm giảm thiểu lỗi, được gọi là ảo giác trong thế giới AI.
"Chúng tôi có 5.000 người tại hơn 100 quốc gia trên toàn thế giới là tiến sĩ, thạc sĩ và chuyên gia công nghệ thông tin", Francis Pedraza (người sáng lập Invisible Tech) cho biết.
Invisible Tech trả lương 40 USD/giờ, tùy thuộc vào vị trí người lao động và mức độ phức tạp của công việc. Một số công ty như Outlier trả 50 USD/giờ, trong khi Labelbox trả tới 200 USD/giờ cho các môn học cần trình độ chuyên môn cao như vật lý lượng tử, nhưng khởi điểm là 15 USD/giờ với các chủ đề cơ bản.
Invisible Tech được thành lập vào năm 2015 với tư cách là một công ty tự động hóa quy trình làm việc phục vụ cho các hãng giao đồ ăn như DoorDash, giúp số hóa thực đơn giao hàng của họ. Thế nhưng, mọi thứ đã thay đổi khi OpenAI liên hệ với Invisible Tech vào mùa xuân năm 2022, trước thời điểm ChatGPT ra mắt công chúng.
"OpenAI đã đến gặp chúng tôi với một vấn đề, đó là khi bạn hỏi phiên bản ChatGPT ban đầu một câu hỏi, nó sẽ tạo ra ảo giác. Bạn không thể tin tưởng câu trả lời. Họ cần một đối tác đào tạo AI tiên tiến để cung cấp khả năng học tăng cường với phản hồi của con người", Francis Pedraza chia sẻ với Reuters.
Học tăng cường là một nhánh của học máy, nơi tác nhân học cách đưa ra các quyết định trong một môi trường để tối đa hóa nhiệm vụ cụ thể. Nói cách khác, nó giống như việc dạy một đứa trẻ học đi xe đạp. Đứa trẻ sẽ thử đi, ngã, rồi lại thử và cuối cùng sẽ tìm ra cách cân bằng và đi được.
OpenAI không trả lời khi được đề nghị bình luận.
AI tạo ra nội dung mới dựa trên dữ liệu trước đây được sử dụng để đào tạo nó. Tuy nhiên, đôi khi AI không thể phân biệt giữa thông tin đúng với sai và đưa ra câu trả lời sai lệch, gọi là ảo giác. Trong ví dụ đáng chú ý, chatbot Bard (hiện là Gemini) của Google đầu năm 2023 đã đưa ra câu trả lời không chính xác về vệ tinh nào chụp ảnh đầu tiên một hành tinh bên ngoài hệ Mặt trời của Trái đất ở video quảng cáo.
Các công ty AI nhận thức được rằng ảo giác có thể làm giảm sức hấp dẫn của AI tạo sinh với các doanh nghiệp và đang thử nhiều cách khác nhau để giảm thiểu nó, gồm cả việc sử dụng người hướng dẫn để dạy khái niệm đúng và sai.
Kể từ khi hợp tác với OpenAI, Invisible Tech cho biết họ đã trở thành đối tác đào tạo AI cho hầu hết công ty AI tạo sinh, gồm cả Cohere, AI21 và Microsoft.
Cohere và AI21 xác nhận điều này. Trong khi Microsoft không xác nhận họ là khách hàng của Invisible Tech.
"Đây đều là những công ty gặp phải thách thức về đào tạo, trong đó chi phí số một của họ là sức mạnh tính toán, và chi phí số hai là đào tạo chất lượng", Francis Pedraza nói.
Hoạt động như thế nào?
Khởi xướng cơn sốt xung quanh AI tạo sinh, OpenAI có nhóm các nhà nghiên cứu được đặt tên là "Đội ngũ dữ liệu con người" làm việc với các chuyên gia đào tạo AI, với mục đích thu thập dữ liệu chuyên biệt để huấn luyện mô hình AI của mình như GPT.
Các nhà nghiên cứu OpenAI đưa ra nhiều thử nghiệm khác nhau như giảm ảo giác hoặc cải thiện phong cách viết và làm việc với những chuyên gia đào tạo AI từ Invisible Tech cùng những nhà cung cấp khác, theo một nguồn tin quen thuộc với quy trình của “cha đẻ ChatGPT”.
Nguồn tin này cho biết tại bất kỳ thời điểm nào, hàng chục thử nghiệm đang được tiến hành, bằng các công cụ do OpenAI phát triển hoặc một số ứng dụng từ các nhà cung cấp.
Dựa trên những gì các công ty AI muốn, Invisible Tech thuê những người lao động có bằng cấp liên quan cho các dự án đó, giảm bớt gánh nặng quản lý hàng trăm nhà đào tạo mô hình của các công ty AI.
"OpenAI có một số nhà khoa học máy tính đáng kinh ngạc nhất thế giới nhưng không hẳn là chuyên gia về lịch sử, hóa học, sinh học hoặc bất cứ điều gì mà bạn hỏi họ", Francis Pedraza cho hay, đồng thời nói thêm rằng có hơn 1.000 nhân viên hợp đồng chỉ phục vụ riêng cho OpenAI.
Ivan Zhang nói ông đã đích thân sử dụng những nhà đào tạo của Invisible Tech để tìm cách dạy mô hình AI tạo sinh của mình tìm thông tin liên quan từ tập dữ liệu lớn.
Cạnh tranh
Trong số các đối thủ cạnh tranh ở lĩnh vực này có Scale AI, công ty khởi nghiệp tư nhân được định giá lần gần nhất là 14 tỉ USD, cung cấp bộ dữ liệu đào tạo cho những công ty AI. Scale AI đã lấn sân vào lĩnh vực cung cấp các nhà đào tạo AI và coi OpenAI là khách hàng. Scale AI không trả lời câu hỏi về câu chuyện này.
Đã có lãi từ năm 2021, Invisible Tech chỉ huy động được 8 triệu USD vốn ban đầu. "70% Invisible Tech thuộc đội ngũ trong công ty và chỉ 30% thuộc sở hữu của các nhà đầu tư. Chúng tôi tạo điều kiện cho các vòng gọi vốn thứ cấp và giá giao dịch gần đây nhất là nửa tỉ USD", Francis Pedraza tuyên bố.
Reuters không thể xác nhận mức định giá đó của Invisible Tech.
Những người đầu tiên tham gia đào tạo AI thông qua công việc dán nhãn dữ liệu, đòi hỏi ít trình độ hơn và cũng được trả lương thấp hơn, đôi khi chỉ 2 USD, chủ yếu ở các nước châu Phi và châu Á.
Khi các công ty AI tung ra nhiều mô hình tiên tiến hơn, nhu cầu về các giảng viên chuyên ngành và biết nhiều ngôn ngữ đang tăng lên, tạo ra một thị trường ngách được trả lương cao. Đó là nơi những người lao động từ nhiều lĩnh vực khác nhau có thể trở thành giảng viên AI mà thậm chí không cần biết cách lập trình.
Nhu cầu từ các hãng AI đang dẫn đến việc xuất hiện nhiều công ty cung cấp dịch vụ tương tự Invisible Tech.
"Hộp thư đến của tôi về cơ bản tràn ngập bởi các công ty mới xuất hiện ở đây và ở đó. Tôi thấy đây là một lĩnh vực mới, nơi các công ty thuê con người chỉ để tạo dữ liệu cho các phòng thí nghiệm AI như Cohere", Ivan Zhang thổ lộ.