Khoảng cách của AI ở châu Phi như thế nào so với thế giới?

Từ khi ChatGPT xuất hiện năm 2022, AI đã phổ biến rộng rãi, nhưng các sản phẩm hiện tại chủ yếu phục vụ thị trường Mỹ và châu Âu, mâu thuẫn với mục tiêu trở thành công cụ toàn cầu. Các nhà nghiên cứu châu Phi đang nỗ lực thay đổi hiện trạng này và cạnh tranh trong lĩnh vực AI.

Các chiến lược AI áp dụng cho mọi công ty phương Tây không phục vụ được nhiều nhóm dân số trên thế giới. Các nhà nghiên cứu châu Phi này đang nỗ lực để thay đổi điều đó.

Các chiến lược AI áp dụng cho mọi công ty phương Tây không phục vụ được nhiều nhóm dân số trên thế giới. Các nhà nghiên cứu châu Phi này đang nỗ lực để thay đổi điều đó.

DAIR: Tổ chức phi lợi nhuận nỗ lực thay đổi cán cân quyền lực AI toàn cầu

Viện Nghiên Cứu AI Phân Tán (DAIR) đang nỗ lực kiến tạo một kỷ nguyên AI công bằng hơn, đặc biệt tập trung vào các cộng đồng bị gạt ra ngoài lề trong bối cảnh công nghệ hiện nay.

DAIR là một tập thể các nhà nghiên cứu và kỹ sư quốc tế, hướng đến việc phát triển các giải pháp AI độc lập, vì cộng đồng và không chịu ảnh hưởng lợi ích từ các tập đoàn công nghệ khổng lồ. Tổ chức này đặc biệt chú trọng đến việc giải quyết các nhu cầu xã hội cấp thiết tại Châu Phi, ưu tiên những cộng đồng thiệt thòi thay vì phục vụ lợi ích của các tập đoàn đa quốc gia hoặc chỉ tập trung vào người dùng phương Tây.

Nyalleng Moorosi, nhà nghiên cứu cao cấp của DAIR cho biết: Kinh nghiệm giảng dạy tại các trường công lập Nam Phi dưới chế độ phân biệt chủng tộc đã định hình triết lý của cô về công bằng công nghệ. Chứng kiến những khó khăn của sinh viên nghèo, cô càng nhận thức được tầm quan trọng của việc đảm bảo cơ hội tiếp cận công nghệ cho mọi người.

Sau thời gian làm việc tại Google châu Phi, Moorosi nhận thấy sự khác biệt giữa mục tiêu cá nhân và định hướng của các tập đoàn công nghệ lớn. Cùng với Timnit Gebru (người sáng lập DAIR), Moorosi quyết tâm trao quyền cho các chuyên gia địa phương bằng cách cung cấp nguồn lực và hỗ trợ cần thiết. DAIR là nỗ lực quan trọng nhằm cân bằng quyền lực trong lĩnh vực AI toàn cầu, hướng đến một tương lai nơi công nghệ AI phục vụ lợi ích của tất cả, đặc biệt là các cộng đồng dễ bị tổn thương.

Sự bất bình đẳng trong dự án nghiên cứu AI ở Châu Phi

Các khu đô thị kém phát triển ở ngoại ô Nam Phi, nơi cư dân có chất lượng cuộc sống thấp hơn so với các khu vực giàu có. Việc phân bổ chi tiêu công dựa trên điều tra dân số ưu tiên các khu vực giàu, bỏ qua các thị trấn và dẫn đến bất bình đẳng không gian. Điều này khiến cư dân da đen ở các thị trấn thiếu tiếp cận các nguồn lực công cộng quan trọng như y tế, giáo dục và không gian xanh.

Năm 2018, các cộng sự đến từ tổ chức DAIR đã sử dụng ảnh vệ tinh để theo dõi những thay đổi trong môi trường xây dựng tại các khu dân cư của tầng lớp lao động da đen ở Nam Phi. DAIR quan tâm đến sự biến đổi của các khu dân cư đô thị này, nhằm biên soạn dữ liệu đánh giá sự cải thiện chất lượng cuộc sống của cư dân.

Ảnh vệ tinh khu dân cư nằm trong dự án nghiên cứu của DAIR.

Ảnh vệ tinh khu dân cư nằm trong dự án nghiên cứu của DAIR.

Các nhà nghiên cứu DAIR đã huấn luyện mô hình học máy bằng hàng triệu ảnh vệ tinh và dữ liệu địa không gian của các tỉnh Nam Phi, tạo ra một hệ thống AI có khả năng phân loại khu vực thành khu dân cư giàu, nghèo và phi dân cư.

Khi DAIR công bố kết quả nghiên cứu, các tổ chức học thuật phương Tây đã phủ nhận nghiên cứu về máy học và nghiên cứu bị cho là "không phải AI".

Đại diện DAIR cho rằng dự án không gian của họ, dù sử dụng thị giác máy tính và các phương pháp tương tự như học máy, vẫn không được giới học thuật chấp nhận vì tập dữ liệu thực tế của họ bị coi là quá hẹp trong khi nhiều tập dữ liệu thử nghiệm lại được chấp nhận.

Nguyên nhân của sự bất bình đẳng này là do di sản phân biệt chủng tộc vẫn tác động đến các thuộc địa cũ. Vấn đề không nằm ở việc dự án chỉ liên quan đến châu Phi, mà ở việc những người không trải qua quá trình thực dân hóa ở châu Phi không nhận thức được tác động của nó. Nội dung nghiên cứu AI của DAIR dường như là rào cản đối với sự công nhận trong ngành công nghiệp AI do phương Tây chi phối.

Lesan AI: Công cụ AI dịch ngôn ngữ bản địa châu Phi

Lesan AI là công cụ dịch và phiên âm tập trung vào các ngôn ngữ bản địa châu Phi. Khác với các công ty công nghệ lớn của Hoa Kỳ, Lesan AI ưu tiên các ngôn ngữ ít tài nguyên như Amharic và Tigrinya.

Hadgu, người thông thạo cả hai ngôn ngữ này, đã xây dựng một bộ dữ liệu mạnh mẽ từ nội dung báo và radio tái sử dụng từ cộng đồng địa phương ở Ethiopia, tập trung vào các đặc điểm ngôn ngữ quan trọng. Ông chỉ ra rằng các mô hình ngôn ngữ phổ biến như OpenAI và Anthropic không đáp ứng đủ nhu cầu của hàng trăm triệu người châu Phi, thể hiện qua hiệu suất thấp của ChatGPT trên các ngôn ngữ châu Phi (dẫn chứng từ nghiên cứu "Fumbling in Babel").

Hadgu nhận định ChatGPT thường mắc lỗi, tạo ra nội dung vô nghĩa trên các ngôn ngữ như Amharic và Tigrinya do cách tiếp cận ưu tiên tiếng Anh. Lesan AI giải quyết vấn đề này bằng cách xây dựng tập dữ liệu chất lượng cao cho các ngôn ngữ ít tài nguyên, cung cấp hàng triệu bản dịch chính xác và mở rộng nội dung web cho những cộng đồng đang thiếu hụt trực tuyến.

Công cụ dịch Lesan coi các ngôn ngữ này ngang hàng, phân bổ nguồn lực cân bằng thay vì tập trung vào một số ít ngôn ngữ phổ biến và bỏ mặc những ngôn ngữ ít được biết đến, ít chuyên biệt hoặc ít được bản địa hóa, bất kể có bao nhiêu người nói những ngôn ngữ đó.

Dữ liệu huấn luyện AI hiện nay đang lệch lạc, chủ yếu hướng về thế giới phương Tây. Một nghiên cứu của Data Provenance Initiative trên 4.000 tập dữ liệu công khai (600 ngôn ngữ, 67 quốc gia, 3 thập kỷ) cho thấy khoảng 90% dữ liệu đến từ châu Âu và Bắc Mỹ, chỉ 4% từ châu Phi.

Theo Hagdu, dù dự án "Không ngôn ngữ nào bị bỏ lại phía sau" của Facebook đã nghiên cứu hàng trăm ngôn ngữ, các ngôn ngữ châu Phi được lựa chọn một cách "tiện lợi", dựa trên nguồn tài nguyên có sẵn trên web và các phương pháp tự động để xử lý. Tuy nhiên, nhiều ngôn ngữ Tây và châu Phi cận Sahara dựa vào thanh điệu và truyền thống truyền miệng, vốn đang mai một do sự suy giảm dân số bản địa và sự phổ biến của các ngôn ngữ thuộc địa. Điều này gây khó khăn cho LLM do các công ty phương Tây phát triển trong việc thể hiện đầy đủ các ngôn ngữ Châu Phi. Hagdu nhấn mạnh vai trò của người lớn tuổi và cộng đồng trong việc đảm bảo tính chính xác về bối cảnh địa phương cho hệ thống máy học của ông.

Tiến sĩ Paul Azunre kể về việc các công ty lớn dễ dàng lôi kéo nhân tài từ các công ty khởi nghiệp ở Nam Bán cầu mà không trả công. Ông dẫn chứng việc Facebook sử dụng dữ liệu của Ghana NLP để xây dựng một mô hình mã nguồn mở, sau đó lại yêu cầu công ty này nộp đề xuất xin tài trợ, thay vì trực tiếp bồi thường cho việc sử dụng dữ liệu của họ.

Ghana NLP được thành lập để đưa các ngôn ngữ Ghana vào các sản phẩm phần mềm. Công ty tập trung vào nhận dạng giọng nói, chuyển văn bản thành giọng nói và dịch giọng nói thành văn bản bằng các ngôn ngữ địa phương như Twi, Ewe, Yoruba, Fante và Ga, đồng thời mở rộng sang các ngôn ngữ từ các quốc gia lân cận.

Điều gì tiếp theo cho AI ở châu Phi?

Theo nhà nghiên cứu Chinasa T. Okolo, nhiều chính phủ châu Phi đang tìm cách xây dựng khung quản trị AI để hạn chế ảnh hưởng của các tập đoàn đa quốc gia.

Nam Phi đã công bố Khung chính sách AI quốc gia, nhằm đảm bảo quyền tiếp cận công bằng, đặc biệt cho các cộng đồng nông thôn. Okolo cũng lưu ý rằng 36 quốc gia châu Phi đã có quy định bảo vệ dữ liệu, tạo tiền đề cho các khuôn khổ AI được quản lý chặt chẽ hơn.

Tương tự như việc phát triển LLM cho các quốc gia Ả Rập được thiết kế riêng cho tiếng Ả Rập và văn hóa, hoặc việc Meta mở rộng Meta AI trong khu vực, các công ty AI phương Tây đang phát triển các LLM theo khu vực.

Minh Phú

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/khoang-cach-cua-ai-o-chau-phi-nhu-the-nao-so-voi-the-gioi-1792504031050187.htm
Zalo