'AI đạt độ chính xác 99,9% thì về cơ bản vẫn vô dụng'

Đó là ý kiến của ông Timothy Janz - người phụ trách công tác bảo quản Thư viện Vatican. Ông Janz nhấn mạnh công việc dịch thuật đòi hỏi độ chính xác 100%, đặc biệt trong quá trình gìn giữ di sản tri thức nhân loại.

Từ rất lâu trước khi có máy tính và dịch vụ lưu trữ đám mây, tu sĩ Công giáo thời xưa gìn giữ di sản trí tuệ của thế giới cổ đại bằng cách chép tay các bản thảo tiếng Hy Lạp lẫn tiếng Latinh. Hàng thế kỷ sau, Thư viện Vatican và nhiều tổ chức khác tại Rome sử dụng công nghệ mới như số hóa, robot hay AI để tiếp tục bảo tồn số di sản quý báu này.

Thư viện Vatican - Ảnh: Courtney Mares/Catholic News Agency

Thư viện Vatican - Ảnh: Courtney Mares/Catholic News Agency

Thư viện Vatican, được thành lập vào thế kỷ 15, đang số hóa khoảng 80.000 bản thảo viết tay nằm trong bộ sưu tập bao gồm 2 triệu quyển sách, 100.000 tài liệu lưu trữ cùng hàng trăm nghìn đồng xu, huy chương và tác phẩm đồ họa.

Người phụ trách công tác bảo quản Timothy Janz chia sẻ với trang Catholic News Agency: “Mọi người thường nghĩ Thư viện Vatican như một nơi cũ kỹ bụi bặm, nhưng thực ra nơi đây luôn có xu hướng đi đầu”. Ông minh chứng bằng cách chỉ vào một trong nhiều bức bích họa thời Phục hưng ở sảnh Sistine, vẽ lại cảnh sách được xếp thẳng đứng trên kệ - điều vô cùng mới lạ vào thời kỳ sách thường được xếp nằm ngang.

“Trở thành thư viện công cộng cũng là điều bất thường vào thế kỷ 16”, ông Janz nói thêm. Giáo hoàng Nicholas V, trong bức thư viết vào năm 1451, từng bày tỏ mong muốn thành lập một thư viện vì lợi ích chung của giới học giả.

Theo ông Janz, Thư viện Vatican từ trước đến nay luôn mang 2 sứ mệnh: Giúp người đọc tiếp cận được tác phẩm và lưu trữ tác phẩm cho thế hệ tương lai. Số hóa là phương pháp mới góp phần thực hiện sứ mệnh đầu tiên.

Nỗ lực số hóa tập trung vào bộ sưu tập bản thảo lịch sử "độc nhất vô nhị" cùng vài quyển sách in trong thời kỳ đầu của kỹ thuật in ấn trước năm 1500 (incunabula). Một trong số bản thảo cổ nhất bộ sưu tập là Hanna Papyrus có niên đại từ thế kỷ 3 đã được số hóa. Tương tự, Codex Vaticanus (bản thảo Kinh thánh hoàn chỉnh) từ thế kỷ 4 nay cũng có phiên bản kỹ thuật số. Dự án bắt đầu năm 2012, đến nay thành công đưa khoảng 30.000 bản thảo lên mạng. Tầm nhìn của dự án là xây dựng thư viện số thực sự hữu ích và thân thiện với người dùng.

Nhiều tổ chức Công giáo khác không hề thua kém. Tại Trung tâm Số hóa Alexandria, máy quét robot đang xử lý những trang sách mỏng manh niên đại hàng thế kỷ trong bộ sưu tập thư viện của Đại học Giáo hoàng Gregorian với tốc độ lên tới 2.500 trang/giờ. Chỉ qua vài phút, số tài liệu trước đây chỉ dành cho học giả trực tiếp đến Rome xem nay dễ dàng được tìm kiếm, phiên dịch thậm chí đưa vào mô hình trí tuệ nhân tạo để dạy giáo lý.

Sáng kiến trên do Giám đốc điều hành công ty công nghệ Longbeard Matthew Sanders quản lý. Công ty dùng robot và AI số hóa bộ sưu tập của một số học việc hay đại học Công giáo tại Rome.

Dự án được khởi động từ mong muốn của người đứng đầu Học viện Giáo hoàng Phương Đông: Giúp các học giả tại Trung Đông, châu Phi và Ấn Độ có thể truy cập 200.000 đầu sách về truyền thống Công giáo và Chính thống giáo mà không cần đến tận Rome. Yêu cầu rất đơn giản: Số hóa sách để chúng đọc được trên mọi thiết bị cũng như dễ dàng phiên dịch. Kể từ đó công việc của Trung tâm Số hóa Alexandria tăng lên đáng kể.

Không chỉ Học viện Giáo hoàng Phương Đông, Longbeard còn đang số hóa bộ sưu tập của Đại học Giáo hoàng dòng Salesian và Đại học Giáo hoàng dòng Gregorian, đồng thời còn lên kế hoạch hợp tác với Đại học Giáo hoàng St.Thomas Aquinas, Cao đẳng Anh ngữ cùng vài đơn vị khác.

Số tài hiệu sau số hóa được đưa vào bộ dữ liệu Công giáo ngày càng mở rộng, dùng để đào tạo hệ thống AI như Magisterium hay Ephrem do Longbeard phát triển. Các tổ chức có quyền lựa chọn công khai hay giữ bí mật tài liệu của mình. Giới học giả có thể tra cứu nhiều bộ sưu tập, xem bản tóm tắt hay truy ngược nguồn câu trả lời từ AI.

Hiện tại bộ dữ liệu được nền tảng AI Vulgate hỗ trợ dịch thuật. Giám đốc Sanders từng tình cờ phát hiện tài liệu về thánh Thomas More bằng tiếng Latinh chưa qua phiên dịch, nhờ có Vulgate mà ông đọc hiểu chúng.

Máy quét robot xử lý tài liệu - Ảnh: Courtney Mares/Catholic News Agency

Máy quét robot xử lý tài liệu - Ảnh: Courtney Mares/Catholic News Agency

Thư viện Vatican vẫn giữ thái độ thận trọng với trí tuệ nhân tạo và robot. Ông Janz nhấn mạnh các bản thảo cần con người hơn tự động hóa: “Với học giả, điều khiến bản thảo thú vị là ở vị trí cụ thể nào đó có từ khác biệt so với bản thảo khác, hay thậm chí chỉ một chữ cái khiến từ mang ý nghĩa hoàn toàn khác. Chính sự khác biệt nhỏ bé đem lại giá trị cho chúng. Công việc dịch thuật đòi hỏi độ chính xác 100%. Dù cho AI đạt độ chính xác 99,9% thì về cơ bản vẫn vô dụng”.

Giám đốc Sanders đồng ý rằng với công việc nghiên cứu văn bản sâu sắc và tỉ mỉ, bản thảo gốc có thẩm quyền tối cao đồng thời chuyên gia con người là không thể thay thế. Tuy nhiên ông cho biết giới hạn vai trò của AI ở công việc sao chép tài liệu là bỏ lỡ tiềm năng mang tính cách mạng của nó.

“Ngay cả ở độ chính xác 99,9%, AI vẫn biến các bộ sưu tập tĩnh thành cơ sở dữ liệu năng động, có thể truy vấn về kiến thức nhân loại. AI tìm ra “kim trong đống rơm”, sau đó học giả tự do thực hiện phân tích chuyên sâu trên bản gốc vô giá”, theo Giám đốc Sanders.

Công tác số hóa hỗ trợ đắc lực cho nỗ lực bảo tồn tài liệu lịch sử. Ông Janz cho biết: “Mỗi bản thảo được đưa vào máy quét trước tiên phải trải qua khâu kiểm tra kỹ lưỡng tại xưởng bảo tồn, đảm bảo chúng chịu nổi quá trình số hóa. Sau số hóa, bản thảo lại đến xưởng để kiểm tra xem có thay đổi gì không. Chúng tôi phát hiện nhiều bản thảo cần tu sửa, cần bảo tồn nhờ xem xét tỉ mỉ từng tài liệu một”.

Thư viện Vatican không hoàn toàn bỏ qua AI. Họ đang phát triển dự án lập danh mục hình ảnh minh họa từ các bản thảo cho phép tìm kiếm theo chủ đề, hợp tác với đội ngũ nghiên cứu Nhật Bản đào tạo mô hình máy học phiên âm chữ viết tay tiếng Hy Lạp thời trung cổ. Theo ông Janz: “Máy sẽ mắc lỗi. Chúng ta chỉ ra lỗi và một ngày nào đó máy sẽ đạt đến mức đáng tin cậy”.

Cẩm Bình

Nguồn Một Thế Giới: https://1thegioi.vn/ai-dat-do-chinh-xac-99-9-thi-ve-co-ban-van-vo-dung-238591.html