'Nhân văn số' - hướng đi mới, tiềm năng lớn: Tạo môi trường thuận lợi để thu hẹp khoảng cách với thế giới
Thời gian gần đây, nhiều nước trên thế giới, trong đó có Việt Nam, quan tâm đầu tư, phát triển, nghiên cứu 'nhân văn số' (digital humanities) với sự tham gia của các nhà khoa học đa ngành.
Ứng dụng công nghệ thông tin để trả lời những câu hỏi của ngành xã hội và nhân văn, “nhân văn số” đang được coi là hướng đi, cách tiếp cận mới đối với tri thức nhân văn.
“Nhân văn số” là gì?
"Nhân văn số" (Digital humanities) là một lĩnh vực liên ngành có sự kết hợp giữa công nghệ số và các nghiên cứu nhân văn. Khái niệm “nhân văn số” hình thành từ giữa thế kỷ XX, khi các nhà nghiên cứu tìm cách sử dụng máy tính để xử lý dữ liệu văn bản và ngôn ngữ. Dự án Index Thomisticus do Roberto Busa, một linh mục, nhà ngôn ngữ học người Ý khởi xướng vào năm 1949 nhằm số hóa và tạo chỉ mục các tác phẩm của Thomas Aquinas, được coi là một trong những khởi đầu của nhân văn số. Từ cuối thập niên 1980 và đầu 1990, sự phát triển của internet và công nghệ thông tin đã tạo điều kiện cho “nhân văn số” phát triển mạnh hơn. Đến đầu thế kỷ XXI, “nhân văn số” đã trở thành một lĩnh vực nghiên cứu chính thức, với sự tham gia của nhiều trường đại học, viện nghiên cứu, trung tâm nghiên cứu trên thế giới.
Cần nhấn mạnh rằng, các dự án “nhân văn số” là dự án nghiên cứu sử dụng các công cụ và phương pháp kỹ thuật số để tìm hiểu, khám phá, nghiên cứu về lĩnh vực nhân văn (như lịch sử, văn học, ngôn ngữ, văn hóa, âm nhạc, nghệ thuật, triết học, tôn giáo...). Với ngành “nhân văn số”, luôn có sự hợp tác liên ngành giữa các học giả từ các lĩnh vực khác nhau (như nhân văn, khoa học máy tính, khoa học thông tin thư viện, ngôn ngữ, lịch sử, địa lý, tôn giáo...), sử dụng các công cụ và phương pháp kỹ thuật số để đem lại tiện ích tiếp cận, khai thác thông tin cho người đọc, người sử dụng. Sự hợp tác này tạo ra kết quả nghiên cứu sáng tạo, hỗ trợ giải quyết các vấn đề nghiên cứu, cung cấp thông tin nghiên cứu trong lĩnh vực nhân văn, xã hội.
Trên thực tế, có sự phân biệt đáng kể giữa các dự án “nhân văn số” với các dự án số hóa. Trong dự án “nhân văn số”, số hóa là một phần nhưng không phải là tất cả. Dự án “nhân văn số” không chỉ dừng ở việc số hóa dữ liệu, thông tin cho việc truy cập, mà còn áp dụng các công nghệ, kỹ thuật số để phân tích nội dung dữ liệu, tổ chức dữ liệu đã số hóa, thể hiện mạng lưới liên kết giữa các dữ liệu, trình bày trực quan dữ liệu theo chủ đề được gắn mã (code), cho phép tiếp cận tổng thể khối dữ liệu, cấu trúc tổng thể của khối dữ liệu..., hướng đến giải quyết các câu hỏi nghiên cứu về lĩnh vực nhân văn.
Vị thế “nhân văn số” tại các quốc gia
“Nhân văn số” được các nước trên thế giới quan tâm đầu tư vì có khả năng tạo ra cơ hội mới trong việc bảo tồn, phân tích và phổ biến tri thức nhân văn thông qua sự tiện ích của công nghệ kỹ thuật số. Lĩnh vực này không chỉ giúp bảo tồn di sản văn hóa và lịch sử, mà còn cung cấp phương pháp nghiên cứu mới, mang tính liên ngành, mở rộng khả năng tiếp cận thông tin cho người học, người nghiên cứu ở các trường chính quy cũng như người dân học tập trọn đời. Sự phát triển của “nhân văn số” còn hỗ trợ xây dựng văn hóa số, giúp người dân dễ dàng tiếp cận và hiểu sâu hơn về các giá trị nhân văn của quốc gia và quốc tế.
“Nhân văn số” giúp đẩy mạnh nỗ lực số hóa các tài liệu lịch sử, văn bản cổ và các di sản văn hóa, thiết lập hệ thống cho phép lưu giữ chúng trong một thời gian dài mà không sợ hư hại do thời gian hay điều kiện vật lý. Công nghệ số giúp các nhà nghiên cứu từ các lĩnh vực liên ngành có thể phân tích lượng lớn dữ liệu văn bản, hình ảnh, âm thanh, video... Đặc biệt, khả năng xử lý ngôn ngữ tự nhiên và phân tích dữ liệu lớn (big data) mở ra khả năng mới để hiểu sâu hơn về các xu hướng văn hóa, lịch sử, ngôn ngữ... “Nhân văn số” tạo ra các bộ dữ liệu phong phú về ngôn ngữ, văn bản và văn hóa, hỗ trợ các nhà khoa học dữ liệu và kỹ sư phát triển trí tuệ nhân tạo (AI). Các nghiên cứu về ngôn ngữ trong “nhân văn số” có thể giúp cải thiện các mô hình xử lý ngôn ngữ tự nhiên (NLP), được ứng dụng trong các công nghệ chatbot, dịch tự động, và phân tích sắc thái tình cảm - ứng dụng trong các lĩnh vực thương mại, chăm sóc khách hàng...
Chính vì những lợi ích của “nhân văn số”, nhiều nước trên thế giới có sự đầu tư mạnh mẽ vào lĩnh vực này. Tại Hoa Kỳ, nhiều trường đại học và tổ chức văn hóa đã thành lập các trung tâm “nhân văn số”, điển hình như Viện Nghiên cứu Nhân văn số tại Đại học Stanford và Đại học Harvard. Tại châu Âu, Liên minh châu Âu đã tài trợ nhiều dự án “nhân văn số” thông qua các chương trình Horizon 2020 và Horizon Europe. Các đơn vị như Phòng lab Nhân văn số tại Đại học Basel (Thụy Sĩ) và Trung tâm Nhân văn số tại Đại học London (Anh) là những đơn vị tiên phong trong lĩnh vực này. Tại châu Á, Nhật Bản, Hàn Quốc và Trung Quốc đang đầu tư mạnh mẽ vào “nhân văn số” với trọng tâm là nghiên cứu lịch sử, di sản văn hóa và ngôn ngữ.
“Nhân văn số” mở ra hướng tiếp cận mới tại Việt Nam
Cho đến nay, ở Việt Nam đã có một số dự án trong lĩnh vực “nhân văn số”. Có thể kể đến khóa tập huấn (workshop) do Nom Foundation tổ chức tại Viện Công nghệ thông tin, Viện Hàn lâm Khoa học công nghệ Việt Nam, vào các năm 2017 - 2018. Các khóa tập huấn này có vai trò quan trọng trong việc giới thiệu bức tranh tổng quát về “nhân văn số”, về các phương pháp, kỹ thuật, cách thức... triển khai các dự án “nhân văn số”. Với sự tham gia chia sẻ của các chuyên gia đến từ Hoa Kỳ, Australia, Nhật Bản, Đài Loan (Trung Quốc), Việt Nam..., và sự tham gia của các học viên thuộc nhiều đơn vị nghiên cứu về nhân văn, các khóa tập huấn này đã thu hút sự quan tâm của giới nghiên cứu liên ngành về “nhân văn số”, góp phần thúc đẩy nghiên cứu về lĩnh vực này ở Việt Nam.
Có một dự án “nhân văn số” đáng chú ý đang được triển khai, đó là dự án Vietnamica do Hội đồng nghiên cứu khoa học thuộc Liên minh châu Âu (ERC) tài trợ (2019 - 2024). Dự án có nhiều đơn vị trong và ngoài nước cùng phối hợp thực hiện, trong đó có Viện Khảo cứu cao cấp Pháp (EPHE), Viện Nghiên cứu Hán Nôm (Viện Hàn lâm Khoa học xã hội Việt Nam), Trường Đại học Khoa học Xã hội và Nhân văn (Đại học Quốc gia Hà Nội), Tổ chức Đại học Pháp ngữ (AUF). Dự án này nghiên cứu về bia hậu ở Việt Nam với mục tiêu phân tích và xử lý thác bản hàng ngàn văn bia cung tiến bằng chữ Hán, Nôm ở các làng xã Việt Nam từ thế kỷ XVI đến thế kỷ XX, nhằm đem lại những hiểu biết phong phú về văn hóa, lịch sử, xã hội Việt Nam thời kỳ này. Dự án cũng bao gồm việc đào tạo học viên cao học, nghiên cứu sinh.
Việt Nam hiện có nhiều điều kiện thuận lợi để thúc đẩy phát triển “nhân văn số”, như việc Chính phủ đã ban hành Chương trình Số hóa di sản văn hóa Việt Nam giai đoạn 2021 - 2030, Chương trình Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030, đang báo cáo các cấp có thẩm quyền về Chương trình mục tiêu quốc gia về phát triển văn hóa giai đoạn 2025 - 2035... Bên cạnh đó, Việt Nam có nguồn nhân lực dồi dào trong các lĩnh vực nhân văn, khoa học máy tính, lưu trữ, thông tin thư viện..., có những kho dữ liệu đa dạng về văn hóa, di sản, lịch sử, ngôn ngữ, văn học... Đó là nền tảng vững chắc cho sự phát triển và mở rộng “nhân văn số” tại Việt Nam.
“Nhân văn số” có ý nghĩa quan trọng, để thúc đẩy sự phát triển loại hình mới mẻ này, giới nghiên cứu, các nhà hoạch định chính sách cần định hình, thống nhất quan niệm về “nhân văn số”, với phương pháp tiếp cận “nhân văn số” tương đồng với cách của các nước đang phát triển “nhân văn số”, tránh sự nhầm lẫn giữa “nhân văn số” với “số hóa” nói chung. Tiếp đó, Việt Nam cũng cần phát triển cộng đồng học thuật về “nhân văn số” với đông đảo những người dạy, người học, người thực hành và tăng cường việc chia sẻ kết quả thực hành về “nhân văn số” ở trong và ngoài nước; đầu tư, phát triển các dự án nghiên cứu “nhân văn số” với sự tổ chức nhân lực liên ngành (nhân văn và công nghệ), giải quyết các bài toán nhân văn thiết yếu ở Việt Nam. Cùng với đó, việc đầu tư trang thiết bị cho đào tạo, thực hành “nhân văn số” cũng là một yêu cầu quan trọng, nhằm giúp “nhân văn số” Việt Nam thu hẹp khoảng cách với các nước trên thế giới.