AI có thể giúp bảo tồn các ngôn ngữ bản địa

Ngôn ngữ bản địa người Māori (thuộc nhóm dân tộc Polynesia bản xứ tại New Zealand), còn gọi là 'te reo', đang được bảo tồn bởi AI…

Tại New Zealand, một đài truyền hình địa phương đang tập trung vào sứ mệnh bảo tồn ngôn ngữ bản địa người Māori bằng AI.

Liên Hợp Quốc cho biết 96% trong khoảng 6.700 ngôn ngữ trên thế giới chỉ được 3% dân số sử dụng. Mặc dù nhóm dân tộc bản địa chỉ chiếm chưa đến 6% dân số toàn cầu nhưng sở hữu tới hơn 4.000 ngôn ngữ đa dạng, theo Tech Wire Asia.

NGÔN NGỮ BẢN ĐỊA DẦN BỊ LÃNG QUÊN

Nhưng vấn đề đáng lo ngại là khoảng 3.000 ngôn ngữ bản địa có thể biến mất trước cuối thế kỷ này. Nói một cách đơn giản, nhiều ngôn ngữ địa phương đang có nguy cơ tuyệt chủng nếu không có biện pháp bảo tồn hợp lý.

Theo truyền thống, ngôn ngữ dân tộc được truyền từ thế hệ này sang thế hệ khác. Tuy nhiên, khi xã hội phát triển và một số ngôn ngữ trở nên phổ biến toàn cầu như tiếng Anh, tiếng Quan Thoại và tiếng Tây Ban Nha chiếm ưu thế trong giao tiếp, người dân đã dần lãng quên và không còn mặn mà với ngôn ngữ địa phương.

Ngày nay, trung bình số lượng người dân còn sử dụng ngôn ngữ bản địa chỉ còn vài trăm người hoặc ít hơn trên một cộng đồng. Nếu không bảo tồn, những di sản ngôn ngữ này cuối cùng đều trở thành ký ức - và chỉ được nhắc đến trong giai thoại lịch sử.

TRÍ TUỆ NHÂN TẠO (AI) GIẢI CỨU NGÔN NGỮ BẢN ĐỊA NHƯ THẾ NÀO?

New Zealand, một đài truyền hình hiện đang nỗ lực bảo tồn ngôn ngữ bản địa người Māori, gọi là “te reo”, bằng AI. Cụ thể, đài truyền hình Te Hiku Media đang phát triển mô hình Nhận dạng Giọng nói Tự động (ASR) dành riêng cho “te reo”. Mô hình được định vị trở thành phương pháp thu thập và phân tích dữ liệu giọng nói minh bạch, có đạo đức với mục tiêu duy trì chủ quyền ngôn ngữ cho người Maori.

Được xây dựng bằng bộ công cụ Nvidia NeMo mã nguồn mở dành cho ASR và GPU Nvidia A100 Tensor Core, mô hình chuyển giọng nói thành văn bản phiên âm “te reo” có độ chính xác lên tới 92%. Hệ thống cũng có thể phiên âm song ngữ tiếng Anh và “te reo” với độ chính xác 82%. ASR là công cụ quan trọng, được tạo ra và dành riêng cho người Māori, giúp bảo tồn và lan tỏa câu chuyện của cả một bộ tộc.

Ông Keoni Mahelona, Giám đốc Công nghệ Te Hiku Media, cho biết: “Công nghệ nguồn mở của Nvidia đóng góp giá trị to lớn trong việc xây dựng bộ công cụ mà chúng tôi cần để đạt được sứ mệnh thiêng liêng, đó là bảo tồn, quảng bá và phục hồi tiếng ‘te reo’ Māori”.

Vị CTO cũng thuộc cộng đồng người Hawaii bản địa sinh sống tại New Zealand: “Chúng tôi cũng đang định hướng ngành về cách sử dụng dữ liệu và công nghệ có đạo đức, đảm bảo công nghệ được sử dụng để trao quyền cho một số cộng đồng thiểu số”.

Trước lo ngại về quyền riêng tư, bản quyền và nhiều vấn đề khác khi tải video và âm thanh lên các mạng xã hội phổ biến toàn cầu, Te Hiku Media quyết định xây dựng nền tảng phân phối nội dung của riêng hãng. Được gọi là Whare Kōrero, nền tảng hiện chứa tài liệu lưu trữ số hóa có giá trị hơn 30 năm với khoảng 1.000 giờ nói tiếng “te reo” từ người bản xứ.

Giám đốc Mahelona nói: “Đó là nguồn dữ liệu âm thanh vô giá”.

Te Hiku Media phát triển mô hình Nhận dạng Giọng nói Tự động (ASR) dành cho “te reo”, ngôn ngữ địa phương của người Māori.

Bất chấp thành công sớm của nền tảng, nhóm đã sớm nhận ra quy trình sao chép dữ liệu thủ công đòi hỏi nhiều thời gian và công sức từ nguồn lực hạn chế. Do đó, Te Hiku Media đã quyết định áp dụng AI nhằm đẩy nhanh tiến độ bằng cách sử dụng ASR.

QUY TRÌNH RÕ RÀNG, MINH BẠCH

Để thu thập dữ liệu giọng nói một cách minh bạch, tuân thủ đạo đức và hướng tới cộng đồng, Te Hiku Media bắt đầu dự án từ nhóm đối tượng lớn tuổi, thu hút sự ủng hộ và yêu cầu nhóm đến đài truyền hình đọc to những cụm từ bản ngữ.

CTO Mahelona chia sẻ: “Điểm mấu chốt là chúng tôi có được sự hỗ trợ của bộ phận người lớn tuổi. Chúng tôi đã ghi âm giọng nói của họ vì đó là loại nội dung mà chúng tôi muốn sao chép lại. Nhưng cuối cùng, những nỗ lực này không thể mở rộng quy mô — chúng tôi cần đến những người học ngôn ngữ thứ hai, trẻ em, nhóm trung niên và nhiều dữ liệu về giọng nói hơn nữa để hoàn thành mô hình”.

Ngoài công cụ AI nguồn mở, Te Hiku Media còn sử dụng mô-đun Nvidia NeMo trong toàn bộ quy trình. Bộ công cụ NeMo bao gồm các khối xây dựng được gọi là mô-đun thần kinh và nhiều mô hình được đào tạo trước để phát triển ngôn ngữ.

Những nỗ lực đã thúc đẩy một vài dự án ASR tương tự hiện được thực hiện bởi cộng đồng người Hawaii bản địa và người Mohawk ở phía đông nam Canada.

Thành công bảo tồn ngôn ngữ bản địa bằng AI cho thấy một trong nhiều lợi ích mà công nghệ trí tuệ nhân tạo có thể mang lại cho xã hội. Mặc dù quá trình ban đầu gặp nhiều thách thức nhưng khi LLM được đào tạo với bộ dữ liệu hoàn chỉnh, hệ thống có thể vừa học vừa vận hành với tốc độ nhanh hơn rất nhiều.

Cũng giống như các trường hợp sử dụng AI để dịch thuật hiện nay, khả năng bảo tồn ngôn ngữ bản địa của trí tuệ nhân tạo có thể là giải pháp cần thiết để đảm bảo tiếng nói từ hàng trăm, hàng nghìn dân tộc thiểu số không bị lãng quên.

Giám đốc Mahelona kết luận: “Chính dự án do người bản địa lãnh đạo đã truyền cảm hứng cho nhiều nhóm dân tộc thiểu số khác nghĩ rằng: 'Nếu họ làm được thì chúng ta cũng có thể làm được'”.

Bảo Ngọc

Nguồn VnEconomy: https://vneconomy.vn/ai-co-the-giup-bao-ton-cac-ngon-ngu-ban-dia.htm