Nâng tầm kỹ sư người Việt trên sản phẩm điện thoại Samsung

Ứng dụng trí tuệ nhân tạo (AI) vào xử lý ngôn ngữ tự nhiên đang là xu thế phát triển giúp xóa bỏ khoảng cách về ngôn ngữ giao tiếp giữa con người.

Là một trong những nhà sản xuất điện thoại di động hàng đầu thế giới, Samsung đã trang bị tính năng AI trên dòng điện thoại Galaxy AI đầu tiên qua tính năng phiên dịch cuộc gọi. Đáng chú ý, đội ngũ kỹ sư người Việt tại Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam đã có đóng góp quan trọng trong việc phát triển ngôn ngữ tiếng Việt - một trong 13 ngôn ngữ trên Galaxy AI có hỗ trợ phiên dịch hiện nay.

Kỹ sư làm việc tại Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam.

Phát triển ngôn ngữ cho dòng điện thoại Galaxy

Dự án hệ thống trí tuệ nhân tạo Galaxy AI được Tập đoàn Samsung phát triển cho dòng điện thoại Galaxy S24, trong đó tiếng Việt trở thành ngôn ngữ thứ 13 có hỗ trợ phiên dịch. So với các ngôn ngữ được lựa chọn, dựa trên số lượng người dùng và độ phổ biến trên thế giới, thì tiếng Việt có số lượng người sử dụng ít hơn. Song điều đó cho thấy, Việt Nam là một thị trường quan trọng và có vị trí chiến lược trong kế hoạch phát triển của Samsung.

Kể từ khi đi vào hoạt động tháng 12-2022 đến nay, Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam (SRV) có khoảng 2.400 kỹ sư làm việc và trong số đó có 10 kỹ sư người Hàn Quốc - đóng vai trò cầu nối công nghệ giúp chuyển giao công nghệ và vận hành trung tâm. “Vì vậy, khi tập đoàn giao nhiệm vụ nghiên cứu phát triển ngôn ngữ tiếng Việt trên Galaxy AI vào tháng 10-2023, SRV đã gấp rút tập hợp những nhân sự có kinh nghiệm về học máy (machine learning), học sâu (deep learning) và xử lý ngôn ngữ tự nhiên (natural language processing) từ các bộ phận khác nhau để thiết lập nhóm nghiên cứu Language AI”, đại diện Samsung Việt Nam cho biết.

Kỹ sư Trần Tuấn Minh, Trưởng nhóm nghiên cứu Language AI của SRV kể lại, vẫn nhớ cảm giác vui mừng khi được chọn vào đội AI, vì đây là lần đầu tiên trung tâm nhận một dự án chiến lược liên quan đến AI; đồng thời cảm thấy vô cùng tự hào khi được phát triển ngôn ngữ mẹ đẻ của quốc gia mình trên dòng điện thoại hiện đại bậc nhất S24… Nhưng khi bắt tay vào việc cũng không ít thách thức mà khó khăn lớn nhất là nguồn dữ liệu tiếng Việt ít hơn rất nhiều so với các ngôn ngữ khác. Rồi vấn đề ngữ pháp tiếng Việt vốn được ví “phong ba bão táp” thực sự là một thách thức, liên quan đến vấn đề như phương ngữ, từ lóng, từ đồng nghĩa, từ mượn và những từ mới của thế hệ GenZ…

“Để giải quyết những vấn đề này, SRV phải huy động hàng trăm người xử lý dữ liệu cho AI. Chúng tôi phải liên tục tạo ra dữ liệu để đào tạo AI, giúp AI hiểu và cho kết quả đầu ra chính xác. Đặc biệt, những nguồn dữ liệu này phải bảo đảm tính hợp pháp chứ không đơn thuần là dữ liệu thu thập tự do”, Trưởng nhóm nghiên cứu Language AI của SRV thông tin.

Tiếp tục tham gia nhiều dự án công nghệ

Chỉ trong một thời gian rất ngắn, đội ngũ kỹ sư SRV vừa hiệu chỉnh dữ liệu sẵn có, vừa tạo thêm nhiều dữ liệu mới để phục vụ đào tạo cho AI. Ví dụ, đội ngũ kỹ sư Việt Nam đã trực tiếp thu âm hàng triệu tệp giọng nói của cả nam lẫn nữ để giúp Galaxy S24 series thông minh hơn với người Việt Nam. Chẳng hạn, để bảo đảm tính năng dịch chính xác và nhận giọng nói trong các môi trường tiếng ồn khác nhau, các kỹ sư phải đi đến nhiều địa điểm như Hồ Gươm, trung tâm thương mại, quán cà phê nhằm thử nghiệm bảo đảm tính năng AI hoạt động tốt trong môi trường người dùng thực. “Những nỗ lực không ngừng nghỉ, chỉ trong vòng 4 tháng, từ con số 0, các kỹ sư của SRV đã tự mình làm chủ công nghệ và hoàn thiện AI cho tiếng Việt phục vụ dòng sản phẩm Galaxy S24”, đại diện Samsung Việt Nam thông tin.

Vì vậy, sản phẩm Galaxy S24 ứng dụng AI trong việc nhận giọng nói và chuyển đổi giọng nói sang văn bản (text). Khi đó, thiết bị Galaxy AI tự động nhận diện ngôn ngữ người dùng đang sử dụng thông qua tự động nhận diện giọng nói, sau đó nội dung giọng nói (speech) sẽ chuyển sang dạng văn bản, làm dữ liệu đầu vào cho quá trình xử lý tiếp theo. Ứng dụng AI để dịch từ một ngôn ngữ gốc sang ngôn ngữ đích (target language). Dữ liệu đầu vào là từ module tự động nhận diện giọng nói ASR, đầu ra là dữ liệu văn bản đã được dịch sang ngôn ngữ đích (target language) mà người dùng muốn dịch; hoặc đầu vào là văn bản (đã được dịch), đầu ra là âm thanh đọc ra từ văn bản đó...

Thông tin thêm, Giám đốc bộ phận Phát triển phần mềm của SRV Đỗ Đức Dũng cho biết: “Từ khi thành lập SRV, kỹ sư Việt Nam đã mở rộng nghiên cứu, không chỉ cho thiết bị di động, mà còn với Note PC và thiết bị viễn thông. Bằng việc chuyển giao AI, công nghệ tiên tiến nhất và quan trọng nhất của tập đoàn cho Việt Nam, Samsung đã giữ đúng lời hứa với Chính phủ Việt Nam khi quyết tâm đưa Việt Nam vượt qua vai trò là cứ điểm sản xuất để trở thành cứ điểm chiến lược về R&D của Samsung trên toàn cầu”, ông Đỗ Đức Dũng phân tích.

Bổ sung thêm thông tin, đại diện Samsung Việt Nam cho biết, SRV hiện đang nỗ lực chuyển mình từ một R&D tập trung nghiên cứu và phát triển sản phẩm sang một R&D chuyên sâu đặc thù. Trong năm 2023, với việc Samsung lần đầu tiên giới thiệu về ứng dụng trí tuệ nhân tạo tạo sinh trên các ứng dụng chỉnh sửa ảnh, đội ngũ kỹ sư của SRV đóng vai trò quan trọng trong việc phát triển và hoàn thiện nhiều tính năng thông minh ở phần mềm chỉnh sửa ảnh trên điện thoại di động.

Hiện nay, SRV đang đảm nhận nhiều dự án quan trọng của tập đoàn. Đó là nhiệm vụ phát triển toàn diện cho sản phẩm Note PC (từ cơ khí, phần cứng, phần mềm) - nền tảng để phát triển nhiều mẫu Note PC sau này. Ngoài ra, SRV cũng nhận các dự án phát triển cho các sản phẩm mạng viễn thông network và tiếp nhận chuyển giao hai mảng hoạt động chiến lược từ Hàn Quốc, gồm tính năng đa phương tiện và tính năng bảo mật trên điện thoại Samsung.

Nguồn Hà Nội Mới: https://hanoimoi.vn/nang-tam-ky-su-nguoi-viet-tren-san-pham-dien-thoai-samsung-663970.html