Microsoft đang cho thấy những bước đi ấn tượng trong công nghệ nhận dạng giọng nói khi tạo ra một kỷ lục về tỷ lệ lỗi nhận dạng từ (WER) chỉ ở mức 5,9%.

Con số này đã giúp đội ngũ nghiên cứu và phát triển phần mềm nhận dạng giọng nói Speech & Dialog đánh bại những gì mà IBM đã đạt được trước đây. Kết quả khá gần với hiệu năng của con người và là giá trị tốt nhất trong lịch sử về công nghệ nhận dạng giọng nói. Nó cũng cao hơn so với cột mốc WER chỉ đạt ngưỡng 6,3% mà đội ngũ Speech & Dialog đạt được vào tháng trước.

Microsoft dat cot moc lich su ve cong nghe nhan dang giong noi - Anh 1

Đội ngũ các kỹ sư đang làm việc tại bộ phận Speech & Dialog của Microsoft

Người quản lý nhóm Speech & Dialog - Geoffrey Zweig đã rất hạnh phúc khi tạo ra bước đột phá mới. Ông cho biết kế quả mang tính lịch sử này là thành quả của nỗ lực không biết mệt mỏi của đội ngũ công ty trong hơn 20 năm phát triển.

Harry Shum, Phó Chủ tịch điều hành nhóm nghiên cứu trí tuệ nhân tạo của Microsoft thậm chí còn không tin vào mắt mình trước thành công quá nhanh mà công ty đã đạt được, điều mà 5 năm trước đây không ty không thể nghĩ đến.

Thành tích này của Microsoft đáng được ghi vào sách kỷ lục, nhưng nhóm Speech & Dialog khẳng định họ còn nhiều việc cần làm, bởi theo họ vẫn còn đó những sự sai sót trong việc nhận dạng giọng nói trong bối cảnh nó hoàn toàn có thể cải thiện hơn.

Ngoài ra, còn có một tỷ lệ lỗi lớn trong việc nhận diện các cuộc đối thoại liên tục dẫn đến yêu cầu thực hiện nhiều công việc hơn. Trong báo cáo từ Arxiv, phần mềm giọng nói của Microsoft chỉ đạt mức đánh giá WER là 11,9% khi thực hiện cuộc gọi trong nhà - nơi bạn bè và các thành viên gia đình thực hiện một cuộc đàm thoại mở, và hệ thống sẽ phải cố gắng hiểu và báo cáo những gì mà nó đã ghi nhận.

Tuy chỉ số WER ở mức 11,9% cũng là con số ấn tượng thì phần mềm của Microsoft vẫn còn rất nhiều cơ hội cho sự phát triển giảm tỷ lệ lỗi xuống thấp hơn nữa trong một thời gian không xa.

Dù thế nào đi chăng nữa thì kết quả mà nhóm Speech & Dialog của Microsoft đạt được sẽ mang đến rất nhiều lợi ích cho cuộc sống. Shum nói rằng bước đột phá công nghệ mới sẽ giúp Cortana trở nên mạnh mẽ hơn, làm cho nó trở thành một ứng dụng trợ lý thực sự thông minh. Có lẽ những thay đổi này sớm được áp dụng trong phiên bản cập nhật tiếp theo của trợ lý ảo Cortana dành cho nền tảng Windows 10.

Kiên Trung