Microsoft đã tạo ra bước ngoặt lớn trong lĩnh vực nhận diện giọng nói bằng cách tạo ra một công nghệ nhận dạng từ ngữ trong các cuộc hội thoại tương đương với một chuyên gia ngôn ngữ có thể làm.

Cong nghe nhan dang ngon ngu cua Microsoft tao dot pha lon - Anh 1

Công nghệ nhận dạng từ của Microsoft đạt tỷ suất ngang với con người.

Các nhà nghiên cứu tại Microsoft tự hào tuyên bố, họ đã tạo ra bước ngoặt lớn trong lĩnh vực nhận diện giọng nói bằng cách tạo ra một công nghệ nhận dạng từ ngữ trong các cuộc hội thoại tương đương với một chuyên gia ngôn ngữ có thể làm.

Các nhà nghiên cứu cho biết, hệ thống nhận diện ngôn ngữ của họ mắc số lỗi ít hơn hoặc bằng so với các chuyên gia giải mã ngôn ngữ chuyên nghiệp. Cụ thể, tỷ lệ mắc lỗi đoán sai từ (WER) là 5,9%, đã giảm so với mức 6,3% đo được trong tháng trước. Tỷ lệ 5,9% là tương đương với tỷ lệ lỗi mắc phải của chuyên gia giải mã ngôn ngữ trong cùng một cuộc hội thoại và là mức thấp nhất ghi nhận được so với chuẩn nhận diện ngôn ngữ của ngành là Switchboard.

Microsoft dự định sử dụng công nghệ này với Cortana, trợ lý ngôn ngữ cá nhân trên Windows và Xbox One, cũng như trong phần mềm giải mã ngôn ngữ nói sang ký tự. Công ty tuyên bố đây là lần đầu tiên, một máy tính có thể nhận dạng từ ngữ trong một cuộc hội thoại giống như con người.

“Công nghệ của chúng tôi đã đạt được tỷ suất ngang với con người. Đây là một thành tựu mang tính lịch sử”, người đứng đầu nhóm nghiên cứu ngôn ngữ của Microsoft, Xuedong Huang, vui mừng nói.

Anh Thư theo Fonearena