AlphaGo Zero tự học cờ vây để thắng cả phiên bản tiền nhiệm từng vô địch thế giới

20/10/2017Gốc

Công trình nghiên cứu về trí thông minh nhân tạo AlphaGo Zero vừa có được những thành quả lớn khi nó đã tự học để vượt qua mọi phiên bản AlphaGo trước đó.

DeepMind - công ty con của Google vốn nổi tiếng với việc chế tạo thành công phần mềm đánh cờ vây thông minh đến mức có thể đánh bại được kiện tướng thế giới ở bộ môn này. Mới đây, phiên bản tiếp theo của phần mềm này là AlphaGo Zero đã chính thức trình làng với cơ chế "tự học hỏi hoàn toàn mà không cần đến sự giúp sức của con người".

40 ngày là khoảng thời gian ngắn kỉ lục để Zero vượt qua được con người và các phiên bản trước đây ở bộ môn cờ vây.

Trước đây, phiên bản AlphaGo gốc đã rất thông minh nhưng nó cần phải sử dụng dữ liệu ghi nhận được từ hơn 100 ngàn ván cờ vây khác nhau được chơi bởi con người. Trong khi đó, AlphaGo Zero chỉ được lập trình để nhận thức được luật chơi cơ bản của môn cờ vây, còn "quá trình để bước lên ngôi vị đỉnh cao" là từ những lần tự học hỏi khi chơi với các đối thủ thật sự. Và kết quả cho ra thật bất ngờ khi chỉ cần 3 ngày tự học hỏi, Zero đã đủ mạnh và thông minh đến mức có thể dành chiến thắng trước phiên bản AlphaGo từng đánh bại Lee Se-dol - kiện tướng thế giới ở bộ môn này. Và sau 40 ngày, Zero đã có tỉ lệ dành chiến thắng lên đến 90% đối với tất cả các phiên bản AlphaGo từ trước đến nay.

Trưởng dự án AlphaGo, ông Davil Silver cho biết thông qua việc tự học hỏi, phần mềm Zero đã tự mày mò và tổng hợp được các chiến thuật cờ vây của con người trong hàng thiên niên kỷ qua. thông qua đó, trí thông minh nhân tạo này sẽ phân tích những chiến lực mà con người hay sử dụng, sau đó mang ra thử áp dụng và cuối cùng tự tạo nên cho mình những cách đánh riêng trong bộ môn cờ vây.

Về mặt kỹ thuật, cơ chế tự học hỏi đã giúp AlphaGo Zero "tiết kiệm tài nguyên" hơn các phiên bản cũ rất nhiều khi chỉ sử dụng 4 bộ xử lý thông minh nhân tạo TPU so với trước đây là 48 TPU. Qua đây, các nhà lập trình hy vọng sẽ mở ra một chương mới trong quá trình nghiên cứu trí thông minh nhân tạo với các thuật toán cao cấp hơn nhưng đồng thời giảm sự "cồng kềnh" của hệ thống phần cứng.

Về ứng dụng của trí nhân thông minh nhân tạo AI thông qua sự thành công của AlphaGo Zero, người đồng sáng lập công ty DeepMind - Demis Hassabis cho biết bản chất của Zero vốn không đượclập trình để hiểu rõ về cờ vây như những phiên bản trước đây, thay vào đó là sự tự học hỏi trong quá trình chơi. Vì thế, phần mềm này có thể hoàn toàn được lập trình lại để ứng dụng vào những lĩnh vực khác như: nghiên cứu thuốc, hóa học lượng tử, vật lý và vật liệu sản xuất...

Hassabis cũng bật mí về việc phiên bản kế tiếp theo của AlphaGo Zero có thể được áp dụng để nghiên cứu chất siêu dẫn hoạt động được ở nhiệt độ phòng. Theo đó, thuật toán này sẽ tiến hành nghiên cứu, kết hợp các thành phần, vật liệu với nhau theo nhiều cách cho đến khi nó tìm ra được những thứ mà các nhà khoa học có thể đã bỏ sót trong thời gian qua.

Có thể thấy thằng trí thông minh nhân tạo không phải là những cỗ máy có phép màu mà đó là cả một quá trình học hỏi, phân tích, rút kinh nghiệm và tìm ra được cách thức tối ưu nhất - hoàn toàn giống với những gì con người đã làm từ trước đến nay - tất nhiên là với tốc độ, sự chính xác cao hơn rất nhiều.

Gia Phạm

Nguồn Nghe Nhìn VN: http://nghenhinvietnam.vn/khoa-hoc/alphago-zero-tu-hoc-co-vay-de-thang-ca-phien-ban-tien-nhiem-tung-vo-dich-the-gioi-30972.html