Trí tuệ nhân tạo của Google đánh bại cựu vô địch cờ vây thế giới Trí tuệ nhân tạo và công nghệ hội tụ Sự thật đằng sau các sản phẩm trí tuệ nhân tạo Trí tuệ nhân tạo có mối nguy hiểm mang tên... nhận thức nhân tạo “Chìa khóa” trí tuệ nhân tạo

Trí tuệ nhân tạo của Google đánh bại cựu vô địch cờ vây thế giới Trí tuệ nhân tạo và công nghệ hội tụ Sự thật đằng sau các sản phẩm trí tuệ nhân tạo Trí tuệ nhân tạo có mối nguy hiểm mang tên... nhận thức nhân tạo “Chìa khóa” trí tuệ nhân tạo

Phần mềm Deep Learning (học sâu) đang dẫn dắt cuộc cách mạng trí tuệ nhân tạo đương đại và vận hành trên hầu hết các phần cứng máy tính chuẩn. Một số công ty công nghệ lớn như Google và Intel đã tập trung không ít nguồn lực đáng kể nhằm tạo ra chip máy tính chuyên biệt hơn dành cho Deep Learning. Tuy nhiên, IBM đã tiếp cận theo cách khác thường: thử nghiệm TrueNorth, chip lấy cảm hứng phát triển dựa trên não người, vận hành như một nền tảng phần cứng dành cho Deep Learning.

TrueNorth - chip mo phong nao cua IBM - Anh 1

TrueNorth, chip lấy cảm hứng phát triển dựa trên não người, vận hành như một nền tảng phần cứng dành cho Deep Learning

Khả năng học sâu mạnh dựa trên thuật toán gọi là Convolution Neuron Networks (mạng nơ-ron kết hợp) bao gồm các lớp nút (node) máy tính (còn được gọi là neuron - tế bào thần kinh). Những mạng nơ-ron như vậy có thể lọc một lượng lớn dữ liệu thông qua các lớp tính toán "sâu" để xử lý tốt hơn, chẳng hạn, việc tự động nhận diện mặt từng người hoặc hiểu các ngôn ngữ khác nhau. Đây là những năng lực công nghệ đã tạo ra sức mạnh cho những dịch vụ trực tuyến của Google, Facebook, Amazon, và Microsoft.

Trong nghiên cứu gần đây, IBM đã cho thấy những thuật toán sâu như vậy có thể chạy trên phần cứng mô phỏng não , mà thường chỉ hỗ trợ một loại mạng nơ-ron rất khác biệt.

IBM đã công bố một báo cáo khoa học về đề tài này vào ngày 9 tháng 9 năm 2016 trên chuyên san Proceedings của Viện Hàn lâm khoa học quốc gia Mỹ. Nghiên cứu này được DARPA tài trợ với mức kinh phí dưới 1 triệu USD. Khoản tài trợ này chỉ là một phần của chương trình Bộ xử lý vỏ não (Cortical Processor) của DARPA nhằm phát triển Trí tuệ nhân tạo (AI) lấy cảm hứng từ bộ não con người mà có thể nhận ra các mẫu hình phức tạp và thích ứng với môi trường thay đổi.

"Cột mốc mới minh chứng rõ rệt cho 1 khái niệm - đó là hiệu suất của điện toán mô phỏng não có thể phối hợp cùng hiệu quả của việc học sâu, mở đường cho một thế hệ chip và thuật toán mới với hiệu quả và hiệu suất cao hơn”, ông Dharmendra Modha, nhà khoa học đứng đầu lĩnh vực điện toán mô phỏng não tại trung tâm IBM Research -Almaden, tại San Jose, California, nói.

TrueNorth - chip mo phong nao cua IBM - Anh 2

Dharmendra Modha, nhà khoa học đứng đầu lĩnh vực điện toán mô phỏng não tại trung tâm IBM Research -Almaden, tại San Jose, California

IBM lần đầu đưa ra các thông số kỹ thuật cho TrueNorth và một mẫu thử nghiệm chip trong năm 2011. Vì vậy, TrueNorth xuất hiện trước thời điểm — và do đó không được thiết kế đặc biệt để khai thác cuộc cách mạng Deep Learning dựa trên mã mạng nơ-ron đã diễn ra bắt đầu từ năm 2012. Thay vào đó, TrueNorth thường hỗ trợ những mạng nơ-ron xung điện có cấu trúc mô phỏng cách vận hành của tế bào thần kinh trong các bộ não sinh học.

Thay vì bắn tín hiệu theo chu kỳ, các tế bào thần kinh trong mạng nơ-ron xung điện phải dần dần xây dựng năng lực trước khi có thể phát tín hiệu. Để đạt được độ chính xác trong các nhiệm vụ học sâu, mạng nơ-ron xung điện thường phải đi qua nhiều chu kỳ để có kết quả trung bình. Việc đó khiến việc tính toán tổng thể các nhiệm vụ như xử lý nhận hình ảnh hoặc ngôn ngữ chậm lại.

Các chuyên gia về Deep Learning thường xem mạng nơ-ron xung điện không có hiệu suất - ít nhất, so với mã mạng nơ-ron kết hợp - cho mục đích của học sâu. Yann Le Cun, giám đốc của nghiên cứu AI tại Facebook và một nhà tiên phong trong việc học sâu, trước đây đã chỉ trích chip IBM TrueNorth vì nó chủ yếu hỗ trợ mạng nơ-ron xung điện.

Thiết kế IBM TrueNorth có thể hỗ trợ tốt hơn các mục tiêu của điện toán mô phỏng não người (neuromorphic computing) vốn tập trung bắt chước và tìm hiểu não bộ sinh vật, ông Zachary Chase Lipton, một nhà nghiên cứu thuộc Nhóm Trí tuệ Nhân tạo của đại học California tại San Diego cho biết. Theo so sánh, các nhà nghiên cứu học sâu quan tâm đến kết quả thực tế của các sản phẩm và dịch vụ dựa trên trí tuệ nhân tạo AI. Ông giải thích sự khác biệt như sau: “Để gợi những ẩn dụ cũ rích như chim và máy bay, bạn có thể cho rằng cộng đồng khoa học điện toán thần kinh có thể quan tâm nhiều hơn đến chuyện nghiên cứu các loài chim, và cộng đồng máy họ quan tâm hơn đến khí động học, dù có hoặc không sự giúp đỡ của bên sinh học. Cộng đồng Deep Learning thường tập trung khia thác những lợi ích của phần cứng chuyên biệt . [Do đó,] các chip neuromorphic không thu hút nhiều vì mạng nơ-ron xung điện không phổ biến trong lĩnh vực Deep Learning”.

Để làm cho chip TrueNorth phù hợp cho Deep Learning, IBM đã phát triển một thuật toán mới cho phép mạng nơron kết hợp chạy tốt trên phần cứng điện toán mô phỏng não người (neuromorphic). Cách tiếp cận kết hợp này đã đạt được những gì IBM mô tả là "đỉnh cao nghệ thuật" trong hoạt động phân loại chính xác với 8 bộ dữ liệu liên quan đến hoạt động xử lý nhận diện và ngôn ngữ. Họ đã ghi nhận từ độ chính xác từ 65 phần trăm đến 97 phần trăm trong các trường hợp tốt nhất.

Khi chỉ dùng một TrueNorth chip, kết quả đạt được vượt qua độ chính xác của một trong tám bộ dữ liệu đỉnh cao. Nhưng các nhà nghiên cứu của IBM đã có thể tăng độ chính xác của phần cứng khi tính toán học sâu bằng cách sử dụng lên đến 8 chip. Điều đó cho phép TrueNorth đạt hiệu quả ngang hay hơn ba bộ dữ liệu.

Đợt thử nghiệm TrueNorth cũng cho thấy chip này có thể xử lý hình ảnh từ 1.200 đến 2.600 khung hình/giây. Có nghĩa là một chip TrueNorth duy nhất có thể nhận diện các mẫu trong thời gian thực giữa từ số lượng nhiều đến 100 máy ảnh cùng một lúc, Modha nói. Quá trình test này giả định sử dụng máy quay xử lý khung hình có kích cỡ 1.024 pixel (32 x 32) và truyền hình ảnh theo tốc độ 24 khung hình / giây của chuẩn TV.

Kết quả như vậy có lẽ là ấn tượng nhất đối với lần đột phá đầu tiên của TrueNorth vào lĩnh vực học sâu, nhưng không phải không có sạn, Lipton nói. Ông chỉ ra rằng bộ dữ liệu nhận diện hình ảnh có những vấn đề nhỏ với những hình ảnh 32 x 32 pixel.

Tuy nhiên, Modha của IBM vẫn đầy hứng khởi tiếp tục thử nghiệm TrueNorth cho Deep Learning. Ông và các đồng nghiệp hy vọng để kiểm tra chip này trong các tác vụ mang tên “học sâu không bị giới hạn”, theo đó thực hiện hạn chế phần cứng dần dần trong quá trình tập huấn trí tuệ nhân tạo thay vì hạn chế ngay từ đầu.

Modha cũng chỉ ra rằng thiết kế chung của TrueNorth có lợi thế so với phần cứng được thiết kế chuyên biệt cho học sâu mà chỉ chạy trên mạng nơ-ron kết hợp. Công nghệ này có khả năng cho phép chạy nhiều loại mạng AI trên cùng một chip.

"Không chỉ TrueNorth có khả năng thực hiện triển khai các mạng neuron tích chập, mà nó vốn không được thiết kế cho mục đích này, nhưng nó cũng hỗ trợ nhiều mô hình kết nối và cùng một lúc có thể thực hiện nhiều loại thuật toán khác”, Modha nói.

Chip lấy cảm hứng từ sinh học như vậy có lẽ sẽ phổ biến chỉ khi chúng chứng minh rằng có thể mang lại kết quả vượt trội hơn các phương pháp tiếp cận phần cứng khác đối với Deep Learning, Lipton nói. Nhưng ông đề nghị rằng IBM có thể tận dụng của nó chuyên môn phần cứng để gia nhập Google và Intel trong việc tạo ra các chip chuyên ngành mới được thiết kế đặc biệt cho việc học sâu.

"Tôi hình dung rằng một số hãng sản xuất chip mô phỏng não sẽ tận dụng hiểu biết chuyên sâu của họ trong lĩnh vực tăng tốc phần cứng để phát triển chip tập trung hơn vào các ứng dụng máy học sâu thực tế và ít tập trung vào việc mô phỏng sinh học”, Lipton nói.