Công cụ tạo video Sora 'dội nước lạnh' vào tham vọng AI của Trung Quốc

Việc OpenAI (Mỹ) công bố Sora, công cụ tạo video bằng lệnh văn bản, buộc ngành công nghiệp trí tuệ nhân tạo (AI) của Trung Quốc một lần nữa phải vật lộn để bắt kịp công nghệ mới nhất trong bối cảnh Mỹ siết chặt các hạn chết xuất khẩu chip cao cấp.

Các nhà chuyên môn nhận định, Trung Quốc sẽ chật vật chạy đua để phát triển các công cụ tạo video bằng mệnh lệnh văn bản như Sora của OpenAi. Ảnh: SCMP

Vẫn còn khoảng cách so với công nghệ AI hàng đầu

Tuần trước, OpenAI, nhà phát triển ChatGPT, thông báo đang thử nghiệm công cụ AI chuyển văn bản video có tên gọi “Sora”, cho phép người dùng tạo video chân thực với những mệnh lệnh đơn giản. Quyền truy cập vào Sora hiện bị hạn chế. Sora không phải là nguồn mở và chỉ một số ít người có quyền truy cập vào bản dùng thử của mộ hình này.

Sora được xem là cảnh báo mới đối với Trung Quốc về khoảng cách của nước này với các công nghệ AI hàng đầu thế giới. Đồng thời, cũng ra câu hỏi tại sao nước này không phát triển sản phẩm tương tự dù các nhà nghiên cứu và nhà đầu tư trong nước chạy đua quyết liệt để phát triển các công cụ AI sau khi OpenAI ra mắt ChatGPT vào cuối 2022.

Chỉ vài năm trước, Trung Quốc đặt mục tiêu thống trị cuộc đua AI toàn cầu bằng cách tận dụng kho dữ liệu khổng lồ của đất nước để phát triển các ứng dụng hoàn thiện cho các chức năng như nhận dạng khuôn mặt. Những phát triển gần đây về AI tạo sinh, sử dụng các mô hình ngôn ngữ lớn (LLM) để tạo ra nội dung như văn bản, hình ảnh và video, đã thay đổi các tính toán, khiến Trung Quốc một lần nữa tụt hậu.

Công cụ Sora, được OpenAI tiết lộ vào ngày 16-2, đưa cuộc chiến AI sang lĩnh vực sản xuất video. Tuy nhiên, Trung Quốc lại thiếu khả năng tiếp cận các công cụ quan trọng như chip xử lý đồ họa (GPU) tiên tiến do Nvidia, nhà thiết kế chip AI hàng đầu phát triển, do các hạn chế xuất khẩu của Mỹ. Những công ty AI ưu tú nhất của Trung Quốc đã chậm hơn nhiều năm so với các công ty cùng ngành của Mỹ trong lĩnh vực AI tạo sinh.

Zhou Hongyi, người sáng lập Công ty bảo mật internet 360 Security Technology của Trung Quốc, đã tham gia cuộc đua để ra mắt mô hình ngôn ngữ lớn kiểu ChatGPT. Ông cho biết, sự xuất hiện của Sora giống như “thùng nước lạnh đổ xuống đầu Trung Quốc”.

“Nó làm nguội đi cái đầu của nhiều người, buộc chúng tôi phải nhìn nhận khoảng cách với các công ty AI hàng đầu ở nước ngoài”, Hongyi nói.

Đến nay, các công ty Trung Quốc bao gồm các tên tuổi công nghệ hàng đầu như Baidu, Tencent, Alibaba, đã phát triển tổng cộng 200 LLM. Tuy nhiên, rất ít công ty có những công cụ AI có thể sánh ngang với Sora, một phần vì họ chưa sử dụng kiến trúc học sâu mới lạ, có tên gọi Diffusion Transformer (DiT)

ByteDance, chủ sở hữu TikTol, cho biết, công cụ điều khiển chuyển động video Boximator, do công ty này phát triển, có thể sử dụng để hỗ trợ tạo video. Tuy nhiên, ByteDance thừa nhận Boximator còn ở giai đoạn sơ khai và chưa sẵn sàng để phát hành rộng rãi.

“Nó vẫn có khoảng cách lớn với các mô hình tạo video hàng đầu về chất lượng hình ảnh, độ trung thực và thời lượng”, ByteDance cho biết.

Một nhà phát triển Trung Quốc, người từ chối nêu tên, cho rằng điều cần làm đầu tiên của các kỹ sư AI Trung Quốc là “giải mã Sora và huấn luyện nó bằng dữ liệu của chính họ để tạo ra một sản phẩm tương tự”.

Xu Liang, doanh nhân AI ở thành phố Hàng Châu, tin rằng không lâu nữa Trung Quốc sẽ có các công cụ tương tự. Dù vậy, ông lưu ý, vẫn có thể một khoảng cách đáng kể giữa các sản phẩm Trung Quốc và Sora.

Wang Shuyi, giáo sư nghiên cứu AI và học máy tại Đại học Sư phạm Thiên Tân (TJNU), cho rằng kinh nghiệm phát triển LLM trong năm qua cho phép các hãng công nghệ hàng đầu Trung Quốc xây dựng chuyên môn trong lĩnh vực này và tích trữ phần cứng cần thiết, giúp họ có khả năng sản xuất các sản phẩm giống Sora trong sáu tháng tới.

Thiếu chip cao cấp, dữ liệu chất lượng và nhân tài

Lu Yanxia, giám đốc nghiên cứu về công nghệ mới nổi của IDC China, dự báo những gã khổng lồ công nghệ như Baidu, Alibaba và Tencent sẽ là những công ty đầu tiên triển khai các dịch vụ tương tự Sora. Bà cho biết, những công ty AI trong nước như iFlyTek, SenseTime và Hikvision, tất cả đều bị Washington trừng phạt, cũng sẽ tham gia cuộc đua.

Tuy nhiên, theo các nhà phân tích, Trung Quốc vẫn đối mặt với một trận chiến khó khăn khi thị trường công nghệ của nước này ngày càng trở nên tách biệt với thế giới về vốn, phần cứng, dữ liệu và thậm chí cả con người.

Khoảng cách giá trị thị trường giữa các công ty công nghệ hàng đầu của Trung Quốc so với các công ty ở Mỹ như Microsoft, Google và Nvidia mở rộng đáng kể trong những năm gần đây.

Dù Trung Quốc từng được coi là có lợi thế về số lượng dữ liệu, Lu Yanxia cho biết, bên cạnh việc thiếu chip tiên tiến, nước này hiện cũng thiếu dữ liệu chất lượng cần thiết để đào tạo các mô hình AI mới hơn như Sora.

Theo Lu, thiếu nhân tài là một mối lo ngại khác, vì những người giỏi nhất và sáng giá nhất trong lĩnh vực AI của đất nước thường dễ dàng tỏa sáng hơn khi làm việc cho những công ty hàng đầu ở Mỹ.

Tuy nhiên, ngay cả khi có những tài năng cần thiết, các chuyên gia đặt câu hỏi liệu AI tạo sinh trong nước của Trung Quốc có thể tiến xa đến đâu khi đối mặt với những hạn chế xuất khẩu công nghệ của Mỹ.

Công ty chứng khoán Ping An Securities nhận định, các hạn chế xuất khẩu chip cao cấp của Mỹ có thể đẩy nhanh sự trưởng thành của ngành công nghiệp chip AI trong nước, nhưng các lựa chọn thay thế trong nước có thể tốt không như mong đợi.

Washington đã chặn các công ty Trung Quốc tiếp cận các công cụ bán dẫn tiên tiến nhất thế giới thông qua các hạn chế đối với các sản phẩm liên quan bao gồm bất kỳ công nghệ nào có nguồn gốc từ Mỹ. Vào tháng 10, Mỹ lại thắt chặt những hạn chế đó, chặn quyền tiếp cận của Trung Quốc đối với các chip xử lý đồ hóa ( GPU) mà Nvidia đã thiết kế đặc biệt cho khách hàng Trung Quốc để ứng phó những hạn chế trước đó.

Alexander Harrowell, nhà phân tích về điện toán tiên tiến tại hãng tư vấn và nghiên cứu công nghệ Omdia, lưu ý Trung Quốc có các lựa chọn ngoài GPU để đào tạo LLM. “Bạn có thể sử dụng bộ xử lý Tensor (TPU) của Google, chip Ascend của Huawei, chip máy học Trainium của AWS (đơn vị điện toán đám mây của Amazon) hoặc một trong số ít sản phẩm chip khác của các công ty khởi nghiệp”, ông nói.

Nhưng việc sử dụng các sự lựa chọn thay thế GPU sẽ không mang lại hiệu quả cao. “Bạn càng đi xa khỏi con đường GPU, bạn sẽ càng tốn nhiều công sức hơn trong việc phát triển phần mềm và quản trị hệ thống”, Harrowell cảnh báo.

Theo doanh nhân Xu Liang, sẽ có những cơ hội dành riêng cho thị trường Trung Quốc. “Với việc các báo cáo kỹ thuật về Sora đã công bố và các mô hình video nguồn mở sắp ra mắt, sẽ có nền tảng để người chơi Trung Quốc học hỏi”, ông nói.

Theo SCMP

Khánh Lan

Nguồn Saigon Times: https://thesaigontimes.vn/cong-cu-tao-video-sora-doi-nuoc-lanh-vao-tham-vong-ai-cua-trung-quoc/