Thị Trường

Phòng thí nghiệm AI nhỏ bé ở Trung Quốc khiến giới công nghệ sửng sốt

DeepSeek – phòng thí nghiệm AI (trí tuệ nhân tạo) nhỏ của Trung Quốc đã thu hút sự chú ý của cả thế giới công nghệ khi tiết lộ mô hình kỹ thuật tiên tiến. Công bố khoa học này đã biến nhà lãnh đạo ẩn dật của phòng thí nghiệm trở thành người hùng dân tộc, thách thức mọi nỗ lực của Mỹ nhằm ngăn chặn tham vọng công nghệ của Trung Quốc.

Startup ‘vô danh’ gây chấn động Thung lũng Silicon

Trong báo cáo vừa được công khai, DeepSeek cho biết họ được thành lập bởi Liang Wenfeng. Mô hình ngôn ngữ lớn R1 – được phát triển từ nguồn ngân sách cá nhân – có thể tự động học, cải thiện mà không cần sự giám sát của con người. Đây là điều các công ty công nghệ lớn của Mỹ như Google DeepMind, OpenAI đã đổ nhiều tiền bạc vào nghiên cứu.

Trong khi DeepSeek công khai toàn bộ “công thức huấn luyện AI” tiên tiến của mình, OpenAI vẫn giữ bí mật về mô hình o1 mới nhất.

Ứng dụng DeepSeek trên kho ứng dụng của Apple

Sự xuất hiện R1 đã thổi bùng lên cuộc tranh luận sôi nổi tại Thung lũng Silicon về việc các công ty AI của Mỹ như Meta, Anthropic vốn có lợi thế về nguồn lực nhưng có đủ sức để đảm bảo lợi thế dẫn đầu về kỹ thuật so với một phòng thí nghiệm nhỏ bé của Trung Quốc.

Cách đó nửa vòng Trái đất, Liang đang trở thành niềm tự hào của Trung Quốc. Tuần này, ông là nhà lãnh đạo AI duy nhất được chọn tham dự cuộc họp của các doanh nhân với Thủ tướng Lý Cường.

Người hùng vô danh của thế giới AI

Hành trình của DeepSeek bắt đầu từ năm 2021 khi Liang mua hàng nghìn bộ xử lý đồ họa Nvidia cho dự án AI phụ, khi điều hành quỹ giao dịch lượng tử High-Flyer. Những người trong ngành coi đó là hành động lập dị của kẻ thừa tiền muốn tìm kiếm gì đó vui vẻ.

“Lần đầu tiên gặp mặt, Liang xuất hiện với hình ảnh mọt sách chính hiệu với đầu tóc rối bời, hăng say nói về cụm máy tính 10.000 chip để đào tạo mô hình của riêng mình. Lúc đấy chúng tôi không nghĩ anh ấy nghiêm túc”, Business Insider dẫn lời đối tác của Liang.

Người này nói Liang gần như không thể diễn đạt đầy đủ tầm nhìn của mình ngoài việc nói rằng: “Tôi muốn xây dựng dự án này và nó sẽ là thay đổi lớn”. Khi đó, mọi người đều cho rằng những mục tiêu như vậy chỉ có thể thực hiện được từ những gã khổng lồ như ByteDance hay Alibaba.

Trước khi được cả thế giới biết đến và trở thành niềm tự hào của Trung Quốc, Liang như một người vô danh, đứng bên dòng chảy AI. Ông bắt đầu xây dựng sự nghiệp của mình với các thuật toán liên quan đến giá cổ phiếu. Nhóm của Liang đã kiếm được tiền từ việc dùng chip Nvidia để đào tạo AI giao dịch cổ phiếu. Năm 2023, mô hình DeepSeek được ra đời với mục tiêu phát triển AI ở cấp độ con người.

Công thức bí mật của DeepSeek

Đến giờ Liang vẫn kín tiếng trước truyền thông. Những người ở cạnh cho biết Liang đã xây dựng được một đội ngũ cơ sở hạ tầng đặc biệt, những người thực sự hiểu cách thức hoạt động của các con chip, thay vì đơn thuần là các thuật toán học máy. Một nhà sáng lập startup AI đối thủ của DeepSeek nói: “Ông ấy đã đưa những người giỏi nhất của mình từ quỹ đầu cơ đến DeepSeek”.

Sau khi Mỹ dựng hàng rào cấm Nvidia xuất khẩu chip mạnh nhất sang Trung Quốc, các công ty địa phương buộc phải tìm đường mới để tối đa hóa sức mạnh tính toán. Nhóm của Liang đã tìm ra cách giải quyết vấn đề.

Phòng thí nghiệm AI nhỏ bé ở Trung Quốc khiến giới công nghệ sửng sốt- Ảnh 2.

Giao diện DeepSeek trên máy tính

Một nhà nghiên cứu AI thân cận với công ty cho biết: “Các kỹ sư của DeepSeek biết cách khai thác tiềm năng của những GPU này, ngay cả khi chúng không sở hữu công nghệ tiên tiến nhất”. Thay vì tập trung vào việc bảo vệ các nghiên cứu, đội ngũ của Liang lại sẵn sàng chia sẻ các đột phá với các công ty AI khác. Họ cũng không đề cao việc thương mại hóa. Đến nay phòng thí nghiệm nhỏ này vẫn chưa huy động vốn từ các quỹ bên ngoài hoặc có những dịch vụ để kiếm tiền từ mô hình.

Mô hình hoạt động của DeepSeek khiến nhiều người nghĩ đến những ngày đầu của DeepMind khi chỉ tập trung vào nghiên cứu và kỹ thuật.

Niềm tự tôn dân tộc

Liang dùng tiền kiếm được từ các giao dịch chứng khoán để trả lương cao cho các tài năng AI. Dù là phòng thí nghiệm nhỏ, mức đãi ngộ của DeepSeek lại tương đương ByteDance. Văn phòng của họ như một khuôn viên trường đại học, hội tụ các nhà nghiên cứu nghiêm túc. Đội ngũ nhân sự chủ chốt là các tiến sĩ đến từ những trường đại học hàng đầu Trung Quốc thay vì những tài năng được đào tạo từ Mỹ.

Trong một cuộc phỏng vấn với báo chí trong nước năm ngoái, Liang cho biết nhóm cốt lõi của ông “không có những người từ nước ngoài trở về. Họ đều là người địa phương… Chúng tôi phải tự mình phát triển những tài năng hàng đầu”. Bản sắc của DeepSeek là một công ty LLM hoàn toàn của Trung Quốc. Điều này đã trở thành biểu tượng của niềm tự tôn dân tộc.

DeepSeek tuyên bố họ chỉ sử dụng 2.048 chip Nvidia H800 và 5,6 triệu USD để đào tạo mô hình với 671 tỉ tham số. Con số này rất nhỏ so với khoản tiền OpenAI hay Google đã bỏ ra để đào tạo các mô hình tương đương.

Ritwik Gupta, nhà nghiên cứu chính sách AI tại Đại học California, Berkeley (Mỹ), cho biết các mô hình của DeepSeek chứng minh rằng “AI là không biên giới”. “Người tiên phong phải tốn rất nhiều tiền, nguồn lực để đào tạo các mô hình nhưng người thứ hai có thể làm được với chi phí rẻ và nhanh hơn”.

Gupta nói thêm rằng Trung Quốc có nguồn nhân lực kỹ sư hệ thống lớn hơn nhiều so với Mỹ. Họ có những người biết cách tận dụng tối đa nguồn tài nguyên máy tính để đào tạo và chạy các mô hình với chi phí rẻ.

Câu hỏi lớn còn bỏ ngỏ

Dù DeepSeek đã gây được tiếng vang lớn với nguồn lực ít ỏi, vẫn còn một câu hỏi lớn chưa có lời giải là liệu công ty có thể tiếp tục cạnh tranh khi ngành công nghệ AI đang phát triển quá nhanh.

Một người thân cận với Liang cho rằng chính việc ông dành quá nhiều thời gian vào phòng thí nghiệm AI đã khiến kết quả kinh doanh của quỹ giao dịch chứng khoán bị sụt giảm.

Trong khi đó, các đối thủ tại Mỹ không ngồi yên. Họ đang xây dựng các cụm chip Blackwell thế hệ tiếp theo của Nvidia, tạo ra sức mạnh tính toán có thể nới rộng khoảng cách về hiệu suất với Trung Quốc. Gần nhất là dự án siêu máy tính Stargate trị giá lên đến 500 tỉ USD, được Tổng thống Donald Trump ủng hộ.


Nguồn