Các ông lớn AI đang 'hoảng sợ' thế nào trước DeepSeek Trung Quốc
Sau khi DeepSeek công bố 'AI giá rẻ', vốn hóa Nvidia sụt gần 600 tỷ USD, còn Meta lập "phòng chiến tranh" để giải mã mô hình đang thay đổi cuộc chơi của Trung Quốc.
AI đã đưa Nvidia trở thành một trong hai công ty giá trị nhất thế giới với vốn hóa thị trường hơn 3.500 tỷ USD. Tuy nhiên, theo Fortune, trong ngày đầu tuần 27/1, "sự hoảng loạn của các nhà đầu tư Nvidia" khiến cổ phiếu của công ty giảm gần 17% và xóa sổ gần 600 tỷ giá trị, đưa vốn hóa công ty xuống dưới mốc 3.000 tỷ USD.
Đợt bán tháo được kích hoạt bởi DeepSeek. Ngày 20/1, công ty khởi nghiệp Trung Quốc công bố mô hình AI V3 miễn phí và đặc biệt R1 "được đào tạo trên các chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự".
Hai năm qua, những GPU mạnh mẽ nhưng đắt đỏ của Nvidia được săn đón để xây dựng các mô hình AI tiên tiến nhất. Do đó, các nhà đầu tư lập tức đặt câu hỏi về tương lai của Nvidia. Theo Shubham Saboo, Giám đốc sản phẩm của DeepSeek, OpenAI o1 mất 60 USD cho một triệu token đầu ra, còn DeepSeek R1 chỉ cần 2,19 USD
"Về cơ bản, điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá 30 USD thay vì 1.000 USD", Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, nói.
Dù còn nhiều câu hỏi chưa được giải đáp về cách DeepSeek phát triển mô hình của mình, công ty mới nổi này đang làm rung chuyển thị trường AI. Những tỷ phú có tài sản liên quan đến trí tuệ nhân tạo thiệt hại nhiều nhất, như CEO Nvidia Jensen Huang chứng kiến tài sản giảm 20,1 tỷ USD, nhà sáng lập Oracle Larry Ellison giảm 22,6 tỷ USD, CEO Michael Dell của Dell mất 13 tỷ USD còn nhà đồng sáng lập Binance Changpeng Zhao sụt 12,1 tỷ USD.
Trong khi đó, theo The Information, Mark Zuckerberg, CEO Meta, đã đưa ra tình trạng báo động cao và tập hợp kỹ sư vào 4 "phòng chiến tranh" để xác định cách High-Flyer, một trong những quỹ đầu tư hàng đầu Trung Quốc, tài trợ toàn phần cho DeepSeek để phát hành một công cụ thay đổi cuộc chơi AI.
Cách sử dụng mã nguồn mở đột phá cũng khiến giới chuyên gia đặt ra câu hỏi về những khoản đầu tư khổng lồ vào AI của các công ty Mỹ. Mathew Oldham, Giám đốc cơ sở hạ tầng AI của Meta, nhận xét mô hình mới của DeepSeek có thể vượt trội hơn phiên bản tiếp theo của Llama AI, dự kiến phát hành đầu năm 2025. Còn Yann LeCun, Giám đốc khoa học AI của Meta, đánh giá thành công của DeepSeek cho thấy mô hình AI nguồn mở đang vượt mặt sản phẩm độc quyền.
Một nhân viên ẩn danh cho biết trong số 4 phòng chiến tranh Meta tạo ra để ứng phó với bước đột phá tiềm năng của DeepSeek, hai phòng sẽ cố gắng giải mã cách High-Flyer giảm chi phí đào tạo và vận hành DeepSeek, từ đó áp dụng cho Llama.
Phòng thứ ba sẽ cố gắng tìm hiểu dữ liệu nào DeepSeek đã sử dụng để đào tạo mô hình, trong khi nhóm còn lại sẽ xem xét Llama có thể tái cấu trúc như thế nào dựa trên các thuộc tính của mô hình DeepSeek.
Phát ngôn viên Meta sau đó trả lời The Information: "Chúng tôi thường xuyên đánh giá tất cả mô hình cạnh tranh trong quá trình phát triển và đã làm như vậy kể từ khi bộ phận GenAI của công ty được thành lập". Tuần trước, Meta thông báo sẽ chi 65 tỷ USD cho các dự án liên quan đến AI trong năm, như xây dựng một trung tâm dữ liệu khổng lồ và tuyển dụng thêm nhiều nhân viên AI.
Hai mô hình DeepSeek trình làng cũng cùng giai đoạn OpenAI hợp tác SoftBank, Oracle và các công ty khác để thực hiện siêu dự án cơ sở hạ tầng AI trị giá 500 tỷ USD, được Nhà Trắng hậu thuẫn mang tên Stargate, với mục tiêu thành lập hàng chục trung tâm dữ liệu mới trên khắp nước Mỹ.
"Những thành tựu về hiệu quả của Trung Quốc không phải là ngẫu nhiên", Angela Zhang, giáo sư luật tại Đại học Nam California nói trên Financial Times. "Khi hạn chế quyền tiếp cận của Trung Quốc đối với chip AI tiên tiến, Mỹ vô tình thúc đẩy sự đổi mới của nước này".
DeepSeek được Liang Wenfeng thành lập tháng 5/2023, đặt trụ sở ở Hàng Châu, Chiết Giang, và do High-Flyer, một trong những quỹ đầu tư hàng đầu Trung Quốc, sở hữu. Công ty được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào xây dựng công nghệ nền tảng.
Theo ChinaTalk, không giống các công ty AI tại Trung Quốc, DeepSeek tuyên bố sứ mệnh "giải mã bí ẩn của AGI bằng sự tò mò". Phòng thí nghiệm của công ty hiện tập trung nghiên cứu các cải tiến về kiến trúc và thuật toán có khả năng thay đổi cuộc chơi trong lĩnh vực trí tuệ nhân tạo.
Ý kiến ()