Thời điểm phát hành Qwen 2.5-Max được đánh giá là bất thường khi vào ngày đầu tiên của Tết Nguyên đán, quãng thời gian hầu hết người Trung Quốc được nghỉ làm và ở bên gia đình. Động thái cho thấy áp lực từ sự phát triển chóng mặt của công ty khởi nghiệp AI Trung Quốc DeepSeek trong ba tuần qua không chỉ đặt lên các đối thủ nước ngoài mà còn lên cả đối thủ cạnh tranh trong nước, theo Reuters.
Alibaba ra mô hình AI 'vượt trội DeepSeek'
Alibaba cho biết mô hình trí tuệ nhân tạo Qwen 2.5 vừa ra mắt vượt trội so với DeepSeek-V3 đang gây sốt những ngày qua.
"Qwen 2.5-Max vượt trội hơn ... hầu hết các mô hình khác như GPT-4o, DeepSeek-V3 và Llama-3.1-405B", bộ phận phát triển điện toán đám mây của Alibaba ra thông báo, đề cập đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI, Meta và công ty đồng hương.
Gã khổng lồ công nghệ Trung Quốc giới thiệu Qwen2.5-Max vượt trội DeepSeek V3 trong nhiều tiêu chuẩn khác nhau, bao gồm Arena-Hard, LiveBench, LiveCodeBench và GPQA-Diamond. Nó cũng cho thấy hiệu suất mạnh mẽ trong các đánh giá khác như MMLU-Pro.
Alibaba cho biết Qwen2.5-Max hiện được tích hợp trong Qwen Chat và người dùng có thể trò chuyện trực tiếp hoặc tương tác với các vật thể, tìm kiếm thông tin...
DeepSeek hiện chưa đưa ra bình luận về những thông tin so sánh của Alibaba.
Việc trợ lý AI DeepSeek phát hành ngày 10/1 sử dụng mô hình DeepSeek-V3 cũng như phiên bản R1 ngày 20/1 đã gây chấn động Thung lũng Silicon, cổ phiếu nhiều hãng công nghệ đồng loạt lao dốc. Chi phí thấp và thời gian phát triển ngắn của hãng Trung Quốc khiến các nhà đầu tư đặt dấu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.
Thành công của DeepSeek gây lo ngại với nhiều công ty Mỹ nhưng cũng dẫn đến cuộc chạy đua giữa các đối thủ trong nước. Hai ngày sau khi DeepSeek-R1 ra mắt, ByteDance, công ty mẹ của TikTok, ra bản cập nhật mô hình Doubao-1.5-pro, tuyên bố mô hình này vượt trội OpenAI o1 trong AIME, một bài kiểm tra chuẩn đánh giá mức độ hiểu và phản hồi của các mô hình AI với các hướng dẫn phức tạp, theo Reuters. Các công ty Trung Quốc khác đã công bố mô hình lý luận chỉ riêng đầu tháng 1, gồm Moonshot AI, Minimax và iFlyTek.
Ý kiến ()