
OpenAI chính thức phát hành 2 mô hình AI mở, thách thức thế trận của các ông lớn
OpenAI vừa ra mắt 2 mô hình ngôn ngữ mở gpt-oss, đánh dấu lần đầu tiên sau hơn 5 năm hãng quay lại với chiến lược mã nguồn mở.
OpenAI vừa công bố 2 mô hình AI lý luận mã nguồn mở mang tên gpt-oss-120b và gpt-oss-20b, với năng lực tương đương dòng o-series của hãng. Đây là lần đầu tiên kể từ GPT-2 (ra mắt năm 2019), OpenAI phát hành trở lại mô hình ngôn ngữ mã nguồn mở. Cả 2 đều có thể được tải về miễn phí trên nền tảng Hugging Face, sử dụng giấy phép Apache 2.0 - cho phép thương mại hóa mà không cần xin phép hay trả phí.
Các mô hình được thiết kế với kích cỡ khác nhau: bản 120 tỉ tham số có thể chạy trên GPU Nvidia đơn; bản 20 tỉ nhẹ hơn, vận hành tốt trên laptop 16GB RAM. OpenAI cho biết, cả 2 mô hình đều dùng kiến trúc hỗn hợp chuyên gia (MoE), chỉ kích hoạt một phần nhỏ tham số cho mỗi tác vụ nhằm tối ưu hiệu suất.
Trên nhiều thang đo, gpt-oss được đánh giá có năng lực vượt trội các đối thủ mở như DeepSeek và Qwen, dù vẫn thua dòng o-series nội bộ. Chẳng hạn, trên bài thi Codeforces, gpt-oss-120b đạt 2622 điểm, nhỉnh hơn DeepSeek R1. Tuy nhiên, tỉ lệ trả lời sai vẫn là vấn đề đáng lo. Gpt-oss gây có những đáp án chưa chuẩn ở hơn 49-53% câu hỏi trên chuẩn PersonQA, cao hơn nhiều so với o1 (16%) và o4-mini (36%).
Về đào tạo, OpenAI áp dụng các kỹ thuật cao cấp như học tăng cường (RL) và chuỗi suy luận đa bước, tương tự các mô hình cao cấp. Gpt-oss có thể hỗ trợ các tác nhân AI gọi công cụ như tìm kiếm web hoặc chạy mã Python, nhưng không xử lý được hình ảnh hay âm thanh.
OpenAI cho biết, sẽ không công bố dữ liệu huấn luyện vì lý do pháp lý, trong bối cảnh các vụ kiện liên quan bản quyền vẫn đang tiếp diễn. Hãng cũng thực hiện kiểm thử an toàn nhằm hạn chế nguy cơ mô hình bị lợi dụng cho mục đích xấu, như chế tạo vũ khí hay tấn công mạng.
“Chúng tôi mong muốn thế giới được xây dựng trên một nền tảng AI mở, được tạo ra tại Mỹ và dựa trên các giá trị dân chủ”, CEO Sam Altman nhấn mạnh. Tuy nhiên, cuộc đua AI mở vẫn đang diễn ra khốc liệt, với sự chờ đợi dành cho DeepSeek R2 và các mô hình siêu trí tuệ mới từ Meta trong thời gian tới.
Ý kiến ()