(TAP) - Sau nhiều năm im ắng kể từ GPT-2, OpenAI bất ngờ công bố hai mô hình ngôn ngữ trọng số mở là GPT-OSS-120B và GPT-OSS-20B, đánh dấu bước đi chiến lược nhằm cạnh tranh trực tiếp cùng Meta, Mistral AI, DeepSeek.
Thông tin do OpenAI đăng tải ngày 5/8
Dựa trên thông tin do OpenAI đăng tải ngày 5/8, cả hai mô hình đều phát hành theo giấy phép Apache 2.0, mang lại sự linh hoạt cao cho người dùng. GPT-OSS-120B cùng GPT-OSS-20B thể hiện ưu thế vượt trội hơn nhiều mô hình mã nguồn mở cùng quy mô trong tác vụ lập luận, hỗ trợ sử dụng công cụ. Đặc biệt, chúng được tối ưu hóa giúp triển khai hiệu quả trên nhiều loại phần cứng khác nhau. GPT-OSS-120B mang hiệu năng gần tương đương O4-mini (phiên bản nội bộ của OpenAI) ở những bài kiểm tra tư duy cốt lõi nhưng chỉ cần một GPU 80GB để vận hành.
Bên cạnh đó, GPT-OSS-20B đạt kết quả ngang bằng O3-mini lúc thực hiện bài đánh giá hiệu suất (benchmark) tiêu chuẩn, hoạt động trên thiết bị biên chỉ với 16GB RAM. Ngoài ra, hai mô hình đều thể hiện khả năng suy luận chuỗi (Chain-of-Thought), tương tác cùng các hàm few-shot, vượt trội hơn hẳn ở bài đánh giá Tau-Bench, HealthBench. Đáng chú ý, chúng thậm chí còn vượt mặt một số mô hình độc quyền như GPT-4o trong một số tác vụ chuyên biệt.
OpenAI cho biết đã thực hiện kiểm tra an toàn kỹ lưỡng trước khi phát hành. Quá trình bao gồm việc loại bỏ dữ liệu độc hại liên quan đến hóa học, sinh học, phóng xạ, hạt nhân xuyên suốt giai đoạn tiền huấn luyện. Công ty cũng mô phỏng kịch bản tấn công nhằm ngăn chặn khả năng lạm dụng mô hình. Hai mô hình hiện sẵn sàng để triển khai trên đa nền tảng. Trọng số của GPT-OSS-120B, GPT-OSS-20B được công bố chính thức trên Hugging Face, GitHub. Người dùng cá nhân có thể trải nghiệm trực tiếp thông qua LM Studio hoặc Ollama, còn những doanh nghiệp triển khai quy mô lớn trên nền tảng đám mây AWS, Microsoft Azure hoặc Baseten.
Trọng số của GPT-OSS-120B và GPT-OSS-20B được công bố chính thức trên Hugging Face. Nguồn: X@OpenAI
TechCrunch thông tin, mô hình trọng số mở (open-weight) khác biệt với mã nguồn mở truyền thống ở chỗ chỉ công khai tham số huấn luyện chứ không bao gồm toàn bộ mã nguồn. Xu hướng này đang ngày càng phổ biến, được nhiều công ty lớn gồm Meta, Mistral AI, DeepSeek áp dụng.
Việc OpenAI quay trở lại thị trường mã nguồn mở cho thấy sự cạnh tranh ngày càng gay gắt ở lĩnh vực AI. GPT-OSS-20B sở hữu khả năng chạy mượt mà trên thiết bị biên (Edge Device), mở ra hàng loạt ứng dụng thực tiễn nhưng chi phí triển khai chỉ bằng một phần nhỏ so với các mô hình lớn.
Hoang Nam