logo-tapnews
tiếng nói người Việt toàn cầu

Grok 4.1 ra mắt: Vượt trội nhờ EQ và độ tin cậy

Ngày đăng: 19/11/2025

(TAP) - Ngày 17 - 18/11/2025, xAI âm thầm tung ra Grok 4.1 - bản nâng cấp đột phá từ Grok 4, lập tức chiếm ngôi đầu LMArena với Elo 1483. Nhờ trí tuệ cảm xúc vượt trội, khả năng sáng tạo đỉnh cao cùng việc giảm ảo giác tới ba lần, Grok 4.1 hiện vượt qua cả Claude 4.5 lẫn GPT-4.5, trở thành mô hình AI giống con người nhất hiện nay.

Mặc dù Grok 4.1 vẫn dùng nền tảng huấn luyện giống Grok 4 nhưng được tinh chỉnh hậu huấn luyện rất sâu, tập trung cải thiện phong cách, tính cách và độ tin cậy. Phiên bản này nổi bật do có ngôn ngữ sáng tạo giàu hình ảnh, khả năng đồng cảm tự nhiên, tính cách ổn định suốt cuộc trò chuyện dài, đồng thời hỗ trợ hợp tác hiệu quả hơn. Nhờ mô hình phần thưởng kết hợp lý luận tác nhân biên giới, xAI đã tối ưu nhanh yếu tố tinh tế như giọng điệu cùng sắc thái cảm xúc mà không cần quá nhiều dữ liệu nhập bởi con người.

Quy trình huấn luyện vẫn gồm giai đoạn quen thuộc: tiền huấn luyện trên dữ liệu web khổng lồ, điều chỉnh có giám sát định hình hành vi, rồi tối ưu chính sách qua RLHF. Điểm khác biệt lớn nằm ở mô hình phần thưởng tác nhân, giúp giảm mạnh tỷ lệ ảo giác - từ khoảng 12% xuống còn 4% theo kết quả đo thực tế trên lưu lượng sản xuất và FactScore. Grok 4.1 cung cấp hai chế độ vận hành linh hoạt: “Thinking” - cho phép hiển thị đầy đủ chuỗi lập luận trong các tác vụ phức tạp và “Non-Thinking” - mang đến phản hồi gần như tức thời với độ trễ cực thấp.

 Grok 4.1 ra mắt: Vượt trội nhờ EQ và độ tin cậy

Hình ảnh giao diện Grok 4.1 vừa mới ra mắt. Nguồn: Grok 4.1

Về hiệu suất, Grok 4.1 thống trị EQ-Bench3 nhờ khả năng đồng cảm xuất sắc trong tình huống nhập vai, đặc biệt hiểu nỗi buồn và đưa lời an ủi tự nhiên. Ở mảng sáng tạo, điểm Creative Writing v3 tăng vọt, tạo văn bản mạch lạc, giàu hình ảnh hơn hẳn Claude hay Gemini. Ở thử nghiệm “blind preference test” (thử nghiệm đánh giá sở thích trong điều kiện “mù”, nghĩa là người tham gia không biết trước thông tin về sản phẩm họ đang dùng hoặc đang so sánh), 64,78% chọn Grok 4.1 thay vì phiên bản cũ. Xét tổng thể, Grok 4.1 đang đứng thứ hai bảng xếp hạng, vượt trội hơn Claude 4.5 lẫn GPT-4.5 về trải nghiệm thực tế, chỉ thua nhẹ một vài preview so với Gemini 3 Pro.

 Grok 4.1 ra mắt: Vượt trội nhờ EQ và độ tin cậy

Hình ảnh bảng xếp hạng AI trên Text Arena. Nguồn: Text Arena

Người dùng có thể trải nghiệm ngay trên grok.com, X.com hoặc ứng dụng Grok (iOS/Android) bằng chế độ tự động hay chọn thủ công. Một vài mẹo hay: bật tìm kiếm trực tiếp để tăng độ chính xác và dùng lời nhắc hệ thống định hướng giọng điệu. Tóm lại, Grok 4.1 không phải là một mô hình hoàn toàn mới mà là phiên bản được tinh chỉnh thông minh, hướng tới những điều người dùng thực sự mong muốn: sự đồng cảm, tính sáng tạo cùng độ tin cậy cao. Grok 4.1 mang đến sự lựa chọn tối ưu cho hội thoại chất lượng, hỗ trợ cảm xúc, khẳng định bước tiến mạnh mẽ của xAI trong cuộc đua AI toàn cầu.

Esther Vy

 

Loading comments...

Bài viết liên quan