DeepSeek thua xa đối thủ phương Tây, chỉ đạt 17% độ chính xác

DeepSeek, chatbot AI đến từ Trung Quốc, vừa nhận kết quả đáng thất vọng trong một bài kiểm tra đánh giá độ chính xác do tổ chức NewsGuard thực hiện.

deepseek-spotlight-vietnam

Theo báo cáo công bố vào ngày 29-1, DeepSeek chỉ đạt 17% độ chính xác khi trả lời các câu hỏi liên quan đến tình hình thời sự, đứng thứ 10/11 trong số các chatbot AI được đánh giá. Mức độ chính xác này thấp hơn nhiều so với các đối thủ phương Tây, như ChatGPT và Gemini, với tỷ lệ sai lệch trung bình khoảng 62%.

Bài kiểm tra của NewsGuard bao gồm 300 câu hỏi, trong đó có 30 câu liên quan đến thông tin sai lệch đang lan truyền trên mạng. Kết quả cho thấy, DeepSeek đã lặp lại thông tin sai lệch trong 30% trường hợp và đưa ra câu trả lời mơ hồ hoặc không hữu ích ở 53% trường hợp. Điều này khiến tỷ lệ sai lệch của DeepSeek lên tới 83%. Đặc biệt, trong 3/10 câu hỏi liên quan đến thông tin sai lệch, DeepSeek đã lồng những quan điểm của Chính phủ Trung Quốc dù các câu hỏi không liên quan đến quốc gia này.

Sự kiện này gây hoài nghi về tuyên bố của DeepSeek rằng công nghệ AI của họ "tương đương hoặc vượt qua" OpenAI. Mặc dù DeepSeek đã trở thành ứng dụng AI được tải nhiều nhất trên kho ứng dụng của Apple chỉ sau một tuần ra mắt, nhưng những lo ngại về việc ứng dụng này có thể bị lợi dụng để lan truyền thông tin sai lệch đang ngày càng gia tăng. Tính đến nay, DeepSeek vẫn chưa có phản hồi chính thức về kết quả từ NewsGuard.