AI vẫn khó thay con người trong kiểm chứng thông tin

AI có thể hỗ trợ tìm kiếm thông tin, nhưng vẫn thường sai và chưa thể thay thế con người trong kiểm chứng sự thật.

(Ảnh minh họa)

AI đang được nhiều người dùng để tìm kiếm thông tin và lên ý tưởng, nhưng trong lĩnh vực kiểm chứng sự thật, các công cụ này vẫn bộc lộ nhiều hạn chế đáng lo ngại.

Theo bài viết trên WIRED, gần một nửa người Mỹ cho biết họ sử dụng AI để tìm thông tin và tạo ý tưởng. Điều này không khó hiểu khi mạng xã hội ngày càng tràn ngập nội dung kém chất lượng, trong khi công cụ tìm kiếm cũng khiến nhiều người khó tìm được nguồn đáng tin cậy. Tuy nhiên, với những vấn đề liên quan đến sự thật, rủi ro từ thông tin sai lệch lớn hơn rất nhiều.

Tác giả bài viết, một người làm công việc kiểm chứng thông tin tại WIRED, cho rằng AI hiện chưa thể thay thế quy trình kiểm chứng của con người. Công việc này không chỉ là tìm kiếm trên Internet, mà còn gồm đối chiếu từng dòng, ưu tiên nguồn gốc, kiểm tra giả định, tìm thông tin mâu thuẫn, gọi điện cho nguồn tin và đánh giá các vấn đề đạo đức, pháp lý.

AI hiện được sử dụng nhiều hơn trong kiểm chứng sau khi thông tin đã được công bố. Tại Anh, tổ chức Full Fact đã phát triển công cụ AI để xử lý khối lượng lớn dữ liệu, từ bài đăng mạng xã hội đến bản ghi podcast, qua đó xác định các tuyên bố cần con người điều tra thêm. Tuy nhiên, ông Mark Frankel, phụ trách chính sách công của Full Fact, nhấn mạnh quá trình này vẫn cần con người.

Lý do chính là AI vẫn thường đưa ra câu trả lời sai. Một nghiên cứu tháng 3/2025 của Trung tâm Báo chí Kỹ thuật số Tow cho thấy hơn 60% phản hồi từ các công cụ tìm kiếm tích hợp AI không chính xác. Một nghiên cứu của BBC cũng cho rằng tỷ lệ sai của chatbot vào khoảng 45%.

Các bài kiểm tra chuyên biệt cũng cho kết quả thận trọng. Trong RealFactBench, một chuẩn đánh giá tập trung vào kiểm chứng thông tin do các nhà khoa học máy tính tại Trung Quốc và Anh phát triển, Claude đạt độ chính xác 73% trên các chỉ số. Trong khi đó, SimpleQA của OpenAI cho thấy không mô hình nào của OpenAI và Anthropic vượt quá 50% độ chính xác trong hơn 4.000 câu hỏi có một đáp án.

Tác giả cũng thử đưa bài kiểm tra tuyển dụng kiểm chứng thông tin cho ChatGPT, Claude, Gemini và Grok. Các mô hình có thể nêu kế hoạch làm việc, nhận diện rủi ro pháp lý hoặc đề xuất cách kiểm tra, nhưng đều dừng lại trước bước thực sự xác minh sự kiện.

Bài viết cho rằng điểm mạnh của con người nằm ở khả năng xử lý những thông tin không có sẵn trên Internet, nhận biết sắc thái trong trao đổi, đánh giá mối quan hệ giữa các nguồn tin và đặt câu hỏi trong những tình huống nhạy cảm. Vì vậy, AI có thể là công cụ hỗ trợ, nhưng việc kiểm chứng sự thật vẫn cần sự cẩn trọng, kinh nghiệm và trách nhiệm của con người.