• :
  • :
A- A A+ | Tăng tương phản Giảm tương phản

Wikipedia chỉ ra những dấu hiệu nhận diện văn bản AI

Wikipedia xây dựng hướng dẫn nhận diện văn bản AI, giúp người đọc hiểu rõ dấu hiệu và thói quen ngôn ngữ thường gặp trong các mô hình tạo sinh hiện nay.

Wikipedia chỉ ra những dấu hiệu nhận diện văn bản AI

Dấu hiệu của văn bản AI được tổng hợp kinh nghiệm của các biên tập viên Wikipedia, chỉ ra cách mô hình tạo sinh nhấn mạnh chủ đề và dùng ngôn ngữ mơ hồ dễ nhận biết. Đồ họa: Phương Anh

Trong bối cảnh văn bản do trí tuệ nhân tạo AI tạo ra ngày càng tinh vi, nhiều người đọc vẫn mang cảm giác mơ hồ rằng một đoạn nội dung nào đó “có mùi AI” nhưng không biết cách xác định.

Những dấu hiệu từng được cho là lộ dấu vết của AI như việc lặp lại một số từ ngữ đặc trưng và dùng dấu "-" đã không còn hiệu quả khi các mô hình tạo sinh ngày càng tinh vi.

Thế nhưng, cộng đồng Wikipedia, nơi xử lý hàng triệu chỉnh sửa mỗi ngày lại trở thành nhóm có khả năng nhận diện văn bản do AI tạo ra chính xác nhất hiện nay.

Từ năm 2023, các biên tập viên Wikipedia triển khai “Dự án dọn dẹp AI” để đối phó với lượng bài viết AI tràn vào nền tảng.

Trong quá trình xử lý, họ đã xây dựng một hướng dẫn chi tiết mang tên “Dấu hiệu của văn bản AI”, tổng hợp hàng nghìn ví dụ thực tế và phân tích ngôn ngữ dựa trên kinh nghiệm biên tập của mình.

Theo tài liệu, các công cụ phát hiện tự động hiện nay gần như không đem lại hiệu quả. Thay vào đó, dấu hiệu rõ nhất nằm ở phong cách diễn đạt.

Các bài viết do AI tạo sinh thường dành quá nhiều thời gian nhấn mạnh tầm quan trọng của một chủ đề bằng những cụm từ chung chung như “một khoảnh khắc then chốt” hay “một phần của phong trào rộng lớn hơn”.

Những mô tả này hiếm khi xuất hiện trong các bài Wikipedia chuẩn, vốn tập trung vào thông tin, nguồn dẫn và tính trung lập.

Một dấu hiệu khác là AI thường thêm những mệnh đề cuối câu mang tính khẳng định chung chung, chẳng hạn như “phản ánh sự liên quan liên tục” hoặc “nhấn mạnh vai trò quan trọng” của một ý tưởng trừu tượng.

Chúng tạo cảm giác văn bản đang cố chứng minh điều gì đó thay vì cung cấp dữ liệu cụ thể. Người am hiểu ngữ pháp gọi kiểu cấu trúc này là “hiện tại phân từ”, vốn được AI dùng quá mức.

Mô hình AI còn có xu hướng dùng ngôn ngữ mang màu sắc tiếp thị khi mọi cảnh vật đều "đẹp như tranh", mọi công trình đều “hiện đại và sạch sẽ”, khiến bài viết giống một quảng cáo hơn là tài liệu bách khoa.

Hướng dẫn của Wikipedia cho thấy những thói quen này không dễ biến mất vì chúng phản ánh cấu trúc dữ liệu huấn luyện của mô hình.

Khi công chúng hiểu rõ dấu hiệu nhận diện, việc phân biệt văn bản AI có thể tạo ra những thay đổi đáng kể trong cách chúng ta tiếp nhận và đánh giá thông tin trên internet.


Lượt xem: 5
Nguồn:https://laodong.vn/cong-nghe/wikipedia-chi-ra-nhung-dau-hieu-nhan-dien-van-ban-ai-1612716.ldo Copy link
Tổng số điểm của bài viết là: 0 trong 0 đánh giá
Click để đánh giá bài viết