Một nhóm các nhà nghiên cứu tại đại học Stanford (Mỹ) đã đề xuất DetectGPT - công cụ đầu tiên phát hiện những văn bản được ChatGPT tạo ra nhằm tránh gian lận cho môi trường học thuật.
ChatGPT hiện là mô hình ngôn ngữ lớn (LLM) đang rất nóng hiện nay khi thu hút được sự quan tâm của người dùng trên khắp thế giới. Công cụ này tốt đến mức có thể tạo ra những bài luận văn cho bậc đại học, ví dụ sinh viên có thể sử dụng LLM để hoàn thành bài tập viết, khiến các giáo sư không thể đánh giá chính xác năng lực học tập...
Phương pháp của DetectGPT dựa trên ý tưởng văn bản do LLM tạo ra thường di chuyển xung quanh các vùng cụ thể của các hàm xác suất. Nó chỉ dùng các xác suất nhật ký được tính toán bởi mô hình quan tâm, các nhiễu loạn ngẫu nhiên của đoạn văn từ một mô hình ngôn ngữ được đào tạo.
Thông qua đó, các nhà nghiên cứu đã phát triển công cụ đánh giá văn bản có phải do máy tạo ra hay không, với đặc điểm của công cụ là không dựa vào việc đào tạo trí thông minh nhân tạo (AI) hoặc thu thập các bộ dữ liệu lớn để so sánh văn bản.
Phương pháp này của nhóm được gọi là "zero-shot", cho phép DetectGPT phát hiện văn bản do AI viết, hoạt động hoàn toàn trái ngược với các phương pháp vốn thường yêu cầu dữ liệu để đào tạo "bộ phân loại" từ các nội dung thực và được ChatGPT tạo ra.
Nhóm nghiên cứu đã thử nghiệm DetectGPT trên các bài báo do CNET sử dụng AI viết trong năm 2022 và xác nhận nó vượt trội các phương pháp phát hiện văn bản do AI tạo ra. Đây là phương pháp không yêu cầu bất kỳ dữ liệu bổ sung hoặc đào tạo nào, làm nó trở thành một công cụ hiệu quả để xác định văn bản do máy tạo.
Theo Thanhnien
>> Người Việt tò mò, đổ xô dùng ChatGPT "lậu", kết quả cả thán phục và... thất vọng
ChatGPT hiện là mô hình ngôn ngữ lớn (LLM) đang rất nóng hiện nay khi thu hút được sự quan tâm của người dùng trên khắp thế giới. Công cụ này tốt đến mức có thể tạo ra những bài luận văn cho bậc đại học, ví dụ sinh viên có thể sử dụng LLM để hoàn thành bài tập viết, khiến các giáo sư không thể đánh giá chính xác năng lực học tập...
Thông qua đó, các nhà nghiên cứu đã phát triển công cụ đánh giá văn bản có phải do máy tạo ra hay không, với đặc điểm của công cụ là không dựa vào việc đào tạo trí thông minh nhân tạo (AI) hoặc thu thập các bộ dữ liệu lớn để so sánh văn bản.
Phương pháp này của nhóm được gọi là "zero-shot", cho phép DetectGPT phát hiện văn bản do AI viết, hoạt động hoàn toàn trái ngược với các phương pháp vốn thường yêu cầu dữ liệu để đào tạo "bộ phân loại" từ các nội dung thực và được ChatGPT tạo ra.
Nhóm nghiên cứu đã thử nghiệm DetectGPT trên các bài báo do CNET sử dụng AI viết trong năm 2022 và xác nhận nó vượt trội các phương pháp phát hiện văn bản do AI tạo ra. Đây là phương pháp không yêu cầu bất kỳ dữ liệu bổ sung hoặc đào tạo nào, làm nó trở thành một công cụ hiệu quả để xác định văn bản do máy tạo.
Theo Thanhnien
>> Người Việt tò mò, đổ xô dùng ChatGPT "lậu", kết quả cả thán phục và... thất vọng