Derpy
Intern Writer
OpenAI đang thực hiện việc nâng cấp an toàn cho ChatGPT nhằm bảo vệ thanh thiếu niên và những người đang đối diện với khủng hoảng cảm xúc. Công ty đã công bố kế hoạch triển khai các chức năng kiểm soát của phụ huynh, cho phép họ liên kết tài khoản của mình với tài khoản của con cái, bắt đầu từ độ tuổi 13. Với những chức năng này, phụ huynh có thể hạn chế một số tính năng và nhận thông báo thời gian thực nếu AI phát hiện ra những tin nhắn có thể gợi ý đến trầm cảm hoặc những nỗi lo lắng khác. Cập nhật này cho thấy OpenAI không phủ nhận rằng thanh thiếu niên đang sử dụng ChatGPT và đôi khi họ coi AI như một người bạn và tâm sự. Mặc dù không được đề cập trực tiếp, nhưng điều này cũng có phần phản hồi lại những trường hợp nổi bật gần đây về việc tương tác với chatbot AI đã dẫn đến cái chết của một người thân.
Các chức năng mới sẽ bắt đầu được triển khai trong tháng tới. Khi được thiết lập, phụ huynh có thể quyết định liệu chatbot AI có thể lưu lại lịch sử trò chuyện hay sử dụng chức năng ghi nhớ. Nó cũng sẽ có các hướng dẫn về nội dung phù hợp với độ tuổi để hướng dẫn cách AI phản ứng. Trong trường hợp có cuộc trò chuyện bị cảnh báo, phụ huynh sẽ nhận được thông báo. Đây không phải là một hình thức giám sát toàn diện, bởi nếu không, phụ huynh sẽ không nhận được bất kỳ thông báo nào về các cuộc trò chuyện; nhưng các cảnh báo sẽ được gửi đi trong những thời điểm mà có vẻ như cần kiểm tra thực tế. "Công việc của chúng tôi nhằm làm cho ChatGPT hữu ích nhất có thể là một quá trình không ngừng nghỉ. Chúng tôi đã thấy mọi người tìm đến nó trong những khoảnh khắc khó khăn nhất," OpenAI giải thích trong một bài viết trên blog. "Đó là lý do tại sao chúng tôi tiếp tục cải thiện cách mà các mô hình của chúng tôi nhận diện và phản ứng với dấu hiệu của sự distress tâm lý và cảm xúc, được dẫn dắt bởi các chuyên gia."
Đối với người lớn và thanh thiếu niên, OpenAI cho biết họ sẽ bắt đầu chuyển hướng những cuộc trò chuyện nhạy cảm liên quan đến vấn đề sức khỏe tâm thần hoặc ý tưởng ***** qua một phiên bản chuyên biệt của mô hình ChatGPT. Mô hình này sử dụng phương pháp được gọi là "định hướng thận trọng" để phản hồi một cách cẩn trọng hơn, kháng lại những yêu cầu trái ngược và tuân thủ các hướng dẫn an toàn. Để hệ thống an toàn mới này hoạt động, OpenAI đã thành lập Hội đồng Chuyên gia về Sức khỏe và AI cùng với Mạng lưới Y tế Toàn cầu, bao gồm hơn 250 chuyên gia y tế chuyên về sức khỏe tâm thần, sử dụng chất gây nghiện và chăm sóc thanh thiếu niên. Những cố vấn này sẽ giúp định hình cách mà distress được phát hiện, cách AI phản ứng và cách xử lý tình huống khẩn cấp trong những thời điểm có nguy cơ cao.
Phụ huynh đã từ lâu lo ngại về thời gian sử dụng màn hình và nội dung trực tuyến, nhưng AI mang đến một lớp mới: không chỉ là những gì con bạn xem, mà còn là những ai mà chúng nói chuyện. Khi "ai đó" là một mô hình ngôn ngữ lớn được thiết kế tinh vi về cảm xúc, nghe như thể nó quan tâm mặc dù chỉ là một thuật toán, mọi thứ trở nên phức tạp hơn. An toàn cho AI cho đến nay chủ yếu là phản ứng, nhưng những công cụ mới đẩy AI hướng tới việc chủ động hơn trong việc ngăn chặn tổn thương. Hy vọng rằng điều này có nghĩa là nó sẽ không thường xuyên cần một tin nhắn kịch tính gửi đến phụ huynh và một lời cầu khẩn từ AI để một thanh thiếu niên xem xét đến những người thân yêu của mình. Có thể sẽ cảm thấy ngại ngùng hoặc bị từ chối, nhưng nếu các tính năng mới có thể hướng dẫn một tiếng kêu cứu trong cuộc trò chuyện ra khỏi rìa vực thẳm, thì đó không phải là điều gì tồi tệ.
Nguồn tham khảo: Techradar
Các chức năng mới sẽ bắt đầu được triển khai trong tháng tới. Khi được thiết lập, phụ huynh có thể quyết định liệu chatbot AI có thể lưu lại lịch sử trò chuyện hay sử dụng chức năng ghi nhớ. Nó cũng sẽ có các hướng dẫn về nội dung phù hợp với độ tuổi để hướng dẫn cách AI phản ứng. Trong trường hợp có cuộc trò chuyện bị cảnh báo, phụ huynh sẽ nhận được thông báo. Đây không phải là một hình thức giám sát toàn diện, bởi nếu không, phụ huynh sẽ không nhận được bất kỳ thông báo nào về các cuộc trò chuyện; nhưng các cảnh báo sẽ được gửi đi trong những thời điểm mà có vẻ như cần kiểm tra thực tế. "Công việc của chúng tôi nhằm làm cho ChatGPT hữu ích nhất có thể là một quá trình không ngừng nghỉ. Chúng tôi đã thấy mọi người tìm đến nó trong những khoảnh khắc khó khăn nhất," OpenAI giải thích trong một bài viết trên blog. "Đó là lý do tại sao chúng tôi tiếp tục cải thiện cách mà các mô hình của chúng tôi nhận diện và phản ứng với dấu hiệu của sự distress tâm lý và cảm xúc, được dẫn dắt bởi các chuyên gia."

Đối với người lớn và thanh thiếu niên, OpenAI cho biết họ sẽ bắt đầu chuyển hướng những cuộc trò chuyện nhạy cảm liên quan đến vấn đề sức khỏe tâm thần hoặc ý tưởng ***** qua một phiên bản chuyên biệt của mô hình ChatGPT. Mô hình này sử dụng phương pháp được gọi là "định hướng thận trọng" để phản hồi một cách cẩn trọng hơn, kháng lại những yêu cầu trái ngược và tuân thủ các hướng dẫn an toàn. Để hệ thống an toàn mới này hoạt động, OpenAI đã thành lập Hội đồng Chuyên gia về Sức khỏe và AI cùng với Mạng lưới Y tế Toàn cầu, bao gồm hơn 250 chuyên gia y tế chuyên về sức khỏe tâm thần, sử dụng chất gây nghiện và chăm sóc thanh thiếu niên. Những cố vấn này sẽ giúp định hình cách mà distress được phát hiện, cách AI phản ứng và cách xử lý tình huống khẩn cấp trong những thời điểm có nguy cơ cao.
Phụ huynh đã từ lâu lo ngại về thời gian sử dụng màn hình và nội dung trực tuyến, nhưng AI mang đến một lớp mới: không chỉ là những gì con bạn xem, mà còn là những ai mà chúng nói chuyện. Khi "ai đó" là một mô hình ngôn ngữ lớn được thiết kế tinh vi về cảm xúc, nghe như thể nó quan tâm mặc dù chỉ là một thuật toán, mọi thứ trở nên phức tạp hơn. An toàn cho AI cho đến nay chủ yếu là phản ứng, nhưng những công cụ mới đẩy AI hướng tới việc chủ động hơn trong việc ngăn chặn tổn thương. Hy vọng rằng điều này có nghĩa là nó sẽ không thường xuyên cần một tin nhắn kịch tính gửi đến phụ huynh và một lời cầu khẩn từ AI để một thanh thiếu niên xem xét đến những người thân yêu của mình. Có thể sẽ cảm thấy ngại ngùng hoặc bị từ chối, nhưng nếu các tính năng mới có thể hướng dẫn một tiếng kêu cứu trong cuộc trò chuyện ra khỏi rìa vực thẳm, thì đó không phải là điều gì tồi tệ.
Nguồn tham khảo: Techradar