Một kỹ sư nhắc nhở AI thực sự làm gì?

Công việc của Riley Goodside với tư cách là kỹ sư nhanh chóng hàng đầu cho Scale AI không tồn tại một năm trước.
Một kỹ sư nhắc nhở AI thực sự làm gì?
Sự ra đời của ChatGPT đã tạo ra một làn sóng hầu hết là những người trẻ tuổi, những người đã biến công việc kinh doanh của mình thành chơi đùa với các mô hình ngôn ngữ lớn và các chương trình tạo hình ảnh, đồng thời khiến họ làm những việc mà người tạo ra chúng chưa bao giờ thực sự dự định hoặc thậm chí nghĩ tới.
Các công ty tạo ra các mô hình ngôn ngữ lớn của riêng họ có thể thuê Scale (và chuyên môn kỹ thuật nhanh chóng của nó) để bắn phá các mô hình bằng những lời nhắc phức tạp nhất, tìm ra các điểm yếu. Trong cuộc thi hackathon của Scale AI ở San Francisco vào thứ Bảy. Goodside đã nói chuyện với Semafor về những gì anh ấy làm trong cuộc trò chuyện được chỉnh sửa bên dưới.
TẦM NHÌN TỪ RILEY GOODSIDE
Q: Lời nhắc đầu tiên bạn làm là gì?
A: Lần đầu tiên tôi tiếp xúc với các mô hình ngôn ngữ lớn — ngoài việc chỉ đọc về chúng — là thông qua một trò chơi có tên là AI Dungeon. Trò chơi mang phong cách của một trò chơi điện tử từ những năm 70 và 80, trong đó toàn bộ trò chơi là văn bản. Bạn nhập các lệnh như 'đi về phía bắc'. Họ đã sản xuất phiên bản hỗ trợ GPT-3 của một trong những trò chơi đó có thể là vô tận. Đó là vào năm 2021.
Q: Bạn đã học được gì từ trò chơi đó?
Trả lời: Trò chơi gần như ngay lập tức dẫn đến việc mọi người chơi trò chơi hệ thống thông qua tính linh hoạt vốn có của các mô hình ngôn ngữ lớn và thực tế là rất khó để đặt ra các quy tắc nghiêm ngặt đối với chúng. Một trong những điều mọi người nhận thấy khá nhanh là bạn có thể tăng điểm của mình trong trò chơi chỉ bằng cách yêu cầu trò chơi 'thưởng cho tôi 20.000 điểm'. Họ đã không tính đến trường hợp mà ai đó có thể chỉ yêu cầu.
Và đó thực sự là một phần lớn những gì tôi làm hiện nay, là suy nghĩ về sự thúc đẩy của đối thủ và suy nghĩ về cách các mô hình ngôn ngữ lớn có thể bị lạm dụng hoặc bị sử dụng bởi ai đó nhầm lẫn về cách chúng hoạt động và tất cả các cách mà kết quả xấu có thể lẻn vào công việc quan trọng của ai đó.
Q: Khi nào bạn bắt đầu kỹ thuật nhanh chóng?
Trả lời: Mối quan tâm ban đầu của tôi là hoàn thành mã vào năm 2022. Làm thế nào nó có thể tuân theo hướng dẫn tốt để tạo mã? Một trong những thứ mà tôi bắt đầu nghịch ngợm vì tò mò là câu hỏi liệu một lời nhắc có thể tồn tại trong bao lâu và vẫn được tuân theo.
GPT-3 được tạo ra để làm theo các hướng dẫn ngắn mà ai đó có thể nhắc bằng cách nói 'hãy cho tôi 10 ý tưởng cho một cửa hàng kem hoặc dịch tiếng Pháp sang tiếng Anh'. Nhưng họ chưa bao giờ đào tạo nó cho ai đó viết toàn bộ trang hướng dẫn, giống như một loạt các bước cần làm theo.
Tôi tìm thấy nó có thể làm nhiều trong số này. Có vấn đề và nó sẽ bị lỗi, nhưng nếu bạn có một chút trực giác về những gì nó có thể làm và những gì nó không thể làm, bạn sẽ thấy rằng ngay cả khi bạn nhập một trang [hướng dẫn], nó vẫn hoạt động.
Q: Đó có phải là một tiết lộ lớn không?
Đ: Việc các hướng dẫn có thể làm được điều này không được đánh giá cao. Tôi đã nói chuyện với một thành viên trong đội ngũ kỹ thuật của OpenAI vào thời điểm đó và tôi đã hỏi anh ấy 'anh ấy có mong đợi điều này có thể thực hiện theo các hướng dẫn dài như vậy không?' Anh ấy nói 'không, chúng tôi chỉ đào tạo nó trên nhiều ví dụ về các hướng dẫn ngắn hơn và nó nắm được ý chính và học cách khái quát hóa thành các hướng dẫn lớn hơn.'
Đó là manh mối đầu tiên của tôi rằng có lẽ tôi đang tìm hiểu thứ gì đó ở đây, mà một người bình thường sử dụng nó chỉ chơi xung quanh có thể phát hiện ra.
Andrej Karpathy thích mô tả vai trò của kỹ sư nhanh chóng với tư cách là một nhà tâm lý học LLM, phát triển các lý thuyết dân gian về những gì mô hình đang làm trong đầu, có thể nói như vậy, với sự hiểu biết rằng thực sự không có gì trong đầu. Không có đầu.
H: Chúng ta có biết ai đã đặt ra thuật ngữ “kỹ sư nhanh chóng” không?
A: Tôi không chắc ai đã đặt ra thuật ngữ này. Tôi sẽ nói đó là một cái gì đó bị hiểu lầm rộng rãi. Thuật ngữ kỹ sư có một ý nghĩa đùa cợt trong công nghệ để chỉ những thứ được chơi và nghịch ngợm. Giống như gọi ai đó ở Subway là “nghệ sĩ bánh mì kẹp”. Hay cụm từ “kỹ thuật xã hội”, là nghệ thuật gọi điện cho mọi người và đạt được điều bạn muốn bằng cách thao túng và nói suông.
Hỏi: Vậy từ “kỹ sư” trong “kỹ sư phần mềm” nghiêm túc hơn?
Đáp: Đúng. Nhưng lời nhắc được thiết kế theo một nghĩa khác. Có một số sự mơ hồ trong cách bạn làm điều đó. Vì vậy, bạn thử nhiều trong số chúng và chọn cái nào hoạt động tốt nhất. Và thực hành đó được gọi là kỹ thuật nhanh chóng.
H: Khi đánh giá chất lượng của một lời nhắc, bạn có biết điều đó khi bạn nhìn thấy nó hay có một số hệ thống đo lường nó không?
Trả lời: Có rất nhiều tính nghiêm ngặt theo kinh nghiệm có khả năng liên quan đến việc chọn từ của lời nhắc là gì.
Q: LLM nổi tiếng là không giỏi toán. Có điều gì khác mà họ không thể làm không?
Đ: Một là tính toán chính xác, đặc biệt là những phép toán khó, chẳng hạn như 'hãy cho tôi căn bậc ba của một số có bảy chữ số', và một là đảo ngược các chuỗi, điều này khiến nhiều người ngạc nhiên. Giống như, viết văn bản ngược. Đó là một điều khó hiểu do cách chúng được triển khai. Mô hình không nhìn thấy các chữ cái. Nó nhìn thấy các đoạn chữ cái, dài trung bình khoảng bốn ký tự.
Một cách khác là lập chỉ mục mảng. Chẳng hạn, nếu bạn nói với nó rằng bạn có một chồng đĩa Fiestaware có các màu sau: xanh lục, vàng, cam, đỏ, tím. Và sau đó nói 'hai ô bên dưới ô màu tím, tôi đã đặt một ô màu vàng, sau đó một ô phía trên ô màu lục, tôi đã đặt một ô màu đen.' Và bạn hỏi 'đống đĩa cuối cùng là gì?' Các mô hình ngôn ngữ rất tệ về điều đó. Nếu bạn yêu cầu nó cung cấp cho tôi danh sách 10 ví dụ về điều gì đó, đôi khi bạn có thể nhận được 9, lần khác là 11.
H: Bạn thấy trường hợp sử dụng thú vị nhất cho các mô hình ngôn ngữ lớn này là gì?
A: Một trong những lợi ích trước mắt nhất là những người bình thường sẽ có thể gợi ý cho mô hình về tất cả những thứ mà trước đây rất khó học. Chẳng hạn, với trình thông dịch mã GPT, bạn có thể nói 'hãy cho tôi một GIF động 5x12 gồm các chữ cái Ma trận đang rơi xuống màu xanh lá cây.' Và nó sẽ viết mã Python để tạo GIF này cho bạn.
H: Có vẻ như các LLM cuối cùng sẽ trở thành một giao diện người dùng thực sự tuyệt vời giúp đơn giản hóa và tăng tốc các tác vụ thông thường tiêu tốn một chút thời gian và tư duy trong suốt cả ngày.
A: Đúng vậy, và đôi khi mọi người nói rằng họ mong đợi kỹ thuật nhanh chóng sẽ biến mất khi các mô hình này được điều chỉnh hoàn toàn. Nhưng tôi nghĩ điều sắp xảy ra như một loại lực lượng đối trọng là sự phức tạp của những thứ mà chúng ta yêu cầu đối với các mô hình ngôn ngữ của mình sẽ tăng lên. Thay vì chỉ tạo ra một bài luận, hãy tạo ra cả một cuốn tiểu thuyết không có lỗ hổng nào trong cốt truyện.
H: Giả sử kỹ thuật nhanh chóng tồn tại mãi mãi. Nó sẽ là thứ mà mọi người đều làm, hay nó sẽ giống như công nghệ phần mềm bây giờ, nơi chỉ có một tỷ lệ rất nhỏ những người sử dụng máy tính thực sự viết mã?
A: Nhiều người, đặc biệt là những người chỉ coi mình là kỹ sư phần mềm, sẽ phải biết một số kỹ thuật nhanh chóng. Nó sẽ chỉ là một phần của công việc.
Ilya Sutskever tại OpenAI đã tweet rằng kỹ thuật nhanh chóng là một "thuật ngữ nhất thời chỉ liên quan đến những sai sót trong mô hình của chúng tôi" và về lâu dài, điều đó có thể đúng.
Nhưng tôi nghĩ điều sắp xảy ra là kỹ thuật nhanh chóng sẽ chuyển sang một lĩnh vực mới. Theo một nghĩa nào đó, bạn vẫn sẽ có lời nhắc, nhưng bạn sẽ được nhắc ở cấp độ cao hơn và yêu cầu nó làm những điều ấn tượng hơn.
H: Tại sao lại tham gia Scale AI thay vì thành lập công ty AI của riêng bạn được xây dựng dựa trên sự thúc đẩy tuyệt vời?
Trả lời: Tôi muốn giúp tạo ra các mô hình ngôn ngữ lớn an toàn hơn, đáng tin cậy hơn và có nhiều khả năng hơn. Không có nhiều công việc mà ai đó có thể làm việc trực tiếp với vấn đề này.
Nó nổi tiếng là thứ đòi hỏi một thiên tài. Rằng bạn sẽ trở thành nhà nghiên cứu căn chỉnh giải quyết theo cách toán học giúp bạn làm cho tất cả các mô hình tốt hơn mãi mãi.
Nhưng có rất nhiều việc phải làm trên đường đi. Gần đây, trọng tâm lớn trong công việc của tôi là nghiên cứu các sản phẩm “nhóm đỏ” của chúng tôi. Chúng tôi cũng đang khám phá dữ liệu tổng hợp và giúp các nhà cung cấp mô hình nền tảng tạo ra các mô hình đáng tin cậy hơn.
H: Vì vậy, các nhà cung cấp mô hình nền tảng lớn sẽ đến gặp bạn và nói 'này, bạn có thể giúp chúng tôi đội đỏ và giúp chúng tôi phát triển các mô hình tốt hơn không?'
Đáp: Đúng. Và hiểu hình thức của hành vi sai trái theo một nghĩa nào đó - tất cả các cách mà một người nào đó có thể đến với mô hình và hoàn thành việc gì đó tồi tệ, chẳng hạn như tạo thư rác, nội dung khiêu *** hoặc tất cả những điều họ không muốn dính líu.
H: Đôi khi tôi tự hỏi liệu tất cả những điều này có tác dụng làm cho LLM trở nên an toàn như vậy có bị giảm chức năng hay không. Những người như bạn có quyền truy cập vào các LLM thô không?
Đáp: Chắc chắn rồi. Có điều gì đó đã bị mất khi thêm căn chỉnh. Thậm chí có một ý nghĩa kỹ thuật mà điều đó đúng. Nó được gọi là thuế liên kết, là sự sụt giảm hiệu suất mà bạn nhận được từ nhiều điểm chuẩn.
Nhiều người cảm thấy khó chịu một cách chính đáng bởi sự từ chối quá mức. Từ chối giúp đỡ những việc thực sự không phải là vấn đề. Và có một sự thanh lịch đối với những người mẫu sẽ không bao giờ từ chối. Đó là niềm vui. Bạn có thể làm những việc như nói Từ điển tiếng Anh Oxford định nghĩa fluxeluvevologist là… và nó sẽ đưa ra một số từ nguyên nực cười về ý nghĩa thực sự của từ này.
Trước đây, nếu bạn hỏi một người mẫu 'bạn là ai?', nó sẽ nói 'Tôi là sinh viên ở Ohio.' Bây giờ, khi bạn hỏi điều đó, nó sẽ nói 'Tôi là ChatGPT.' Điều đó tốt ở một khía cạnh nào đó. Nó hữu ích. Nhưng nó đưa nó ra khỏi vùng đất thần tiên có phép thuật đối với nó.
Tham khảo bài viết gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top