Sự cường điệu của ChatGPT

Thoại Viết Hoàng · 17/08/2023

Các mô hình ngôn ngữ lớn có thể là công cụ mạnh mẽ cho hóa học nếu chúng ta thừa nhận giới hạn của chúng

Tăng cường các mô hình ngôn ngữ lớn (LLM) thông qua các phương pháp tự sửa lỗi

Làm việc với vai trò công nghệ trong hóa dược, hiện tại không thể trốn tránh các cuộc trò chuyện về ChatGPT của mô hình ngôn ngữ lớn (LLM). Chatbot này nhanh chóng trở thành ứng dụng tiêu dùng phát triển nhanh nhất từ trước đến nay, đáng chú ý là giúp bất kỳ ai cũng có thể trò chuyện với trí tuệ nhân tạo (được định nghĩa một cách lỏng lẻo). Tôi đã đăng ký bằng Tài khoản Google hiện có của mình và có thể trò chuyện với bot theo cách đối thoại bằng cách nhập tiếng Anh đơn giản vào một trang web. ChatGPT cũng rất mạnh mẽ. Nó có thể tóm tắt các văn bản dài hoặc khai thác thông tin cụ thể, đưa ra lời khuyên về giọng điệu trong email, chỉnh sửa hoặc viết mã, đưa ra đề xuất cho các dự án hoặc làm bất cứ điều gì bạn yêu cầu – miễn là bạn chấp nhận rằng câu trả lời có thể sai. Sự kết hợp giữa sức mạnh và khả năng tiếp cận đã khiến bot trở thành công nghệ mới nhất.
Những người yêu thích công nghệ sẽ quen thuộc với chu kỳ cường điệu của Gartner, thước đo mức độ phấn khích đối với bất kỳ sự phát triển mới nào. Thông thường, một khi một bước đột phá trở nên phổ biến, thì ngay sau đó là đỉnh điểm của sự cường điệu và kỳ vọng thổi phồng, thường được hỗ trợ bởi các nhà tiếp thị đang cố gắng kiếm tiền. Có cảm giác đổ xô đi tìm vàng, khi mọi người cố gắng lên tàu vì họ không muốn bị bỏ lại phía sau. Nhưng khi mọi người sử dụng các công cụ mới vì những lý do sai lầm hoặc một trường hợp sử dụng tự nhiên không thành công, thì đỉnh cao sẽ nhường chỗ cho đáy của sự vỡ mộng. Người dùng thất vọng vì nó đã không thay đổi thế giới và đồng thời pha cho họ một tách trà, và các công ty dựa vào công nghệ này có thể thất bại. Cuối cùng, nếu công nghệ này thực sự đáng giá thì cuối cùng nó sẽ đạt đến mức ổn định như bình thường trong kinh doanh mà không có sự vỡ mộng cũng như sự phấn khích thái quá.
Điều mà sự cường điệu che khuất là LLM thực sự vượt xa chatbot
Chu kỳ cường điệu của Gartner mang tính chủ quan, tác động đến những người dùng khác nhau vào những thời điểm khác nhau và cũng không thực sự là một chu kỳ. Tuy nhiên, một khi một công cụ đã đạt đến đỉnh điểm được quảng cáo rầm rộ, thì đó không phải là một quan sát tồi về mặt tâm lý, điều gì sẽ xảy ra tiếp theo.
Đối với các nhà khoa học hàn lâm, những người có thể hưởng lợi từ tiếng vang ban đầu xung quanh một bài báo lớn nhưng không nhất thiết cần công việc đó để biến thành giá trị lâu dài, việc tạo ra và sử dụng sự cường điệu có thể tạo nên sự nghiệp. Khi công nghệ lớn làm điều đó, nó có thể trị giá hàng tỷ đô la. Đối với cả giới học giả và các công ty công nghệ, nhiều người có thể cảm thấy thành công khách quan của họ lớn hơn cái giá phải trả cho những lời phàn nàn về việc bán quá mức, ngay cả khi hoạt động này không phù hợp về mặt đạo đức.
Việc nói rằng một công nghệ hoặc bài báo được thổi phồng cho thấy rằng một phần lợi ích được cho là của nó là phù phiếm hơn là thực chất (tốt nhất), hoặc chủ động sai hoặc có hại (tệ nhất). Và ChatGPT chắc chắn mắc lỗi. Tôi kỳ lạ thích khám phá những giới hạn về khả năng của nó. Ví dụ: nó có một số kiến thức hóa học, nhưng thiếu nhiều khả năng biến đổi hóa học ở cấp độ đại học ban đầu – điều này không có gì đáng ngạc nhiên, vì hầu hết những hiểu biết nâng cao đều bị khóa đằng sau các bức tường phí đăng ký. Đôi khi nó chỉ có thể đúng khi có cơ hội may mắn. Khi tôi yêu cầu nó đề xuất các điều kiện phản ứng cho một khớp nối Suzuki giả định, nó hoạt động rất tốt, nhưng khi tôi mở rộng sang các phản ứng xúc tác khác, tôi nhận ra rằng về cơ bản, nó đề xuất các bộ điều kiện tương tự cho hầu hết các phép biến đổi. Đôi khi nó có thể sai hoàn toàn: khi tôi yêu cầu ChatGPT cho tôi xem một số bài báo tôi đã viết, tôi đã rất ngạc nhiên khi biết bài báo Nature của mình về vật liệu điện phát quang, một lĩnh vực mà về cơ bản tôi không biết gì về nó.
Tôi cũng đã có một cuộc tranh luận dài với bot về việc liệu một con ốc vít có phải là bất đối xứng hay không: một yêu cầu đơn giản bị hủy hoại bởi thực tế là nó chỉ liên quan đến bất đối xứng với các phân tử. Vì nó giống như trò chuyện bằng văn bản với con người, nên về cơ bản, tôi đã lãng phí thời gian để dạy một công cụ không thể dạy được, tính bướng bỉnh được nhân cách hóa của nó khiến tôi vô cùng khó chịu nhưng khả năng tranh luận về một quan điểm nào đó khiến nó buộc phải tiếp tục.
Điều mà sự cường điệu che khuất là LLM thực sự vượt xa chatbot. Khi được truy cập theo chương trình, chúng có thể được cung cấp các biểu đồ tri thức và cơ sở dữ liệu phức tạp với các liên kết giữa nhiều loại thực thể. Hoặc, chúng có thể được xây dựng có mục đích và được điều chỉnh trước bằng kiến thức miền nâng cao, sẵn sàng chọn ra các kết nối khó hoặc quá tốn thời gian để con người giải mã. Pretuning cũng có thể làm giảm đáng kể nguy cơ ảo giác như bài báo Thiên nhiên không tồn tại của tôi. Có thể yêu cầu một mô hình giới hạn các phản hồi của nó đối với những phản hồi từ một kho dữ liệu cụ thể (ví dụ: cơ sở tri thức khám phá thuốc của công ty) và cung cấp các nguồn có thể kiểm tra được. Mặc dù ChatGPT công khai cũng rất mạnh, nhưng các mô hình đặt riêng có thể là nhân tố thay đổi cuộc chơi đối với nhiều mục đích sử dụng dữ liệu hóa học.
Tôi thực sự mong muốn tìm ra nơi các LLM sẽ lấy dược phẩm và hóa học. Chúng đang trở nên ấn tượng hơn qua từng tháng, và với các biện pháp bảo vệ và một số ý thức chung, sức mạnh của chúng trong việc bối cảnh hóa thông tin và nhanh chóng tạo ra kết quả đầu ra là rất ấn tượng. Đối với phiên bản công khai, ngay sau khi tôi có quyền truy cập vào GPT-4 cao cấp hơn, câu hỏi đầu tiên tôi đặt ra là liệu một con vít có phải là bất đối xứng hay không. Không một chút do dự, nó trả lời chính xác là có.
Tham khảo bài viết gốc tại đây: