GPT-5: Từ A đến Z về bản phát hành GPT Chat-GPT tiếp theo của OpenAI

Thoại Viết Hoàng · 26/06/2023

Sự gia tăng mạnh mẽ của từ thông dụng "AI", với việc các công ty vận động cơ bắp và triển khai các công cụ tìm kiếm lời nhắc văn bản đơn giản từ người dùng và thực hiện điều gì đó đáng kinh ngạc ngay lập tức. Tâm điểm của sự ồn ào này là ChatGPT, công cụ AI dựa trên trò chuyện phổ biến có khả năng trò chuyện giống như con người.

Tại sao AI Chatbots có thể trở thành công cụ hỗ trợ tuyệt vời nhưng không thể thay thế liệu pháp điều trị của con người?

Phiên bản ChatGPT hiện tại, miễn phí sử dụng dựa trên GPT-3.5 của OpenAI, một mô hình ngôn ngữ lớn (LLM) sử dụng xử lý ngôn ngữ tự nhiên (NLP) với máy học. Bản phát hành của nó vào tháng 11 năm 2022 đã gây ra một cơn lốc bàn tán về khả năng của AI trong việc tăng tốc quy trình làm việc. Khi làm như vậy, nó cũng làm dấy lên mối lo ngại về việc công nghệ này sẽ lấy đi công việc của con người - hoặc trở thành mối nguy hiểm cho nhân loại về lâu dài. GPT-3.5 đã được GPT-4 kế nhiệm vào tháng 3 năm 2023, mang đến những cải tiến lớn cho chatbot, bao gồm khả năng nhập hình ảnh dưới dạng lời nhắc và hỗ trợ các ứng dụng của bên thứ ba thông qua plugin. Nhưng chỉ vài tháng sau khi phát hành GPT-4, những người đam mê AI đã dự đoán việc phát hành phiên bản tiếp theo của mô hình ngôn ngữ — GPT-5, với kỳ vọng rất lớn về những cải tiến đối với trí thông minh của nó.
Khi nào GPT-5 sẽ được phát hành?
OpenAI đã phát hành GPT-3 vào tháng 6 năm 2020 và tiếp theo là phiên bản mới hơn, được gọi nội bộ là "davinci-002" vào tháng 3 năm 2022. Sau đó là "davinci-003", được biết đến rộng rãi là GPT-3.5, với việc phát hành ChatGPT vào tháng 11 năm 2022, sau đó là bản phát hành của GPT-4 vào tháng 3 năm 2023.
Dựa trên quỹ đạo của các bản phát hành trước, OpenAI có thể không phát hành GPT-5 trong vài tháng. Nó có thể bị trì hoãn hơn nữa do cảm giác hoảng loạn chung mà các công cụ AI như ChatGPT đã tạo ra trên khắp thế giới. GPT-4 đã gây ra nhiều cuộc tranh luận xung quanh việc sử dụng AI có đạo đức và nó có thể gây bất lợi cho nhân loại như thế nào. Ngay sau đó là một bức thư ngỏ có chữ ký của hàng trăm nhà lãnh đạo công nghệ, nhà giáo dục và chức sắc, bao gồm cả Elon Musk và Steve Wozniak, kêu gọi tạm dừng đào tạo các hệ thống "tiên tiến hơn GPT-4". Kể từ đó, Giám đốc điều hành OpenAI Sam Altman đã tuyên bố — ít nhất hai lần — rằng OpenAI không hoạt động trên GPT-5. Vào tháng 6 năm 2023, tại một sự kiện báo chí do The Economic Times tổ chức ở New Delhi, Ấn Độ, Altman cho biết: "Chúng tôi có rất nhiều việc phải làm trước GPT5. Quá trình này cần rất nhiều thời gian. Chúng tôi vẫn chưa đạt được mục tiêu đó." Trước đó, vào tháng 4, Altman đã phát biểu tại một sự kiện của MIT và xác nhận rằng OpenAI "sẽ không [hoạt động trên GPT-5] trong một thời gian." Giám đốc điều hành nói thêm: "Chúng tôi đang làm những việc khác trên GPT-4 mà tôi nghĩ có đủ loại vấn đề an toàn cần giải quyết.
Kỳ vọng chính từ GPT-5: Mạnh hơn, giá tốt hơn
GPT-4 hiện chỉ có khả năng xử lý các yêu cầu có tối đa 8.192 mã thông báo, có nghĩa là 6.144 từ. OpenAI đã nhanh chóng cho phép những người thử nghiệm ban đầu chạy các lệnh có tối đa 32.768 mã thông báo (khoảng 25.000 từ hoặc 50 trang ngữ cảnh) và điều này sẽ được cung cấp rộng rãi trong các bản phát hành sắp tới. Thời lượng truy vấn hiện tại của GPT-4 gấp đôi thời lượng được hỗ trợ trên phiên bản GPT-3.5 miễn phí và chúng tôi có thể mong đợi hỗ trợ cho các đầu vào lớn hơn nhiều với GPT-5.
Đáng chú ý, những truy vấn lớn hơn này cũng có giá. Mặc dù GPT-3.5 được sử dụng miễn phí thông qua ChatGPT, nhưng GPT-4 chỉ khả dụng cho người dùng trong bậc trả phí có tên là ChatGPT Plus. Giá bắt đầu từ $20 mỗi tháng, có thể là một rào cản. Với GPT-5, khi các yêu cầu tính toán và mức độ thành thạo của chatbot tăng lên, chúng tôi cũng có thể thấy giá tăng. Hiện tại, bạn có thể sử dụng Bing AI Chat của Microsoft, ứng dụng này cũng dựa trên GPT-4 và miễn phí sử dụng. Tuy nhiên, bạn sẽ bị ràng buộc với trình duyệt Edge của Microsoft, nơi chatbot AI sẽ theo bạn đến mọi nơi trong hành trình của bạn trên web với tư cách là "đồng nghiệp".

Tính đúng sự thật và ít ảo giác hơn
Bên cạnh việc tốt hơn trong việc tạo ra kết quả nhanh hơn, GPT-5 được kỳ vọng sẽ chính xác hơn trên thực tế. Trong những tháng gần đây, chúng tôi đã chứng kiến một số trường hợp ChatGPT, Bing AI Chat hoặc Google Bard nói ra những điều tồi tệ tuyệt đối — hay còn được gọi là "ảo giác" theo thuật ngữ kỹ thuật. Điều này là do các mô hình này được đào tạo với các tập dữ liệu hạn chế và lỗi thời. Chẳng hạn, phiên bản miễn phí của ChatGPT dựa trên GPT-3.5 chỉ có thông tin đến tháng 6 năm 2021 và có thể trả lời không chính xác khi được hỏi về các sự kiện sau đó.
Để so sánh, GPT-4 đã được đào tạo với tập hợp dữ liệu rộng hơn, vẫn có từ tháng 9 năm 2021. OpenAI đã ghi nhận sự khác biệt nhỏ giữa GPT-4 và GPT-3.5 trong các cuộc trò chuyện thông thường. GPT-4 cũng tỏ ra thành thạo hơn trong vô số bài kiểm tra, bao gồm Bài kiểm tra thanh không định dạng, LSAT, Giải tích AP, v.v. Ngoài ra, nó còn vượt trội so với các bài kiểm tra điểm chuẩn máy học GPT-3.5 không chỉ bằng tiếng Anh mà còn ở 23 ngôn ngữ khác. OpenAI tuyên bố GPT-4 có ít ảo giác hơn nhiều và hoạt động tốt hơn 40% so với GPT-3.5 trong "các đánh giá thực tế về đối thủ nội bộ". Hơn nữa, GPT-4 có xu hướng phản hồi "yêu cầu nhạy cảm" hoặc "nội dung không được phép" thấp hơn 82%, chẳng hạn như yêu cầu tự làm hại bản thân hoặc y tế. Mặc dù vậy, GPT-4 thể hiện nhiều thành kiến khác nhau, nhưng OpenAI cho biết họ đang cải thiện các hệ thống hiện có để phản ánh các giá trị chung của con người và học hỏi từ thông tin phản hồi và đầu vào của con người.
Việc loại bỏ các phản hồi không chính xác khỏi GPT-5 sẽ là chìa khóa để áp dụng rộng rãi hơn trong tương lai, đặc biệt là trong các lĩnh vực quan trọng như y học và giáo dục. Khả năng đa phương thức
GPT-4 thiếu kiến thức về các sự kiện trong thế giới thực sau tháng 9 năm 2021 nhưng gần đây đã được cập nhật với khả năng kết nối Internet ở phiên bản thử nghiệm với sự trợ giúp của plugin dành riêng cho trình duyệt web. Trò chuyện Bing AI của Microsoft, được xây dựng dựa trên GPT của OpenAI và gần đây đã được cập nhật lên GPT-4, đã cho phép người dùng tìm nạp kết quả từ internet. Mặc dù điều đó có nghĩa là truy cập vào dữ liệu cập nhật hơn, nhưng bạn nhất định nhận được kết quả từ các trang web không đáng tin cậy xếp hạng cao trên kết quả tìm kiếm bằng các kỹ thuật SEO bất hợp pháp. Vẫn còn phải xem làm thế nào các mô hình AI này chống lại điều đó và chỉ lấy các kết quả đáng tin cậy đồng thời cũng nhanh chóng. Đây có thể là một trong những lĩnh vực cần cải thiện với các mô hình sắp tới từ OpenAI, đặc biệt là GPT-5.
Ngoài tìm kiếm trên web, GPT-4 cũng có thể sử dụng hình ảnh làm đầu vào để có ngữ cảnh tốt hơn. Tuy nhiên, điều này hiện chỉ giới hạn ở bản xem trước nghiên cứu và sẽ có sẵn trong các bản nâng cấp tuần tự của mô hình. Các phiên bản trong tương lai, đặc biệt là GPT-5, có thể dự kiến sẽ nhận được nhiều khả năng hơn để xử lý dữ liệu ở nhiều dạng khác nhau, chẳng hạn như âm thanh, video, v.v. Meta gần đây đã công bố thông tin chi tiết về mô hình AI đa phương thức, ImageBind, có thể xử lý sáu loại dữ liệu khác nhau: văn bản, hình ảnh, video, âm thanh, độ sâu và bản đồ nhiệt. Người ta có thể dễ dàng mong đợi OpenAI cũng sẽ phát triển trong lĩnh vực này vào thời điểm nó phát hành GPT-5, giúp nó trở nên hữu ích hơn trong nhiều lĩnh vực công việc khác nhau và không giới hạn nó chỉ hoạt động như một chatbot hoặc trình tạo hình ảnh AI.
Dự đoán và lo ngại xung quanh Trí tuệ nhân tạo
Một nhược điểm lớn với các mô hình ngôn ngữ lớn hiện tại là chúng phải được đào tạo với dữ liệu được cung cấp thủ công. Đương nhiên, một trong những điểm bùng phát lớn nhất của trí tuệ nhân tạo sẽ là khi AI có thể nhận biết thông tin và học hỏi như con người. Trạng thái học tập tự động giống như con người này được gọi là Trí tuệ nhân tạo tổng hợp hay AGI. Theo IBM, AGI là giai đoạn mà máy móc "sẽ có ý thức tự nhận thức có khả năng giải quyết vấn đề, học hỏi và lập kế hoạch cho tương lai." AGI vẫn là một khái niệm lý thuyết, với các nhà nghiên cứu và các bên liên quan đến AI bị chia rẽ về thời điểm chính xác khi nó xuất hiện. Tuy nhiên, sự bùng nổ gần đây về mức độ phổ biến của ChatGPT đã dẫn đến những suy đoán liên kết GPT-5 với AGI.
Các công cụ như Auto-GPT cho chúng ta cái nhìn về tương lai khi AGI đã nhận ra. Auto-GPT là một công cụ mã nguồn mở ban đầu được phát hành trên GPT-3.5 và sau đó được cập nhật lên GPT-4, có khả năng tự động thực hiện các tác vụ với mức tối thiểu của con người. Xem xét cách nó khiến máy móc có khả năng tự đưa ra quyết định, AGI được coi là mối đe dọa đối với nhân loại, được nhắc lại trong một blog do Sam Altman viết vào tháng 2 năm 2023. Trong blog, Altman cân nhắc những lợi ích tiềm năng của AGI trong khi trích dẫn nguy cơ "tác hại nghiêm trọng với thế giới." Giám đốc điều hành OpenAI cũng kêu gọi các công ước toàn cầu về quản lý, phân phối lợi ích và chia sẻ quyền truy cập vào AI.

Mặc dù có thể hơi cường điệu khi mong đợi GPT-5 hình thành AGI, đặc biệt là trong vài năm tới, nhưng không thể loại trừ hoàn toàn khả năng này.
14 Trình tạo hình ảnh AI tốt nhất, được xếp hạng
Thế giới hiện đại đôi khi có vẻ rất hoang dã vì tất cả các công nghệ đã được phát minh. Có điện thoại gấp, máy tính bảng đọc như giấy, tai nghe có thể dịch các ngôn ngữ khác trong thời gian thực và trình tạo hình ảnh AI có thể tạo ra một tác phẩm nghệ thuật chân thực chỉ với một ít văn bản hoặc hình ảnh khác.
Dưới đây là ví dụ về một trong những gợi ý được đề xuất cực kỳ chi tiết của Photosonic: "một bức ảnh cận cảnh chân thực của Bob Ross đang làm việc trên một bức tranh canvas về bộ phim chuột Mickey vẫn được chiếu sáng rực rỡ với cảnh núi non và cây cối. Hình ảnh 4K HD này đang là xu hướng trên ArtStation, nổi bật trên Behance. hiển thị, sắc nét hơn ở các chi tiết trung tâm." Điều quan trọng nhất mà bạn nên rút ra từ ví dụ này là lời nhắc của bạn càng cụ thể thì càng tốt. Khi bạn đã hoàn thành lời nhắc văn bản của mình, bạn có thể chọn giữa các định dạng hình ảnh khác nhau, như tranh vẽ, giả tưởng, anime, 3D, phim hoạt hình, khoa học viễn tưởng, ảnh, v.v. Sau đó, có ba kích thước hình ảnh khác nhau để lựa chọn: vuông (512 x 512 pixel), ngang (768 x 512 pixel) hoặc dọc (512 x 768 pixel). Bạn có toàn quyền sử dụng bất kỳ hình ảnh nào mà Photosonic tạo ra cho bạn, cho dù đó là mục đích cá nhân hay thương mại, miễn là bạn tuân thủ các quy tắc và điều khoản dịch vụ.
Để sử dụng Photosonic, bạn cần đăng ký một tài khoản miễn phí và bạn sẽ tự động nhận được một số tín dụng miễn phí để bắt đầu tạo hình ảnh do AI tạo ra. Bạn có thể kiếm thêm tín dụng bằng cách chia sẻ Photosonic với bạn bè và mời họ tham gia ứng dụng, mua tín dụng trả theo mức sử dụng hoặc bạn có thể mở khóa khả năng tạo ảnh không giới hạn bằng cách nâng cấp lên đăng ký trả phí.
Tham khảo bài gốc tại đây

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

GPT-5: Từ A đến Z về bản phát hành GPT Chat-GPT tiếp theo của OpenAI

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Điều gì đã khiến 6G không còn là chuyện của tương lai?

5 điều nên cân nhắc trước khi hỏi ý kiến AI về sức khỏe

Trí tuệ nhân tạo (AI) rút ngắn “chuỗi tiêu diệt” trong các cuộc tấn công vào Iran

Claude của Anthropic sập diện rộng, hàng nghìn người dùng bị ảnh hưởng sau khi vượt ChatGPT

AI học từ dữ liệu lượng tử: Đột phá hóa học, tăng tốc phát triển vật liệu và dược phẩm

ManageEngine tích hợp AI tự hành và Trí tuệ nhân tạo nhân quả nhằm tự động hóa xử lý sự cố CNTT

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Israel dùng những nguồn tình báo nào để định vị chính xác của giáo chủ Iran?

Đánh giá nổi bật