Khả năng mới của ChatGPT thực sự có ý nghĩa gì đối với tất cả chúng ta?

Lizzie

Writer
Tôi cá rằng hầu hết những người đã thử đều đã tìm ra ít nhất một cách hữu ích để tích hợp ChatGPT vào cuộc sống. Phần lớn đã viết về tiềm năng của AI trong việc giúp chúng ta chữa khỏi bệnh ung thư hoặc chống lại biến đổi khí hậu. Nhưng tôi tin chắc rằng tiềm năng của nó trong việc giúp đỡ chúng ta trong cuộc sống hàng ngày, xác định lại mối quan hệ của chúng ta với công nghệ, sẽ mang tính cách mạng không kém.
Đó là lý do tại sao việc xem các bản cập nhật và khả năng mới được thêm vào luôn thú vị. Tuy nhiên, những cập nhật mới nhất đặc biệt kích thích tư duy.
Chúng ta biết rằng việc hướng tới AI tổng quát – AI có thể làm bất cứ điều gì – là một phần trong kế hoạch của nhà phát triển OpenAI. Và khi nói đến việc đạt được mục tiêu đầy tham vọng đó, thị giác, khả năng nói và nghe là khá quan trọng. Vì vậy, thật hợp lý khi chúng ta sắp kỷ niệm một năm ChatGPT có sẵn cho tất cả mọi người, nó sẽ có được những khả năng này.
Nhưng điều này sẽ ảnh hưởng thế nào đến mối quan hệ của chúng ta với người bạn kỹ thuật số mới? Nó sẽ bổ sung thêm điều gì vào khả năng thâm nhập vào cuộc sống của chúng ta và giúp chúng ta giải quyết những thách thức hàng ngày và nó có ý nghĩa gì đối với những câu hỏi lớn xung quanh vị trí của ChatGPT (và AI nói chung) trong xã hội?
Khả năng mới của ChatGPT thực sự có ý nghĩa gì đối với tất cả chúng ta?
Thứ nhất, bằng cách đạt được khả năng phân tích và trích xuất thông tin ngôn ngữ từ hình ảnh, ChatGPT đang đạt được khả năng nhìn một cách hiệu quả. Bạn có thể chỉ cần tải lên một bức ảnh và yêu cầu nó mô tả những gì được hiển thị, cũng như có thể sử dụng nó để thực hiện các nhiệm vụ phức tạp hơn nhiều như chẩn đoán cách sửa chữa các máy móc bị hỏng như xe đạp hoặc máy cắt cỏ.
Điều này có nghĩa là về mặt lý thuyết, ChatGPT không chỉ có thể phân tích các bức ảnh mà còn cả biểu đồ và hình ảnh trực quan, chữ viết tay và tất cả các loại dữ liệu phi cấu trúc từ thế giới xung quanh chúng ta.
Rõ ràng, nó có nhiều công dụng hàng ngày, từ việc tạo danh sách Facebook Marketplace cho các mặt hàng bạn muốn bán cho đến biến những nét vẽ nguệch ngoạc trên bảng trắng thành ghi chú dễ đọc.
Các ví dụ do chính OpenAI đưa ra về cách sử dụng nó bao gồm chụp các món đồ trong tủ lạnh và hỏi bạn có thể làm gì cho bữa tối và trò chuyện trực tiếp về một bức ảnh.
Tuy nhiên, theo New York Times, chức năng được triển khai trong ChatGPT có những hạn chế, một số do thiết kế – chẳng hạn như bị hạn chế ở cách nó có thể được sử dụng để phân tích khuôn mặt con người. Điều này được thực hiện để ngăn chặn việc nó bị lợi dụng để vi phạm quyền riêng tư và phù hợp với cách mà OpenAI trước đây đã hạn chế các sản phẩm của mình.
Một thay đổi khác có thể gây ra những hậu quả sâu rộng là ChatGPT hiện có thể nói và nghe ít nhất nếu bạn đang sử dụng ứng dụng di động.
Vì vậy, cuộc cách mạng giọng nói ngày nay đã khiến việc nói chuyện với những cỗ máy như Siri và Alexa trở nên khá bình thường. Và tất cả chúng ta đều khá quen với việc họ chỉ có thể phản hồi chúng ta theo một số cách hạn chế và nói chung, điều hữu ích nhất họ có thể làm là bật và tắt các thiết bị khác.
Đó là lý do tại sao nói chuyện với ChatGPT là một ý tưởng hấp dẫn. ChatGPT có khả năng tham gia vào các cuộc trò chuyện trôi chảy, tự nhiên hơn nhiều, đủ dễ dàng để tạo ảo giác rằng bạn đang nói chuyện với một người thực.
Và ngoài việc tổ chức một cuộc trò chuyện qua lại, nó có thể mô phỏng giọng nói mà nó nghe thấy, chẳng hạn như có thể được sử dụng để lồng tiếng cho hình đại diện AI. Cũng như một số mục đích nham hiểm khác
Tôi nói là có khả năng vì khi tôi dùng thử ngay sau khi ra mắt, phải nói là nó vẫn chưa hoàn thiện.
ChatGPT đã đôi lần khó hiểu những gì tôi nói. Và kỳ lạ hơn nữa, có vẻ như dữ liệu huấn luyện của nó chưa được cập nhật để cho nó biết nó có thể nói được. Khi tôi yêu cầu nó trợ giúp bằng cách sử dụng chức năng giọng nói, nó nói với tôi một cách chắc chắn rằng nó không có chức năng giọng nói (bằng giọng nói được tổng hợp hoàn hảo của con người). Tôi cũng đã thấy các báo cáo rằng nó có thể gặp khó khăn khi hiểu các giọng và phương ngữ khác nhau.

Điều đó có nghĩa là gì?​

Bước vào một kỷ nguyên mà máy móc không chỉ có thể suy nghĩ mà còn có thể nhìn, nghe và nói rõ ràng là một điều khá quan trọng. Tôi chắc rằng có rất nhiều người sẵn sàng nói rằng nó thực sự chưa thể làm tốt bất kỳ điều gì trong số đó. Nhưng rõ ràng mọi thứ chỉ mới bắt đầu.
Chức năng thị giác và giọng nói có nghĩa là chúng ta có thể thấy công nghệ ChatGPT xuất hiện ngày càng nhiều trong công nghệ di động. Chúng tôi đã có một cặp kính đặt ChatGPT trước mắt bạn, vì vậy bạn sẽ không bao giờ gặp khó khăn trong việc tìm giải pháp cho một vấn đề. Và những điều này giúp bạn thực hiện những cuộc trò chuyện nhỏ thông thường .
Một số người trong số họ đã có thể nghe và nói chuyện – mặc dù những người này sử dụng tiện ích mở rộng của bên thứ ba để thêm chức năng và công nghệ tích hợp của OpenAI sẽ (có khả năng) mang lại trải nghiệm mượt mà hơn nhiều.
Nhưng việc phân tích hình ảnh được hỗ trợ bởi AI theo thời gian thực có sẵn cho chúng ta ngay lập tức, dù chúng ta ở đâu, có thể là yếu tố thay đổi cuộc chơi thực sự trong nhiều lĩnh vực.
Tuy nhiên, nó nêu lên một số cân nhắc về mặt đạo đức. Điều cấp bách nhất là cần lưu ý rằng mặc dù ChatGPT đã đưa ra một loạt hạn chế về hành vi được cho là nhằm ngăn chặn việc sử dụng nó cho các mục đích phi đạo đức, nhưng những hạn chế này đã nhanh chóng bị phá vỡ và trong một số trường hợp, bị loại bỏ hoàn toàn.
Nếu điều này được thực hiện bằng khả năng trực quan của ChatGPT, hậu quả tiềm ẩn có thể còn nghiêm trọng hơn, đặc biệt nếu những kẻ vô đạo đức tìm cách vượt qua rào cản nhận dạng khuôn mặt.
Cũng không lâu sau khi ChatGPT phát hành, các phiên bản sao chép hoạt động giống như nó nhưng không có giới hạn bắt đầu xuất hiện. Đôi khi, những thứ này được người tạo ra chúng bán đặc biệt như những công cụ được thiết kế để vi phạm pháp luật. Liệu chúng ta có thể thấy điều tương tự xảy ra với khả năng bắt chước hình ảnh hoặc giọng nói không? Tôi nghĩ sẽ khá ngu ngốc nếu nghĩ rằng điều đó sẽ không xảy ra.

Nhiệm vụ cho trí tuệ tổng hợp nhân tạo​

Tuy nhiên, có thể còn có điều gì đó khiến chúng ta lo lắng hơn thế.
Với bộ cập nhật mới nhất, ChatGPT ngày càng trở nên đa phương thức. Điều này có nghĩa là nó có thể hiểu và tương tác với nhiều dạng đầu vào khác nhau, như hình ảnh và âm thanh, thay vì chỉ là từ ngữ.
Điều này rất quan trọng vì mục tiêu phát triển AI chắc chắn là trí tuệ nhân tạo tổng hợp (AGI). Đây là thuật ngữ chỉ những cỗ máy có thể thực hiện bất kỳ nhiệm vụ nào miễn là chúng có dữ liệu cần thiết, giống như con người chúng ta có thể làm được. Trở thành đa phương thức có thể dễ dàng được mô tả là thực hiện một bước tiến lớn hướng tới mục tiêu này.
Có lẽ vẫn an toàn khi nói AGI là một chặng đường dài. Giám đốc kỹ thuật của Google Ray Kurzweil đã ước tính chúng tôi sẽ đạt được điều đó vào khoảng năm 2045 và Giám đốc điều hành DeepMind, Demis Hassabis cũng tin rằng điều đó sẽ hoàn thành trong vài thập kỷ tới.
Tuy nhiên, triết gia Nick Bostrom tin rằng “siêu trí tuệ” sẽ xuất hiện vào đầu thế kỷ tới. Người tiên phong về AI và người sáng lập Trung tâm AI tương thích với con người, Giáo sư Stuart Russell, cho biết vẫn còn một chặng đường dài và có những vấn đề lớn mà chúng ta chưa thể giải quyết.
Khi nó xuất hiện, AGI có thể sẽ có tác động khá lớn. Về câu hỏi liệu nó sẽ dẫn chúng ta đến cuộc sống xa hoa trong khi máy móc tạo ra mọi thứ chúng ta cần hay một số phận đen tối hơn , vẫn còn nhiều ý kiến khác nhau .

Giờ thì sao?​

Dù tốt hay xấu, các chính phủ hoặc những người có quyền đưa ra quyết định dường như không chú ý đến lời khuyên của những người đã ký đơn thỉnh cầu Tạm dừng các Thí nghiệm AI khổng lồ.
Điều này có nghĩa là chúng ta có thể thấy sự phát triển của AI tiếp tục và tăng tốc. Chức năng như thế được ChatGPT bổ sung sẽ trở thành một phần trong cuộc sống hàng ngày. Nó cũng sẽ trở nên đáng tin cậy hơn, mạnh mẽ hơn và mang lại trải nghiệm người dùng liên tục được cải thiện. Điều này có nghĩa là sẽ có nhiều ứng dụng và thiết bị được tích hợp công nghệ hơn cũng như danh sách các trường hợp sử dụng công nghiệp và xã hội ngày càng tăng.
ChatGPT hiện có thể nhìn và nghe, vì vậy tôi không nghĩ sẽ còn lâu nữa mới có người tìm ra cách để nó chạm, ngửi và nếm. Sau đó, nó sẽ được trang bị tất cả các chức năng cảm giác giống như chúng ta có và về mặt lý thuyết, nó có khả năng hiểu đầy đủ cách chúng ta nhìn nhận môi trường.
Điều này sẽ mang lại cho nó khả năng giúp chúng ta khám phá rất nhiều hiểu biết sâu sắc - thông tin về thế giới và sự tương tác của chúng ta với thế giới nằm ngoài tầm với của bộ não hữu cơ của chúng ta. Và nó sẽ cung cấp cho chúng ta thông tin đó theo những cách mà nó biết chúng ta có thể sử dụng do nó hiểu rõ khả năng của chúng ta.
Với AI, chúng ta đang trên một hành trình mà đích đến vẫn chưa chắc chắn. Nhưng những tiến bộ như những tiến bộ mà ChatGPT đã thực hiện trong (chưa đầy) năm kể từ khi nó ra mắt cho thấy rõ hai điều: Chúng tôi đang tăng tốc và chúng tôi chỉ có thể đoán điều bất ngờ nào sẽ xảy ra ở góc tiếp theo.
Nguồn: Forbes
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top