Hơn 60 thuật ngữ về trí tuệ nhân tạo - AI cần biết

Thoại Viết Hoàng · 28/06/2023

AI đang phát triển rất nhanh và khó có thể theo kịp thời gian thực. Sử dụng bảng thuật ngữ này làm tài liệu tham khảo cho các thuật ngữ AI.

AI là sự kết thúc của quảng cáo các thương hiệu kiểu truyền thống

Tại sao AI và phát triển phần mềm có mối quan hệ chặt chẽ với nhau?

Ngày càng khó theo kịp AI và danh sách ngày càng nhiều biệt ngữ và thuật ngữ khoa học xung quanh nó.

Hơn 60 thuật ngữ về trí tuệ nhân tạo - AI cần biết

Trong suốt lịch sử của mình, AI đã trải qua những giai đoạn cường điệu nóng và lạnh. Trong thời kỳ cường điệu hóa -- bây giờ với sự bùng nổ của các mô hình ngôn ngữ lớn -- các thuật ngữ mới luôn đi vào cách nói của công chúng.
Tuy nhiên, có nhiều người nghe thấy thuật ngữ AI và nó không đăng ký. Hoặc họ đã nghe thoáng qua nhưng chỉ biết lờ mờ nó là gì. Ngoài ra còn có các mức độ nhận thức khác nhau.
Bảng thuật ngữ này nhằm mục đích phục vụ như một nguồn tài nguyên cho những người mới bắt đầu làm quen với AI và cho những người đang tìm kiếm tài liệu tham khảo hoặc để làm mới vốn từ vựng của họ.
Đại lý. Một tác nhân thông minh là một hệ thống AI có thể nhận thức độc lập về môi trường của nó và hành động một cách tự chủ để đạt được mục tiêu. Môi trường có thể được mô phỏng hoặc vật lý và không cần nhắc đi nhắc lại để đạt được nhiệm vụ lớn hơn.
Căn chỉnh AI
Căn chỉnh AI là quá trình cố gắng để hệ thống AI hoạt động như dự kiến. Sự liên kết bao gồm cả những mục tiêu nhỏ, trực tiếp, chẳng hạn như viết một câu và những mục tiêu khái niệm lớn, chẳng hạn như tuân thủ các giá trị và tiêu chuẩn đạo đức nhất định. Khi các hệ thống AI và mục tiêu của chúng trở nên phức tạp hơn, việc sắp xếp chúng trở nên khó khăn hơn.
Thuật toán
Thuật toán là một quy trình từng bước hoặc tập hợp các hướng dẫn mà máy tính tuân theo. Trong bối cảnh của AI, một thuật toán có thể được sử dụng bởi các hệ thống máy học để nhập dữ liệu và đưa ra dự đoán dựa trên đó.
Thuyết nhân hóa
Anthropomorphism là xu hướng quy những phẩm chất của con người cho những người không phải con người. Ví dụ: gọi chatbot là "anh ấy" hoặc "cô ấy", nói rằng chatbot muốn thứ gì đó hoặc nói rằng chatbot đang cố gắng làm điều gì đó là nhân cách hóa AI. Điều này thường xảy ra trong các cuộc trò chuyện về trí tuệ nhân tạo vì nó thường được thiết kế để phát ra âm thanh hoặc hình dáng giống con người.
Trí tuệ tổng hợp nhân tạo (AGI)
AGI là một cỗ máy có thể thực hiện bất kỳ nhiệm vụ trí tuệ nào mà con người có thể làm. AGI là một thể loại của AI. Không có hệ thống AI hiện tại nào được tính là AGI, mặc dù một số người cho rằng các công nghệ gần đây, chẳng hạn như GPT-4, đã đến gần.
Trí tuệ nhân tạo (AI)
AI là sự mô phỏng các quá trình thông minh của con người bằng hệ thống máy tính.
Thiên kiến. Xu hướng học máy, hay xu hướng AI, xảy ra khi các thuật toán tạo ra kết quả có thành kiến về mặt hệ thống. Xu hướng có thể xuất hiện trong mã của hệ thống AI hoặc dữ liệu mà nó đào tạo. Xu hướng học máy có thể ảnh hưởng đến việc ra quyết định.
Hộp đen AI
Hoạt động của hệ thống AI hộp đen không hiển thị. Người dùng cung cấp đầu vào và máy cung cấp đầu ra. Tuy nhiên, các bước chính xác mà máy đã thực hiện để đưa ra phản hồi là không rõ ràng. AI có thể giải thích được là phản đề của AI hộp đen. Logic và hoạt động chính xác của nó là minh bạch.
Trò chuyệnGPT
ChatGPT là một chatbot của OpenAI đã truyền cảm hứng cho một làn sóng chú ý của công chúng hướng tới các mô hình ngôn ngữ lớn và AI tổng quát. Nó sử dụng các thuật toán để tạo phản hồi văn bản cho đầu vào của người dùng bằng ngôn ngữ tự nhiên.
Chatbot
Chatbot là một công cụ hỗ trợ AI được thiết kế để giao tiếp với mọi người theo cách đàm thoại. ChatGPT là một ví dụ về chatbot. Các chatbot AI sáng tạo đôi khi được sử dụng thay thế cho các công cụ tìm kiếm để truy xuất thông tin.
AI hiến pháp
AI lập hiến huấn luyện các hệ thống AI phù hợp với một tập hợp các giá trị hoặc nguyên tắc như được xác định trong hiến pháp. Cách tiếp cận này được phát triển bởi công ty khởi nghiệp AI Anthropic.
Mạng thần kinh tích chập (CNN)
CNN là một công nghệ tập hợp con của học máy và học sâu được sử dụng trong thị giác máy tính.
Corpus
Kho ngữ liệu là một tập hợp dữ liệu lớn gồm các từ được viết hoặc nói được sử dụng để huấn luyện các mô hình ngôn ngữ.
Phi công phụ
Copilot là tên thương hiệu của bộ sản phẩm nơi làm việc được hỗ trợ bởi AI của Microsoft.
Ngày cắt
Ngày cắt là ngày mà thông tin của mô hình kết thúc. Các mô hình AI không thể nhớ lại thông tin sau ngày giới hạn. Ví dụ: ngày giới hạn của GPT-3.5 là tháng 9 năm 2021.
Khai thác dữ liệu
Khai thác dữ liệu là quá trình tìm kiếm dữ liệu và tìm kiếm các mẫu trong một tập dữ liệu lớn để trích xuất thông tin hữu ích. Tên của các thực thể trong tập dữ liệu là một ví dụ về dữ liệu mà các quy trình khai thác có thể trích xuất.
Xác nhận dữ liệu
Xác thực dữ liệu là quá trình kiểm tra chất lượng dữ liệu trước khi sử dụng dữ liệu đó để phát triển và huấn luyện các mô hình AI.
Dall-E
Dall-E là trình tạo hình ảnh hỗ trợ AI của OpenAI. Người dùng gửi lời nhắc văn bản và công cụ AI sẽ tạo ra một hình ảnh tương ứng.
Deepfake
Deepfake là một trò lừa bịp hình ảnh, âm thanh hoặc video thuyết phục do AI tạo ra. Deepfake có thể là nội dung hoàn toàn nguyên bản cho thấy ai đó đang làm hoặc nói điều gì đó mà họ không làm hoặc nói. Họ cũng có thể mô tả các sự kiện tin tức giả mạo. Một deepfake về vụ nổ Lầu Năm Góc đã lan truyền vào tháng 5 năm 2023 và có tác động rõ rệt đến thị trường chứng khoán.
Học sâu
. Học sâu là một loại hình học máy bắt chước cách con người đạt được một số loại kiến thức nhất định.
Đại lý hiện thân
Các tác nhân hiện thân, còn được gọi là AI hiện thân, là các tác nhân AI có cơ thể vật lý thực hiện các nhiệm vụ cụ thể trong môi trường vật lý.
Sự xuất hiện
Sự xuất hiện mô tả các khả năng phát sinh trong các hệ thống AI một cách khó đoán khi chúng trở nên phức tạp hơn. Các thuộc tính nổi bật của một hệ thống không thể quan sát được trong các bộ phận riêng lẻ của nó.
Đạo luật AI của EU
Đạo luật AI của EU là khung pháp lý để triển khai AI có trách nhiệm theo cách không xung đột với quyền riêng tư dữ liệu.
Hệ thống chuyên gia
Hệ thống chuyên gia là hệ thống AI được sử dụng để mô phỏng phán đoán hoặc hành vi của chuyên gia con người.
Khoảng cách khởi động Fréchet (FID). FID là thước đo để đánh giá chất lượng hình ảnh do AI tổng quát tạo ra.
Rác vào, rác ra (GIGO). GIGO là một khái niệm trong khoa học máy tính cho biết chất lượng đầu ra của hệ thống dựa trên chất lượng của đầu vào. Nếu đầu vào là rác, đầu ra sẽ là rác. Nếu AI được đào tạo trên dữ liệu chất lượng thấp, thì người dùng có thể cho rằng đầu ra của nó cũng kém chất lượng.
Mạng đối thủ chung (GAN). GAN là một loại máy học bao gồm hai mạng thần kinh: một mạng tạo dữ liệu và một mạng phân biệt và tinh chỉnh dữ liệu. Hai mạng lưới thần kinh cạnh tranh để tạo ra các dự đoán chính xác hơn.
AI sáng tạo. AI sáng tạo là một công nghệ trí tuệ nhân tạo tạo ra nội dung bằng cách học các mẫu trong dữ liệu đào tạo và tổng hợp tài liệu mới có cùng đặc điểm đã học.
Đơn vị xử lý đồ họa (GPU). GPU là một loại bộ xử lý phù hợp để cung cấp năng lượng cho phần cứng AI vì nó có thể thực hiện nhiều tính toán đồng thời hơn CPU
Máy biến áp được đào tạo trước (GPT). GPT là thuật toán AI hỗ trợ một số thuật toán tạo và xử lý ngôn ngữ tự nhiên nổi tiếng nhất. GPT-3, GPT-3.5 và GPT-4 là những ví dụ về nhóm thuật toán GPT. Chúng được phát triển bởi OpenAI.
Ảo giác
Ảo giác AI là khi một hệ thống AI trình bày thông tin sai lệch được coi là sự thật. Ví dụ: một chatbot được nhắc viết một báo cáo nghiên cứu dài năm trang với các trích dẫn và liên kết có thể tạo ra các liên kết giả có vẻ như thật nhưng chẳng dẫn đến đâu hoặc ngụy tạo các trích dẫn từ các nhân vật của công chúng để làm bằng chứng. Deepfake khác với ảo giác ở chỗ nó được cố ý tạo ra như một trò lừa bịp để đánh lừa người xem.
Kiến thức kỹ thuật
Kỹ thuật tri thức là lĩnh vực AI nhằm mô phỏng kiến thức của chuyên gia con người trong một lĩnh vực nhất định.
Mô hình ngôn ngữ lớn (LLM). LLM là các thuật toán học sâu để hiểu, tóm tắt, tạo và dự đoán nội dung mới. Chúng thường chứa nhiều tham số và được huấn luyện trên một kho văn bản lớn chưa được gắn nhãn. GPT-3 là một LLM.
Mô hình ngôn ngữ lớn Meta AI (LLaMA). LLaMA là một LLM mã nguồn mở được phát hành bởi Meta.
Máy học. Máy học là một loại thuật toán AI cho phép các ứng dụng phần mềm trở nên chính xác hơn trong việc dự đoán kết quả một cách tự động.
Moats là cơ chế ngăn đối thủ cạnh tranh sao chép LLM độc quyền. Con hào của LLM là dữ liệu đào tạo, trọng số mô hình và chi phí đào tạo.
Người mẫu. Mô hình AI là một thuật toán học máy đã được đào tạo và triển khai.
AI đa phương thức. Các hệ thống AI đa phương thức có thể xử lý đầu vào và tạo đầu ra ở một số phương tiện. Các hệ thống đa phương thức có thể xử lý bất kỳ sự kết hợp nào của hình ảnh, video, văn bản hoặc âm thanh, thay vì chỉ văn bản.
Mô hình sụp đổ. Sự sụp đổ của mô hình là khi nội dung do AI tạo ra có chất lượng thấp làm ô nhiễm tập huấn luyện cho các mô hình trong tương lai.
Sinh ngôn ngữ tự nhiên (NLG). NLG là việc sử dụng AI để tạo ra ngôn ngữ viết hoặc nói từ một tập dữ liệu.
Xử lý ngôn ngữ tự nhiên (NLP). NLP là khả năng của một chương trình máy tính để hiểu ngôn ngữ của con người khi nó được nói và viết. Nó là một lĩnh vực con của ngôn ngữ học là tốt.
Mạng lưới thần kinh. Mạng nơ-ron là một loại công nghệ học sâu được tạo thành từ các nơ-ron nhân tạo được kết nối với nhau. Các tế bào thần kinh là các nút xử lý và truyền thông tin. Hai trong số các loại mạng thần kinh chính là mạng thần kinh tái phát và CNN.
Điện toán thần kinh. Điện toán thần kinh là một phương pháp trong đó thiết kế máy tính được mô phỏng theo các yếu tố của bộ não con người. Nó có thể áp dụng cho cả phần cứng và phần mềm.
OpenAI là một công ty trí tuệ nhân tạo của Mỹ. Nó tiến hành nghiên cứu AI và đã phát triển một số mô hình và dịch vụ AI trong thập kỷ qua, bao gồm GPT-3, ChatGPT và Dall-E.
Trang bị quá mức. Overfitting là một khái niệm trong khoa học dữ liệu trong đó một mô hình thống kê tuân thủ quá chặt với dữ liệu đào tạo của nó, gây hại cho khả năng xử lý dữ liệu chưa nhìn thấy của nó.
Tham số. Các tham số trong AI đề cập đến các cài đặt bên trong được học bởi mô hình máy học trong quá trình đào tạo. Các tham số tăng cường cách tiếp cận của mô hình để nhận dạng mẫu.
Lời nhắc. Lời nhắc là đầu vào mà người dùng cung cấp cho hệ thống trí tuệ nhân tạo với một số kết quả mong đợi. Một số công ty, chẳng hạn như GoDaddy và Uproer, tạo ra các thư viện nhắc nhở để sử dụng với các ứng dụng AI tổng quát, chẳng hạn như ChatGPT.
Mô hình Ngôn ngữ Con đường (PaLM). PaLM là LLM dựa trên máy biến áp của Google, dựa trên công nghệ tương tự như GPT-3 và GPT-4. Chatbot Google Bard chạy trên PaLM.
Kỹ thuật nhanh chóng. Kỹ thuật kịp thời là quá trình phát triển và tinh chỉnh lời nhắc cho LLM. Kỹ thuật nhanh chóng được sử dụng bởi các kỹ sư AI để tinh chỉnh LLM và bởi những người dùng AI chung để trau dồi đầu ra mà họ muốn từ mô hình.
Q-learning. Q-learning là một loại hình học tăng cường cho phép các mô hình AI học hỏi và cải thiện lặp đi lặp lại theo thời gian.
Động cơ khuyến nghị. Công cụ đề xuất là một thuật toán AI được sử dụng để phục vụ nội dung của người dùng dựa trên sở thích của họ. Các trang web xã hội, chẳng hạn như TikTok và các nền tảng phát trực tuyến, chẳng hạn như Spotify và YouTube, sử dụng các công cụ đề xuất để cá nhân hóa nguồn cấp dữ liệu của người dùng.
Học tăng cường. Học tăng cường là một phương pháp đào tạo máy học thưởng cho các hành vi mong muốn và trừng phạt những hành vi không mong muốn. Thông qua học tăng cường, một tác nhân học máy nhận thức được môi trường của nó, thực hiện hành động và học hỏi thông qua thử và sai.
Học tăng cường từ phản hồi của con người (RLHF). RLHF đào tạo các mô hình trực tiếp từ phản hồi của con người, trái ngược với kích thích phần thưởng được mã hóa. Con người có thể chấm điểm đầu ra của chatbot và đưa những điểm số đó trở lại mô hình.
Phân tích tình cảm. Còn được gọi là khai thác quan điểm, phân tích tình cảm là quá trình phân tích văn bản để tìm giọng điệu và quan điểm bằng AI.
Học có giám sát. Học có giám sát huấn luyện các thuật toán máy học trên dữ liệu có nhãn, được gọi là dữ liệu có cấu trúc.
Nhận dạng giọng nói. Nhận dạng giọng nói chuyển đổi ngôn ngữ nói thành văn bản bằng AI.
Dữ liệu tổng hợp. Dữ liệu tổng hợp là thông tin do máy tính tạo ra để thử nghiệm và huấn luyện các mô hình AI. Các mô hình AI lớn cần một lượng lớn dữ liệu để đào tạo, dữ liệu này thường được tạo ra trong thế giới thực.
Sự kỳ dị về công nghệ. Điểm kỳ dị mô tả một thời điểm trong tương lai khi AI tiên tiến trở nên thông minh hơn con người và sự phát triển công nghệ trở nên không thể kiểm soát được.
Dữ liệu đào tạo. Dữ liệu đào tạo đề cập đến thông tin hoặc ví dụ được sử dụng để đào tạo mô hình máy học. Các mô hình AI cần một tập dữ liệu đào tạo lớn để tìm hiểu các mẫu và hướng dẫn hành vi của chúng.
Máy biến thế. Các mô hình máy biến áp là một kiến trúc mô hình AI được sử dụng cho NLP. Các mô hình dựa trên máy biến áp là các mạng thần kinh có thể xử lý ngữ cảnh và các phụ thuộc dài hạn trong ngôn ngữ một cách độc đáo.
Phép thử Turing. Bài kiểm tra Turing là một phương pháp điều tra để xác định xem máy tính có khả năng suy nghĩ như con người hay không. Bài kiểm tra được tạo ra bởi Alan Turing, một nhà khoa học máy tính và nhà phân tích mật mã người Anh. Theo bài kiểm tra Turing, một máy tính có trí thông minh nếu nó có thể bắt chước phản ứng của con người trong những điều kiện nhất định.
Mã thông báo. Mã thông báo là đơn vị văn bản cơ bản mà LLM sử dụng để hiểu và tạo ngôn ngữ. Nó có thể là một từ hoặc một phần của một từ. LLM trả phí, chẳng hạn như API của GPT-4, tính phí người dùng bằng mã thông báo.
Học không giám sát. Học không giám sát huấn luyện các thuật toán máy học trên dữ liệu không có nhãn, được gọi là dữ liệu phi cấu trúc.
Bộ mã hóa tự động đa dạng. Bộ mã hóa tự động đa dạng là một kiến trúc mô hình AI tổng quát thường được sử dụng để phân tích tín hiệu và tìm cách mã hóa hiệu quả dữ liệu đầu vào. Chúng có thể so sánh với GAN ở chỗ chúng đặt hai mạng nơ-ron vào nhau -- một bộ mã hóa và một bộ giải mã.
Zero-shot học tập. Zero-shot learning là một kỹ thuật học máy trong đó các thuật toán quan sát các mẫu không có trong quá trình đào tạo và dự đoán chúng thuộc loại nào. Ví dụ: một bộ phân loại hình ảnh chỉ được đào tạo để nhận dạng mèo sẽ được yêu cầu phân loại hình ảnh sư tử khi biết thêm một số thông tin -- rằng sư tử là loài mèo lớn.
Tham khảo bài gốc tại đây

Tìm kiếm

Có thể bạn quan tâm

Hơn 60 thuật ngữ về trí tuệ nhân tạo - AI cần biết

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Ông lớn Hollywood cho phép công ty AI khai thác dữ liệu, muốn dùng AI tạo sinh sản xuất phim

Người dùng Apple tại Việt Nam chú ý: Apple Intelligence vừa có 1 thông báo quan trọng

OpenAI thừa nhận lỗi chatbot ChatGPT tự ý nhắn tin "tâm sự" với người dùng

Google sẽ đánh dấu triệt để những hình ảnh tạo ra bởi AI

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

NASA đã làm gì để cứu con tàu Voyager 1 cách Trái Đất 24,6 tỷ km

Tiết lộ nguyên nhân AMD bị các hãng laptop tẩy chay, hóa ra cũng chẳng "liêm khiết" lắm đâu!

Mỹ xuất khẩu thịt lợn lớn thứ 3 thế giới nhưng dân Mỹ lại không thích ăn thịt lợn

Cáp quang biển: chiến trường so kè mới giữa Mỹ và Trung Quốc

Khai quốc công thần, tận trung báo quốc, nhưng Nguyễn Trãi đã bị triều đình Hậu Lê bạc đãi ra sao?

Lắp trạm phát sóng di động tại bản mới của Làng Nủ

FBI tố hacker Iran tìm cách can thiệp bầu cử Mỹ, gửi thông tin tranh cử ông Trump cho Biden

Trải nghiệm Huawei MatePad SE 11: máy tính bảng hợp với gia đình, giá chỉ hơn 5 triệu đồng có màn hình lớn 11 inch, vỏ kim loại nguyên khối

Cách tắt online Liên Quân và ẩn thông tin lịch sử đấu cho "người hướng nội"

Đánh giá nổi bật