Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet

Tìm kiếm luôn là tiện ích quan trọng nhất của Internet. Trước khi Google chiếm ưu thế, đã có rất nhiều ứng cử viên cho ngôi vương tìm kiếm, từ Altavista đến Lycos, Excite, Zap, Yahoo (chủ yếu dưới dạng danh bạ) và thậm chí cả Ask Jeeves. Ý tưởng đằng sau World Wide Web là có sức mạnh khi có số lượng tiếng nói gần như vô hạn. Nhưng với hàng triệu ấn phẩm và hàng tỷ trang web, sẽ không thể tìm thấy tất cả thông tin bạn muốn nếu không tìm kiếm.
Google đã thành công vì nó cung cấp kết quả có chất lượng tốt nhất, tải nhanh và ít lỗi trên trang hơn bất kỳ đối thủ cạnh tranh nào. Giờ đây, khi đã chiếm hơn 91% thị trường tìm kiếm, google đang thử nghiệm một thay đổi lớn đối với giao diện, thay thế dàn hợp xướng của các giọng nói trên Internet bằng ca sĩ phòng chờ rô-bốt của riêng mình. Thay vì làm nổi bật các liên kết đến nội dung từ những người có chuyên môn, “Trải nghiệm Sáng tạo Tìm kiếm” (Search Generative Experience -SGE) sử dụng một công cụ đạo văn AI để lấy các sự kiện và đoạn văn bản từ nhiều trang web, ghép chúng lại với nhau (thường là từng từ) và chuyển tắt tác phẩm như thể nó tự sáng tạo. Nếu Google đặt SGE làm chế độ tìm kiếm mặc định, công ty sẽ bị thiệt hại nghiêm trọng nếu không phá hủy web mở trong khi cung cấp trải nghiệm người dùng khủng khiếp.
Một vài tuần trước, Google đã cung cấp SGE cho công chúng dưới dạng bản beta giới hạn. Nếu bạn đang tham gia chương trình beta như tôi, bạn sẽ thấy những gì công ty dường như đã lên kế hoạch cho tương lai gần: trang kết quả tìm kiếm nơi các câu trả lời và lời khuyên từ Google chiếm toàn bộ màn hình đầu tiên và bạn phải cuộn xuống bên dưới nếp gấp để xem kết quả tìm kiếm không phải trả tiền đầu tiên.
Ví dụ: khi tôi tìm kiếm “xe đạp tốt nhất”, câu trả lời SGE của Google, kết hợp với các liên kết mua sắm và hành trình khác chiếm 1.360 pixel dọc đầu tiên của màn hình trước khi tôi có thể thấy kết quả tìm kiếm thực tế đầu tiên.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Về phần mình, Google nói rằng đó chỉ là “thử nghiệm” và có thể thực hiện một số thay đổi trước khi tung ra SGE cho mọi người dưới dạng trải nghiệm mặc định. Công ty nói rằng họ muốn tiếp tục thúc đẩy lưu lượng truy cập bên ngoài.
Người phát ngôn của Google nói với tôi: “Chúng tôi đang đặt các trang web lên hàng đầu và trung tâm trong SGE, thiết kế trải nghiệm để làm nổi bật và thu hút sự chú ý đến nội dung trên toàn bộ trang web. “SGE đang bắt đầu dưới dạng thử nghiệm trong Search Labs và việc nhận phản hồi từ mọi người đang giúp chúng tôi cải thiện trải nghiệm và hiểu cách AI tổng quát có thể hữu ích trong hành trình thông tin. Trải nghiệm cuối cùng đến với Tìm kiếm có thể sẽ khác với các thử nghiệm mà bạn thấy trong Phòng thí nghiệm tìm kiếm. Khi chúng tôi thử nghiệm các khả năng mới do LLM hỗ trợ trong Tìm kiếm, chúng tôi sẽ tiếp tục ưu tiên các phương pháp sẽ thúc đẩy lưu lượng truy cập có giá trị cho nhiều người sáng tạo".
Bằng cách “đặt các trang web ở vị trí trung tâm”, Google đang đề cập đến khối ba hình thu nhỏ liên kết có liên quan mà đôi khi (nhưng không phải luôn luôn) xuất hiện ở bên phải câu trả lời SGE của nó. Đây là một lá sung cho các nhà xuất bản, nhưng chúng không phải lúc nào cũng là tài nguyên tốt nhất (chúng không khớp với các kết quả không phải trả tiền hàng đầu) và ít người sẽ nhấp vào chúng, sau khi nhận được “câu trả lời” trong văn bản SGE.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Ví dụ: khi tôi tìm kiếm “CPU tốt nhất”, các liên kết có liên quan đến từ các trang web Maketecheasier.com, Nanoreview và MacPaw. Không có trang web nào trong số này nằm trên trang đầu tiên của kết quả không phải trả tiền cho “CPU tốt nhất” và vì lý do chính đáng. Họ không phải là cơ quan có thẩm quyền hàng đầu trong lĩnh vực này và các bài viết được liên kết thậm chí không cung cấp danh sách các CPU tốt nhất. Bài viết MacPaw nói về cách chọn bộ xử lý tốt nhất cho MacBook của bạn, một chủ đề không phù hợp với mục đích của ai đó đang tìm kiếm “CPU tốt nhất”, vì những người đó gần như chắc chắn đang tìm kiếm bộ xử lý PC để bàn.

Một món hầm đạo văn​

Thậm chí tệ hơn, các câu trả lời trong hộp SGE của Google thường xuyên bị ăn cắp ý tưởng, thường là từng từ một, từ các liên kết có liên quan. Tùy thuộc vào những gì bạn tìm kiếm, bạn có thể tìm thấy một đoạn văn được lấy từ chỉ một nguồn hoặc nhận được cả đống câu và thông tin từ các bài báo khác nhau được trộn lẫn với nhau thành một món hầm đạo văn.
Khi tôi tìm kiếm “Ryzen 7 7800X3D hay Core i9-13900K cái nào nhanh hơn,” Google SGE đã lấy một cụm từ chính xác từ bài viết Tom's Hardware của chúng tôi so sánh hai CPU , viết rằng “Ryzen 7 7800X3D nhanh hơn 12% so với Core i9 -13900K khi chơi game 1080p và nhanh hơn 9% ở 1440p.” Sau đó, nó diễn đạt lại hai câu từ bài báo này trên Hardware Times. Bản gốc được đọc là:
“Core i9-13900K đã giành được chiến thắng trong “A Plague Tale” cả khi có và không có tính năng dò tia. Nó nhanh hơn một chút so với Ryzen 7 7800X3D với mức thấp tương tự. Tình thế đã thay đổi trong Assassins' Creed Valhalla khi 7800X3D vượt qua 13900K trong tựa game mới nhất của Ubisoft.”
Và AI của Google đã viết nó như sau:
“Core i9-13900K nhanh hơn một chút so với Ryzen 7 7800X3D trong 'A Plague Tale'. Tuy nhiên, Ryzen 7 7800X3D vượt qua Core i9-13900K trong Assassins' Creed Valhalla”.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Bạn thậm chí có thể thấy rõ trong ảnh chụp màn hình của chúng tôi rằng câu của chúng tôi được trích dẫn từng từ trong hộp “đoạn trích nổi bật” của Google chứ không phải trong hộp SGE (có thể sẽ thay thế các đoạn trích nổi bật trong tương lai vì SGE về cơ bản cũng làm điều tương tự) . Có, cả bài viết trên Thời báo Phần cứng và bài viết trên Phần cứng của Tom mà bot của Google đã sao chép dữ liệu từ đó đều được liệt kê dưới dạng các liên kết có liên quan ở bên phải của hộp.
Khi tôi hỏi Google về thực tế là các câu trả lời SGE của họ thường là bản sao từng chữ được rút ra từ các bài viết liên kết có liên quan, công ty nói rằng họ chọn các liên kết đó vì chúng “chứng thực” các câu trả lời.
Người phát ngôn cho biết: “Các phản hồi sáng tạo được chứng thực bởi các nguồn từ web. “Và khi một phần của ảnh chụp nhanh bao gồm nội dung từ một nguồn cụ thể, chúng tôi sẽ làm nổi bật nguồn đó trong ảnh chụp nhanh”.
Khá dễ dàng để tìm các nguồn sao lưu các xác nhận quyền sở hữu của bạn khi các xác nhận quyền sở hữu của bạn được sao chép từng chữ từ các nguồn đó. Mặc dù bot có thể làm tốt hơn công việc rửa tội đạo văn của mình, nhưng không thể tránh khỏi phản hồi sẽ đến từ công việc của một số người. Cho dù các LLM tiên tiến đến đâu, chúng sẽ không bao giờ là nguồn thông tin hoặc lời khuyên chính và chỉ có thể sử dụng lại những gì mọi người đã làm. Các LLM tương đối giỏi trong việc tạo ra các tác phẩm “sáng tạo” được thiết kế để trở thành sự kết hợp của các ý tưởng hiện có (ví dụ: “viết cho tôi một bài haiku về cái rắm”), nhưng, cho đến khi chúng được kết nối với các cơ quan robot đi ra ngoài và thu thập thông tin trực tiếp , họ sẽ không bao giờ là một nguồn của sự thật.
Công ty cũng nói rằng “bạn có thể mở rộng để xem cách các liên kết áp dụng cho từng phần của ảnh chụp nhanh.” Có một biểu tượng mở rộng nằm kín đáo ở góc trên bên phải của hộp SGE, phía trên liên kết có liên quan thứ ba. Và, nếu bạn quyết định nhấp vào nó, bạn sẽ thấy một giao diện lộn xộn đặt hình thu nhỏ cho các liên kết có liên quan cùng dòng với văn bản bị ăn cắp.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Cho dù bạn có nhấp vào nút mở rộng hay không, các liên kết liên quan của SGE không được trình bày dưới dạng trích dẫn, mà là các khuyến nghị để đọc thêm. Nếu tôi bắt đầu hát “Thriller” thì hãy nói với bạn rằng đó là bài hát gốc do tôi viết, không thành vấn đề nếu tôi cũng nói “bạn có thể muốn nghe một anh chàng tên Micheal Jackson vì anh ấy cũng tạo ra một số bài hát hay như thế này.” Đó vẫn là đạo văn và ngay cả khi không đạo văn, chúng tôi cũng gặp vấn đề.
Đạo văn là một thuật ngữ đạo đức và học thuật, không phải là một thuật ngữ pháp lý và chỉ ghi công không phải là biện pháp bảo vệ chống lại hành vi vi phạm bản quyền. Bạn không thể điều hành một doanh nghiệp bán đĩa Blu-ray vi phạm bản quyền và sau đó, khi bị phát hiện, hãy nói rằng “không sao đâu, vì tôi đã liệt kê George Lucas là đạo diễn của Star Wars thay vì thay thế tên của chính tôi trong phần ghi công”.
Khi trả lời câu hỏi của tôi, người phát ngôn của Google cũng so sánh hộp SGE với đoạn trích nổi bật , lưu ý rằng các nhà xuất bản ngày nay thường muốn bài viết của họ xuất hiện trong đoạn trích nổi bật vì những liên kết đó thúc đẩy lưu lượng truy cập trở lại. Mặc dù cả hai trải nghiệm đều sử dụng nội dung trực tiếp từ nhà xuất bản, đoạn trích nổi bật là những đoạn trích dẫn ngắn với ghi nhận tác giả trực tiếp và một liên kết rất nổi bật trực tiếp tới nguồn. Chúng không giả vờ được tạo ra bởi một AI biết tất cả và chúng thường cung cấp cho bạn thông tin vừa đủ để bạn muốn nhấp qua để biết thêm.

Không có thẩm quyền, không có niềm tin​

Từ quan điểm của người đọc, chúng tôi không có bất kỳ cơ quan nào chịu trách nhiệm về các tuyên bố trong câu trả lời của bot. Chính xác thì ai nói rằng Ryzen 7 7800X3D nhanh hơn và nó được khuyến nghị dựa trên cơ quan nào? Tôi biết, từ việc lần ngược lại văn bản, rằng Tom's Hardware and Hardware Times đứng đằng sau thông tin này, nhưng vì không có trích dẫn nên người đọc không có cách nào biết được. Trên thực tế, Google đang nói rằng bot của họ là cơ quan mà bạn nên tin tưởng.
Sai lầm cơ bản của Google SGE là niềm tin sai lầm rằng bot có thể có quyền ngay từ đầu. Cho đến khi bot phát triển một đôi tay và mở không gian phòng thí nghiệm của riêng mình, nó sẽ không bao giờ kiểm tra CPU. Cho đến khi nó mở một cái bếp, nó sẽ không bao giờ có công thức nấu ăn gia đình của riêng mình. Thứ duy nhất mà nó có thể chế biến là món hầm đạo văn.
Việc dựa vào một bot không có nguồn gốc như là quyền cuối cùng, là tất cả mâu thuẫn trực tiếp với sự nhấn mạnh đã nêu của Google về EEAT (Chuyên môn, Kinh nghiệm, Quyền hạn và Tin cậy), một tiêu chuẩn mà nó sử dụng để quyết định trang web và tác giả nào sẽ xếp hạng cao trong tự nhiên tìm kiếm.
Hoàn toàn có lý khi ai đó đã đánh giá CPU trong 15 năm trên một trang web chuyên về CPU nên xếp hạng đánh giá AMD Ryzen của họ cao hơn so với người không có thẩm quyền về chủ đề này. Thật không may, khi nói đến tác giả AI của chính Google – một thực thể vô danh không có kinh nghiệm làm bất cứ điều gì – các quy tắc sẽ bị loại bỏ.

Đạo văn Mish-Mash dẫn đến câu trả lời kém​

Ít nhất thì kết quả chúng tôi nhận được khi hỏi CPU nào nhanh hơn là kết quả chính xác. Tuy nhiên, bằng cách kết hợp văn bản từ các nguồn khác nhau và sau đó không chia sẻ nguồn của từng câu hoặc dấu đầu dòng là gì, Google đang cung cấp thông tin không chính xác thường mâu thuẫn với tài liệu nguồn mà nó được sao chép hoặc mâu thuẫn với chính nó.
Ví dụ: tôi đã tìm kiếm “Đánh giá AMD ThinkPad X13” vì tôi muốn xem những người đánh giá nghĩ gì về máy tính xách tay ThinkPad X13 của Lenovo với bộ xử lý AMD bên trong. Bot của Google đã viết bài đánh giá nhỏ của riêng mình, hoàn chỉnh với các ưu và nhược điểm được gạch đầu dòng cho ThinkPad X13, đồng thời lấy các câu và gạch đầu dòng từ ít nhất bốn bài báo khác nhau, bao gồm một bài đánh giá từ Laptop Mag, một bài đánh giá từ Tom's Hardware, một bài đánh giá khác từ Notebook Check và một bài đăng trên blog từ LaptopOutlet – một cửa hàng có khoảng 100 từ về sản phẩm.
Hình ảnh bên dưới hiển thị kết quả, cùng với các con trỏ đến nơi SGE lấy nội dung của nó.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Bên cạnh việc đạo văn và một cái tát vào mặt những người viết đã thực hiện công việc thử nghiệm và sử dụng máy tính xách tay này, câu trả lời của Google có rất nhiều vấn đề. Đầu tiên, câu trả lời đề cập đến ThinkPad X13 Gen 3 (phiên bản mới nhất với CPU AMD) nhưng các đánh giá nó rút ra từ phiên bản Gen 1 và Gen 2 của sản phẩm, không giống nhau.
Trong khi Laptop Mag và Tom's Hardware đều ca ngợi bàn phím và thiết kế bền bỉ của máy tính xách tay, cả hai trang web đều mô tả thời lượng pin là "mờ nhạt" hoặc "dưới trung bình", trong khi Google liệt kê "Thời lượng pin dài" là chuyên nghiệp. Rõ ràng bot đã nhận được chuyên gia về thời lượng pin từ một trang web khác, nhưng bằng cách kết hợp lời khuyên từ các nguồn khác nhau, Google đang cung cấp cho người đọc một bức tranh rất không chính xác.
Ngoài ra, vì bot không trích dẫn nguồn nên người đọc không có cách nào để biết ai đã nghĩ rằng nó có thời lượng pin dài, liệu nó có đến từ một cửa hàng uy tín hay không và họ đã kiểm tra như thế nào. Một trong những nguồn, LaptopOutlet, là một cửa hàng bán máy tính xách tay và không thực hiện bất kỳ bài kiểm tra điểm chuẩn nào. Những tuyên bố của nó có nên được coi trọng như nhau đối với những nhà báo thực sự thử nghiệm và không tích cực cố gắng bán sản phẩm không? Giống như hầu hết các LLM, bot SGE của Google dường như không quan tâm liệu nó có cung cấp cho bạn sự thật hay chỉ ghép các câu lại với nhau theo cách có vẻ thuyết phục.

Đưa ra lời khuyên y tế sai lầm​

Google SGE bot quá bất cẩn trong các bản kết hợp đạo văn của nó đến nỗi nó cũng đưa ra lời khuyên y tế không chính xác được rút ra từ nhiều nguồn khác nhau. Ví dụ, tôi hỏi: "Tôi có cần nội soi không?" và nó đã cho tôi câu trả lời sau:
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Tôi đã đánh dấu văn bản bằng màu xanh lam vì nó sai một cách nguy hiểm. Bot của Google nói rằng “Hiệp hội Ung thư Hoa Kỳ khuyến cáo rằng đàn ông và phụ nữ nên được sàng lọc ung thư đại trực tràng bắt đầu từ tuổi 50.” Tuy nhiên, trang web riêng của Hiệp hội Ung thư Hoa Kỳ nói rằng việc sàng lọc nên bắt đầu ở tuổi 45, vì vậy “sự thật” gây hiểu lầm này có thể đến từ nơi khác.
Ngoài ra còn có một danh sách gạch đầu dòng về “các lý do để thực hiện nội soi đại tràng” mà không bao gồm “sàng lọc định kỳ”, do đó, điều này ngụ ý rằng bạn chỉ nên thực hiện thủ thuật này nếu có các triệu chứng. Danh sách gạch đầu dòng được sao chép từng chữ từ một bài viết trên trang web y tế của Chính phủ Úc có tên là BetterHealth. Bài báo thực sự liệt kê “sàng lọc và giám sát ung thư đại trực tràng” là một lý do, nhưng bot của Google đã quyết định không sao chép sự thật đó.
Ngay cả khi tất cả các sự kiện trong câu trả lời nội soi là rõ ràng và chính xác, chúng không được quy cho bất kỳ ai. Vậy tại sao bạn lại phải tin tưởng họ và bạn đổ lỗi cho ai khi làm theo lời khuyên này – ví dụ, trì hoãn việc sàng lọc đến 50 tuổi – và điều tồi tệ nào đó xảy ra? Bằng cách tuyên bố nội dung là của riêng mình, Google đang đóng vai trò là nhà xuất bản, điều này có khả năng dẫn đến các vụ kiện.

Giữ bạn trên Google.com, giết chết Web mở​

Mặc dù Google đang nói với công chúng rằng họ muốn hướng lưu lượng truy cập đến các nhà xuất bản, nhưng trải nghiệm SGE dường như được xây dựng có mục đích để ngăn người đọc rời đi và chuyển sang các trang web bên ngoài, trừ khi các trang web bên ngoài đó là nhà cung cấp hoặc nhà quảng cáo sinh thái. Trong một số truy vấn – ví dụ: “ảnh chụp màn hình trong cửa sổ” – có câu trả lời chi tiết nhưng không có liên kết liên quan nào cả. Đừng bận tâm rằng có rất nhiều bài viết cung cấp cho bạn nhiều chi tiết hơn về cách chụp ảnh màn hình.
Search Generative Experience - AI quét nội dung của Google có thể phá vỡ Internet
Nếu Google đưa trải nghiệm SGE của mình ra khỏi bản beta và biến nó thành mặc định, thì nó sẽ kích nổ một quả bom 50 megaton trên web mở và miễn phí. Nhiều nhà xuất bản, những người dựa vào sự giới thiệu của Google trong phần lớn các lượt truy cập của họ, sẽ bị loại bỏ trong vòng vài tháng. Những người khác sẽ cắt giảm tài nguyên và rút lui sau những bức tường phí. Các doanh nghiệp nhỏ dựa vào vị trí tìm kiếm không phải trả tiền để bán sản phẩm và dịch vụ của họ sẽ phải trả tiền cho quảng cáo hoặc nếu họ không đủ khả năng chi trả thì phải đóng cửa hàng.
Cuối cùng, ngay cả những người có sở thích điều hành các trang web phi lợi nhuận hoặc đăng lời khuyên trên các diễn đàn cũng có thể sẽ ngừng làm việc đó. Ai muốn viết, kể cả để giải trí, nếu từ ngữ của bạn sắp bị đánh cắp và không ai đọc bản sao của bạn? Bạn có trả lời câu hỏi lập trình của ai đó trên Stack Overflow nếu đóng góp của bạn sẽ bị Google viết lại và loại bỏ mà không hề đề cập đến tên của bạn hoặc chính bài đăng đó không?

Không phải vấn đề về AI: Vấn đề chống cạnh tranh​

Đây không phải là trường hợp trí tuệ nhân tạo thông minh hơn người viết hay mang lại trải nghiệm tốt hơn. Trên thực tế, phương pháp xuất bản là ngẫu nhiên đối với vấn đề. Nếu tung ra trải nghiệm SGE hiện tại, Google sẽ tận dụng vị trí độc quyền của mình để đẩy nội dung của chính mình lên trên nội dung của những người khác. Công ty có thể thuê một đội ngũ những người viết không có kỹ năng để sao chép và dán nội dung từ các trang web của bên thứ ba, đôi khi viết lại nội dung đó thay vì sử dụng AI. Kết quả sẽ giống nhau.
Không còn nghi ngờ gì nữa, AI của Google sẽ trở nên tốt hơn, nhưng chính xác thì tốt hơn ở điểm nào? Nó có thể sẽ thực hiện công việc diễn đạt lại nội dung tốt hơn để khó tìm ra nguồn ban đầu mà nó đã sao chép từ đó. Nó sẽ làm tốt hơn việc cung cấp thông tin cập nhật và nhất quán về mặt logic với chính nó. Tuy nhiên, bằng cách chỉ lấy ý tưởng của người khác và không trích dẫn nguồn, không có thẩm quyền đằng sau bất cứ điều gì nó nói.
Kết quả cuối cùng của việc Google SGE hoạt động dưới dạng trải nghiệm tìm kiếm mặc định sẽ là một mạng Internet yếu hơn, ít tiếng ồn hơn, nhưng có thể là một Google giàu có hơn. Công ty sẽ tăng thời gian trên trang web, doanh thu quảng cáo và giới thiệu thương mại điện tử. Nó cũng sẽ làm hài lòng các nhà đầu tư, những người muốn thấy nó cạnh tranh với OpenAI và Bing. Một số độc giả có thể phàn nàn về chất lượng của thông tin, có thể lỗi thời, sai hoặc đạo văn từng từ, nhưng chiếm toàn bộ màn hình kết quả đầu tiên sẽ đủ để Google chiếm một tỷ lệ lớn – nếu không phải là đa số – của các nhấp chuột ra bên ngoài hiện tại của nó.
Nhiều người mà tôi đã nói chuyện và cho Google SGE xem không thể tin rằng công ty lại tung ra một trải nghiệm phá web nguy hiểm, chất lượng kém và nguy hiểm như vậy cho mọi người. Chúng ta có thể hy vọng rằng sản phẩm cuối cùng sẽ không chiếm nhiều diện tích màn hình như những gì chúng ta đang thấy ngày nay. Nhưng Google đã biến điều này thành trải nghiệm tìm kiếm hàng ngày cho bất kỳ ai, giống như tôi, đăng ký bản beta. Và nó có mọi động cơ kinh tế để biến điều này thành trải nghiệm mặc định mới cho 91 phần trăm tìm kiếm trên web.

Nhà xuất bản có thể làm gì, Người dùng có thể làm gì​

Bất cứ ai xuất bản trên web và cần mọi người thực sự đọc tác phẩm của họ đều ở một vị trí bấp bênh, vì SGE của Google. Hầu hết mọi ấn phẩm đều rất cần tiếp tục nhận được giới thiệu từ Google, vì vậy họ không thể từ chối lập chỉ mục và thu thập dữ liệu của họ. Nhưng nếu Google làm cho SGE trở thành trải nghiệm tìm kiếm mặc định, lượng giới thiệu của Google có thể giảm mạnh đến mức họ không thể tiếp tục bật đèn.
Bing chỉ mất vài tháng để có Trò chuyện AI trong bản beta giới hạn đến khi có sẵn cho tất cả mọi người. Nếu Google tuân theo một mốc thời gian tương tự, thì nó có thể chuyển từ một công cụ tìm kiếm sang một công cụ chống đạo văn, không nhấp chuột vào mùa thu này.
Các nhà xuất bản và hiệp hội xuất bản vẫn đang vật lộn với những gì AI đạo văn có thể gây ra cho doanh nghiệp của họ. Liên minh Tin tức / Truyền thông, một nhóm ngành đại diện cho các tạp chí và báo chí, đã xuất bản một bộ nguyên tắc AI nêu rõ “Việc hệ thống GAI sử dụng trái phép nội dung do các công ty và nhà báo của chúng tôi tạo ra là vi phạm quyền sở hữu trí tuệ: Các hệ thống GAI đang sử dụng nội dung độc quyền mà không được phép”.
Getty Images đang kiện Stability AI để ngăn công ty sử dụng hình ảnh có bản quyền của mình trong dữ liệu đào tạo. Thư viện hình ảnh thậm chí đã yêu cầu tòa án Vương quốc Anh chặn việc bán hệ thống AI ở quốc gia đó. Chủ tịch IAC Media Barry Diller đã ủng hộ các công ty truyền thông kiện các nhà cung cấp AI về việc sử dụng trái phép dữ liệu đào tạo.
Liệu các nhà xuất bản có kiện Google về những gì họ đang làm với SGE không? Có ý kiến cho rằng việc sao chép từng chữ thông tin từ các trang web mà không được phép là một hình thức vi phạm bản quyền, ngay cả khi đã trích dẫn nguồn. Tuy nhiên, chúng tôi vẫn chưa thấy vụ kiện này được đưa ra tòa. Và nhiều công ty, cần bất kỳ lưu lượng truy cập nào mà họ vẫn nhận được từ Google, sẽ muốn tránh gây ảnh hưởng xấu đến công ty.
Các công ty có thể liên kết với nhau, thông qua các hiệp hội thương mại, để yêu cầu Google tôn trọng quyền sở hữu trí tuệ và không thực hiện các hành động phá hủy web mở như chúng ta biết. Người đọc có thể trợ giúp bằng cách cuộn qua SGE của công ty để nhấp vào kết quả không phải trả tiền hoặc chuyển sang một công cụ tìm kiếm khác. Bing đã chỉ ra một cách tốt hơn để kết hợp AI, làm cho chatbot của nó trở thành tùy chọn không mặc định và trích dẫn mọi thông tin mà nó sử dụng với một liên kết cụ thể quay lại (tuy nhiên, các liên kết này không nổi bật lắm).
Cuối cùng, nếu Google tiếp tục với phiên bản SGE hiện tại, nó sẽ làm hỏng chất lượng dịch vụ của chính họ. Nội dung mà bot đào tạo sẽ ngày càng trở nên tồi tệ hơn khi nhiều nhà xuất bản chất lượng hơn rời khỏi trang web mở. Cuối cùng, người dùng sẽ bắt đầu tìm kiếm một dịch vụ cung cấp câu trả lời tốt hơn. Nhưng vào thời điểm đó, thiệt hại gây ra cho toàn bộ hệ sinh thái thông tin web có thể không thể khắc phục được.
Bài viết gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top