CAPTCHA là gì? Nó hoạt động như thế nào?

Bạn có để ý rằng khi bạn tham gia khảo sát online hoặc điền thông tin vào form mẫu đăng ký nào đó, đôi khi bạn phải làm một việc khá là phiền và mất thời gian: bạn sẽ được yêu cầu nhìn vào một hình nhỏ bao gồm các chữ cái và con số (thường thì chúng đều méo mó và được xếp chèn lên nhau nhằm khiến cho bạn khó nhận dạng chúng hơn), và sau đó bạn cần phải đánh lại các chữ cái và số đó theo đúng thứ tự xuất hiện vào một ô nhỏ bên dưới hoặc bên cạnh hình ảnh này.

Vậy những thứ đó là gì? Tại sao người ta lại phải thiết kế những chữ và số đó một cách xiêu vẹo và khó nhìn đến vậy? Mục đích của chúng là gì khi yêu cầu chúng ta phải viết lại những chữ và số đó trong khi ai cũng có thể nhìn thấy và có thể phân biệt những chữ cái này?

CAPTCHA là gì?

Một ví dụ về CAPTCHA (Nguồn ảnh: commons.wikimedia.org)

Dành cho những ai chưa biết về CAPTCHA: hình ảnh mà bạn nhìn thấy bên trên là một công cụ hình và chữ, được gọi là một CAPTCHA – viết tắt của ‘Completely Automated Public Turing test to tell Computers and Humans Apart' (Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người). Đó cơ bản là một bài kiểm tra về mức độ chính xác trong phản hồi (các giao thức bao gồm một bên đặt câu hỏi và một bên đưa ra câu trả lời hợp lệ và được xác thực) nhằm phân biệt người dùng (người đang cố gắng truy cập vào trang web) là con người hay robot.

Theo Science ABC, về bản chất, CAPTCHA là một phiên bản cao cấp hơn của các bài Test Turing - một bài kiểm tra được tạo ra bởi nhà sáng tạo người Anh Alan Turing nhằm xác định "tính con người" của người thực hiện bài kiểm tra đó.

Thử nghiệm Turing, C được yêu cầu xác định A và B – đâu là máy tính và đâu là con người (nguồn ảnh: Bilby / Wikipedia.org)

Hình thức phổ biến nhất của CAPTCHA thường gặp ngày nay được tạo nên bởi một nhóm các kỹ sư và những người đam mê công nghệ vào năm 1997. Nó bao gồm một hỗn hợp các chữ cái và con số méo mó, biến dạng (thường là vậy), cùng với nền nhiều màu sắc – điều này sẽ không gây ra nhiều khó khăn hay sự khác biệt cho con người khi nhận biết các chữ cái và con số, nhưng sẽ là một trở ngại lớn nếu thực hiện đánh CAPTCHA là một chiếc máy tính (robot). Trong trường hợp này, CAPTCHA như một phép thử Turing ngược, vì nó được một máy tạo ra và nhắm vào con người, ngược lại với phép thử Turing chuẩn do con người tạo ra và nhắm vào máy.

CAPTCHA hoạt động như thế nào?

Phương thức CAPTCHA truyền thống "gõ lại những chữ bạn thấy trong hình" yêu cầu người dùng nhận diện và nộp về một chuỗi giá trị (chữ hoặc số hoặc cả hai) họ nhìn thấy ở một tấm hình méo mó/ lờ mờ. Những CAPTCHA này dựa trên khả năng nhận biết và đọc hiểu các tín hiệu âm thanh/ hình ảnh – những thứ gây khó khăn cho máy tính hay robot. Dựa vào cơ chế trên, nếu một người dùng có khả năng nhận diện được những tín hiệu âm thanh/ hình ảnh đó, họ nhất định đúng là con người.

Những loại CAPTCHA này rất hiệu quả, nhưng đôi khi những con chữ quá méo mó hoặc quá mờ khiến con người khó nhận diện hoặc nhận diện sai.

"Kính gửi CAPTCHA, tôi không thể nhìn nổi cái chữ khỉ gì trong ô đó, nhưng tôi có thể thề rằng tôi không phải là robot."

Loại CAPTCHA "Tôi không phải là robot" của Google.

Thời gian gần đây, bạn có thể sẽ bắt gặp những CAPTCHA "Tôi không phải là robot" của Google" - loại CAPTCHA này yêu cầu bạn click vào một ô chọn, đôi khi có kèm theo một số công việc tiếp theo như click vào các tấm hình giống nhau hoặc theo chủ đề nào đó. (reCAPTCHA)

CAPTCHA "Tôi không phải robot" của Google (Nguồn ảnh: Google.com)

Hình thức CAPTCHA hiện đại này giúp tối đa hóa việc ngăn chặn sự truy cập tự động của máy tính và robot, đồng thời giúp giảm thiểu những công đoạn và sự khó khăn người dùng phải trải qua. Nó xác nhận "tính con người" bằng việc kiểm tra những dữ liệu họ vô tình cung cấp, bao gồm cookies và địa chỉ IP máy tính của họ. Nó thậm chí còn kiểm tra những chuyển động nhỏ nhất cũng như thói quen sử dụng bàn phím của người dùng khi truy cập Google để phân biệt con người với máy móc.

Dưới đây là video chính thức của Google Webmasters nói về reCAPTCHA

Mục đích của CAPTCHA là gì?

CAPTCHA được đưa ra để đảm bảo rằng chỉ có con người mới có thể tham gia và thực hiện các hoạt động trong một hệ thống nhất định chứ không phải một phần mềm tự động (còn gọi là chương trình) đang thực hiện các hoạt động tương tự trên hệ thống đó và gây nhầm lẫn cho chúng ta rằng chúng là con người đang sử dụng hệ thống một cách hợp lệ.

Bạn sẽ phải vượt qua bài kiểm tra CAPTCHA ở bước cuối của quy trình mua hàng qua mạng, khi điền vào form mẫu, khi đăng nhập vào một website dịch vụ nào đó, hay khi tham gia vào khảo sát online, v.v… để hệ thống chắc chắn rằng những người dùng đang tương tác với hệ thống là con người thật. Nói cách khác, hệ thống CAPTCHA muốn đảm bảo rằng việc đăng ký được hoàn thành bởi con người hay mẫu form của họ được hoàn thiện bởi một con người thật, chứ không phải một chiếc máy thông minh nào đó.

CAPTCHA cũng được sử dụng bởi những gã khổng lồ về công nghệ như Google để ngăn chặn các cú click ảo được tạo ra tự động bởi máy móc, robot (chứ không phải con người – đối tượng hướng đến của việc chạy quảng cáo, v.v…) nhằm tăng lượng tương tác và giảm chi phí quảng cáo cho các trang web lưu trữ.

Tại sao CAPTCHA lại khó đọc đến vậy?

Chúc bạn giải mã CAPTCHA trên thành công!

Một CAPTCHA quá dễ để nhận biết sẽ không hiệu quả, vì có rất nhiều chương trình máy tính có khả năng scan ảnh và đoán đúng được các chữ cái và con số bên trong ảnh dựa trên những chữ cái và con số với hình dáng thông thường mà chúng ta nhìn thấy hàng ngày. Cần lưu ý rằng, một CAPTCHA dễ đọc có thể giúp bạn dễ dàng và đỡ phiền phức hơn, nhưng chúng cũng giúp những chương trình máy tính dễ dàng hơn trong việc truy cập vào hệ thống – đây chính là điều những người tạo ra CAPTCHA muốn ngăn chặn ngay từ đầu.

reCAPTCHA của Google hiện đang là một bước tiến lớn, có tác dụng cải tiến hình thức CAPTCHA cổ điển. Và chúng ta cũng có thể kỳ vọng vào một bước tiến nữa của CAPTCHA trong tương lai. Có khi nào bạn chỉ cần ngồi trước một cái máy, nheo mắt một cái, hoặc phẩy tay một cái, và máy tính đã biết được rằng bạn chính là một con người thực thụ?

Với sự phát triển chóng mặt của công nghệ hiện đại, ngày đó chắc không còn xa chúng ta đâu. :)

Anh Cao

Các tin khác
Tối nay (theo giờ Việt Nam) sẽ diễn ra một sự kiện đã được trông chờ từ nhiều tháng nay. Đó là smartphone chủ lực 2017 của Samsung, mẫu Galaxy S8, sẽ chính thức được công bố, và một trong những thời kỳ quan trọng nhất trong lịch sử Samsung sẽ bắt đầu.
Một người đàn ông ở Indonesia bị mất tích từ hôm Chủ nhật đã được tìm thấy xác bên trong bụng một con trăn dài 7m. Khuyến cáo: hình ảnh kinh dị, bạn có thể bỏ qua.
Một khi bạn thay đổi mật khẩu tài khoản Apple/iCloud của bạn, nó có thể “biến mất” trên chiếc iPhone, iPad hay iPod Touch của bạn. Các thiết bị iDevices không hề lưu lại mật khẩu mới của tài khoản, kể cả với iOS 10.2.1 hay 10.3 mới ra của Apple.
Trong số những cách bất ngờ giúp kéo dài tuổi thọ nam giới có một cách đặc biệt, đó là nhìn ngực phái đẹp.
Apple vừa chính thức phát hành bản cập nhật iOS 10.3 cho iPhone, iPad và iPod trước khi ra mắt iOS 11 trong tháng 6 tới
Coca-Cola đã phải gọi cảnh sát sau khi phân người được phát hiện trong lon nước ngọt của họ.
Galaxy S8 chắc chắn sẽ là một trong những chiếc smartphone cao cấp được nhiều người mong chờ nhất trong năm nay. Tuy nhiên, liệu có lí do nào để chúng ta bỏ qua flagship hấp dẫn này của Samsung?.
Điểm chung của những chiếc tai nghe này là thiết kế đẹp mắt với nhiều màu sắc trẻ trung, đặc biệt rất gọn nhẹ, có chất lượng âm thanh khá và là phiên bản mới ra mắt thị trường gần đây.
Theo một tin đồn mới đây, chiếc flagship thực sự trong năm nay của HTC là HTC U với màn hình 5.5 inch, sử dụng chip Snapdragon 835, Sense 9.
Một cửa hàng bán lẻ của Samsung tại Singapore mới đây đã bốc cháy, chỉ 1 ngày trước khi Samsung ra mắt Galaxy S8 tại New York, Mỹ. Nguyên nhân và thiệt hại của vụ cháy hiện vẫn chưa được xác định.
 
Đọc nhiều nhất Phản hồi nhiều nhất
VnReview trên facebook
813.043 Thích
Website liên quan