CAPTCHA là gì? Nó hoạt động như thế nào?

Bạn có để ý rằng khi bạn tham gia khảo sát online hoặc điền thông tin vào form mẫu đăng ký nào đó, đôi khi bạn phải làm một việc khá là phiền và mất thời gian: bạn sẽ được yêu cầu nhìn vào một hình nhỏ bao gồm các chữ cái và con số (thường thì chúng đều méo mó và được xếp chèn lên nhau nhằm khiến cho bạn khó nhận dạng chúng hơn), và sau đó bạn cần phải đánh lại các chữ cái và số đó theo đúng thứ tự xuất hiện vào một ô nhỏ bên dưới hoặc bên cạnh hình ảnh này.

Vậy những thứ đó là gì? Tại sao người ta lại phải thiết kế những chữ và số đó một cách xiêu vẹo và khó nhìn đến vậy? Mục đích của chúng là gì khi yêu cầu chúng ta phải viết lại những chữ và số đó trong khi ai cũng có thể nhìn thấy và có thể phân biệt những chữ cái này?

CAPTCHA là gì?

Một ví dụ về CAPTCHA (Nguồn ảnh: commons.wikimedia.org)

Dành cho những ai chưa biết về CAPTCHA: hình ảnh mà bạn nhìn thấy bên trên là một công cụ hình và chữ, được gọi là một CAPTCHA – viết tắt của ‘Completely Automated Public Turing test to tell Computers and Humans Apart' (Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người). Đó cơ bản là một bài kiểm tra về mức độ chính xác trong phản hồi (các giao thức bao gồm một bên đặt câu hỏi và một bên đưa ra câu trả lời hợp lệ và được xác thực) nhằm phân biệt người dùng (người đang cố gắng truy cập vào trang web) là con người hay robot.

Theo Science ABC, về bản chất, CAPTCHA là một phiên bản cao cấp hơn của các bài Test Turing - một bài kiểm tra được tạo ra bởi nhà sáng tạo người Anh Alan Turing nhằm xác định "tính con người" của người thực hiện bài kiểm tra đó.

Thử nghiệm Turing, C được yêu cầu xác định A và B – đâu là máy tính và đâu là con người (nguồn ảnh: Bilby / Wikipedia.org)

Hình thức phổ biến nhất của CAPTCHA thường gặp ngày nay được tạo nên bởi một nhóm các kỹ sư và những người đam mê công nghệ vào năm 1997. Nó bao gồm một hỗn hợp các chữ cái và con số méo mó, biến dạng (thường là vậy), cùng với nền nhiều màu sắc – điều này sẽ không gây ra nhiều khó khăn hay sự khác biệt cho con người khi nhận biết các chữ cái và con số, nhưng sẽ là một trở ngại lớn nếu thực hiện đánh CAPTCHA là một chiếc máy tính (robot). Trong trường hợp này, CAPTCHA như một phép thử Turing ngược, vì nó được một máy tạo ra và nhắm vào con người, ngược lại với phép thử Turing chuẩn do con người tạo ra và nhắm vào máy.

CAPTCHA hoạt động như thế nào?

Phương thức CAPTCHA truyền thống "gõ lại những chữ bạn thấy trong hình" yêu cầu người dùng nhận diện và nộp về một chuỗi giá trị (chữ hoặc số hoặc cả hai) họ nhìn thấy ở một tấm hình méo mó/ lờ mờ. Những CAPTCHA này dựa trên khả năng nhận biết và đọc hiểu các tín hiệu âm thanh/ hình ảnh – những thứ gây khó khăn cho máy tính hay robot. Dựa vào cơ chế trên, nếu một người dùng có khả năng nhận diện được những tín hiệu âm thanh/ hình ảnh đó, họ nhất định đúng là con người.

Những loại CAPTCHA này rất hiệu quả, nhưng đôi khi những con chữ quá méo mó hoặc quá mờ khiến con người khó nhận diện hoặc nhận diện sai.

"Kính gửi CAPTCHA, tôi không thể nhìn nổi cái chữ khỉ gì trong ô đó, nhưng tôi có thể thề rằng tôi không phải là robot."

Loại CAPTCHA "Tôi không phải là robot" của Google.

Thời gian gần đây, bạn có thể sẽ bắt gặp những CAPTCHA "Tôi không phải là robot" của Google" - loại CAPTCHA này yêu cầu bạn click vào một ô chọn, đôi khi có kèm theo một số công việc tiếp theo như click vào các tấm hình giống nhau hoặc theo chủ đề nào đó. (reCAPTCHA)

CAPTCHA "Tôi không phải robot" của Google (Nguồn ảnh: Google.com)

Hình thức CAPTCHA hiện đại này giúp tối đa hóa việc ngăn chặn sự truy cập tự động của máy tính và robot, đồng thời giúp giảm thiểu những công đoạn và sự khó khăn người dùng phải trải qua. Nó xác nhận "tính con người" bằng việc kiểm tra những dữ liệu họ vô tình cung cấp, bao gồm cookies và địa chỉ IP máy tính của họ. Nó thậm chí còn kiểm tra những chuyển động nhỏ nhất cũng như thói quen sử dụng bàn phím của người dùng khi truy cập Google để phân biệt con người với máy móc.

Dưới đây là video chính thức của Google Webmasters nói về reCAPTCHA

Mục đích của CAPTCHA là gì?

CAPTCHA được đưa ra để đảm bảo rằng chỉ có con người mới có thể tham gia và thực hiện các hoạt động trong một hệ thống nhất định chứ không phải một phần mềm tự động (còn gọi là chương trình) đang thực hiện các hoạt động tương tự trên hệ thống đó và gây nhầm lẫn cho chúng ta rằng chúng là con người đang sử dụng hệ thống một cách hợp lệ.

Bạn sẽ phải vượt qua bài kiểm tra CAPTCHA ở bước cuối của quy trình mua hàng qua mạng, khi điền vào form mẫu, khi đăng nhập vào một website dịch vụ nào đó, hay khi tham gia vào khảo sát online, v.v… để hệ thống chắc chắn rằng những người dùng đang tương tác với hệ thống là con người thật. Nói cách khác, hệ thống CAPTCHA muốn đảm bảo rằng việc đăng ký được hoàn thành bởi con người hay mẫu form của họ được hoàn thiện bởi một con người thật, chứ không phải một chiếc máy thông minh nào đó.

CAPTCHA cũng được sử dụng bởi những gã khổng lồ về công nghệ như Google để ngăn chặn các cú click ảo được tạo ra tự động bởi máy móc, robot (chứ không phải con người – đối tượng hướng đến của việc chạy quảng cáo, v.v…) nhằm tăng lượng tương tác và giảm chi phí quảng cáo cho các trang web lưu trữ.

Tại sao CAPTCHA lại khó đọc đến vậy?

Chúc bạn giải mã CAPTCHA trên thành công!

Một CAPTCHA quá dễ để nhận biết sẽ không hiệu quả, vì có rất nhiều chương trình máy tính có khả năng scan ảnh và đoán đúng được các chữ cái và con số bên trong ảnh dựa trên những chữ cái và con số với hình dáng thông thường mà chúng ta nhìn thấy hàng ngày. Cần lưu ý rằng, một CAPTCHA dễ đọc có thể giúp bạn dễ dàng và đỡ phiền phức hơn, nhưng chúng cũng giúp những chương trình máy tính dễ dàng hơn trong việc truy cập vào hệ thống – đây chính là điều những người tạo ra CAPTCHA muốn ngăn chặn ngay từ đầu.

reCAPTCHA của Google hiện đang là một bước tiến lớn, có tác dụng cải tiến hình thức CAPTCHA cổ điển. Và chúng ta cũng có thể kỳ vọng vào một bước tiến nữa của CAPTCHA trong tương lai. Có khi nào bạn chỉ cần ngồi trước một cái máy, nheo mắt một cái, hoặc phẩy tay một cái, và máy tính đã biết được rằng bạn chính là một con người thực thụ?

Với sự phát triển chóng mặt của công nghệ hiện đại, ngày đó chắc không còn xa chúng ta đâu. :)

Anh Cao

Các tin khác
Đây chắc chắn là thắc mắc của rất nhiều người hâm mộ ông chủ Facebook, tỷ phú trẻ tuổi Mark Zuckerberg.
Ông Chang Sau Sheong, người được mệnh danh là “Codefather” của Singapore, đã chia sẻ hành trình của mình để đạt được cái tên ấy và những kinh nghiệm mà ông đúc kết được.
Không chỉ Facebook, Instagram mà các ứng dụng khác đơn cử như Snow cũng copy rất nhiều từ Snapchat, và chắc chắn Snapchat không muốn tình trạng trên tiếp tục tái diễn.
Nhờ áp dụng một công thức đặc biệt, các nhà nghiên cứu đã có thể tiên đoán được tốc độ tối đa của nhiều loài động vật dựa vào kích thước của chúng.
Việc tăng trưởng quá nóng có thể gây áp lực lên hạ tầng và ách tắc giao thông, nhưng sẽ ra sao nếu Uber, Grab rời khỏi Việt Nam (khi không được tiếp tục đề án thí điểm hợp đồng điện tử) và để lại hàng chục nghìn tài xế đang "kiếm sống" bằng nghề lái xe Uber, Grab?
Đồng tiền ảo Bitcoin đã thoát khỏi nguy cơ bị chia tách vào tối thứ Năm vừa qua (20/7), sau khi phần lớn “thợ mỏ” đã đồng ý thực hiện một kế hoạch cải tiến mã hóa có tên gọi là BIP 91. Điều này ngay lập tức đã đẩy giá của Bitcoin lên mức gần 3.000 USD.
Từ ngày 24/7, Sở Giao thông Vận tải Hà Nội, Tổng Công ty vận tải Hà Nội (Transerco) đầu tư thay thế 16 xe mới có sức chứa 60 chỗ trên tuyến xe buýt số 31 với đầy đủ các tiện ích như wifi miễn phí, trang bị bảng LED trên xe, và nhận diện thương hiệu mới.
Meitu, công ty Trung Quốc nổi tiếng với ứng dụng chỉnh sửa ảnh “tự sướng” theo phong cách dễ thương, đã xác nhận sẽ trở thành đối tác châu Á đầu tiên của Facebook trong chương trình thử nghiệm AR Studio. Mục tiêu của sự hợp tác này để tối ưu hóa trải nghiệm chụp ảnh AR trên các ứng dụng của Facebook.
Công ty Thiết bị Kỹ thuật Tin học Hải Anh sẽ là nhà phân phối mới cho các dòng sản phẩm bo mạch chủ của Asus tại miền Bắc.
Hôm 21/7, chính phủ Trung Quốc đã công bố kế hoạch đưa đất nước vươn lên vượt Mỹ để đứng đầu thế giới trong lĩnh vực trí tuệ nhân tạo (AI).
 
Đọc nhiều nhất Phản hồi nhiều nhất
VnReview trên facebook
813.142 Thích
Website liên quan