Lewat Crowdsourcing, Luis von Ahn Ubah reCAPTCHA jadi Alat Digitalisasi Dokumen

Dalam dunia yang semakin terhubung secara online, sistem keamanan seperti CAPTCHA telah menjadi elemen penting dalam melindungi situs dan aplikasi dari serangan bot dan spam. Namun, apa yang membuat CAPTCHA semakin menarik adalah bagaimana ia memanfaatkan kekuatan kolektif jutaan pengguna internet untuk membantu mengatasi masalah digital yang kompleks.

Awalnya, CAPTCHA memang ditujukan von Ahn untuk sekedar mengamankan situs atau aplikasi dari bot dan spam. Namun, von Ahn melihat potensi dari sistem yang diciptakannya untuk memecahkan masalah berskala besar dengan membangun sistem yang menggabungkan manusia dan internet melalui reCAPTCHA.

Sejatinya reCAPTCHA tak jauh berbeda dengan CAPTCHA, hanya saja dengan reCAPTCHA pengguna internet tidak sekedar mengetik teks terdistrorsi untuk membedakan dirinya dengan robot, tapi membantu digitalisasi ratusan buku dan arsip lama. Kejeniusan di balik model bisnis reCAPTCHA yang dikembangkan von Ahn adalah setiap kali pengguna memverifikasi dirinya, mereka sebenarnya tengah membuat teks digital yang dapat diindeks dari buku, majalah, jurnal, dan surat kabar berusia ratusan tahun.

Siapa sangka, setiap kali mengisi reCAPTCHA dengan kombinasi huruf dan angka yang aneh, kita secara tidak sadar telah mendigitalkan ribuan teks dan buku secara online. Semua ini menjadi mungkin berkat kegilaan von Ahn pada crowdsourcing atau apa yang ia pribadi sebut sebagai human computation. Dengan memanfaatkan pertumbuhan populasi yang terhubung ke internet, von Ahn berhasil membangun kolaborasi dalam jumlah yang belum pernah terjadi sebelumnya.

Bagaimana reCAPTCHA Bekerja?

Tak jauh berbeda dengan CAPTCHA generasi pertama, reCAPTCHA bekerja dengan menampilkan dua kata acak pengguna. Hanya saya, kata-kata yang ditampilkan pada reCAPTCHA merupakan kata-kata nyata yang diperoleh dari teks yang diarsipkan yang tidak dapat diidentifikasi oleh perangkat lunak optical character recognition (OCR).

Sebagai informasi, OCR memungkinkan kita untuk mengkonversikan gambar atau teks menjadi format teks yang dapat dibaca oleh mesin sehingga dapat didigitalkan dan diindeks. OCR menjadi kian krusial karena sebagian besar alur kerja bisnis melibatkan penerimaan informasi dari media cetak.

Meskipun manajemen dokumen tanpa kertas adalah jalan keluarnya, pemindaian dokumen melalui OCR bukan tanpa kekurangan. Pasalnya, banyak teks yang sulit dibaca khususnya dokumen yang telah berusia puluhan bahkan ratusan tahun.

Pada kasus inilah reCAPTCHA menggantikan tugas OCR. Dengan memanfaatkan jumlah pengguna internet yang tak terhitung, reCAPTCHA memanfaatkan mereka untuk menginput dua kata, di mana satu kata merupakan kata yang tidak dapat diinterpretasikan oleh OCR dan satu kata kontrol.

Untuk memperhitungkan kesalahan manusia atau human error dalam proses digitalisasi, reCAPTCHA mengirimkan setiap kata yang tidak dikenal OCR ke banyak pengguna dengan distorsi acak yang berbeda. Jika pengguna memasukkan jawaban yang benar pada kata kontrol terkait, maka jawaban pengguna atas kata yang tidak dikenal itu akan dicatat sebagai tebakan yang masuk akal.

Namun, jika tebakan tiga orang pertama cocok satu sama lain, maka kata tersebut dianggap benar dan akan menjadi kata kontrol dalam tantangan reCAPTCHA lainnya. Dengan algoritma ini, reCAPTCHA mampu mencapai akurasi hingga 99,1%. Jauh lebih akurat dari tingkat akurasi OCR standar dengan 83,5%.

Memanfaatkan Massa untuk Melestarikan Sejarah

Sosok Luis von Ahn (Sumber: GeekWire/Taylor Soper)

Kejeniusan Von Ahn telah membantu media pemberitaan ternama di Amerika Serikat (AS), New York Times untuk mendigitalkan semua koran yang diterbitkan New York Times selama 20 tahun. Hebatnya, dengan crowdsourcing dibalik kerja reCAPTCHA, proses digitalisasi itu hanya memakan waktu beberapa bulan.

Pada tahun 2009, reCAPTCHA dibeli oleh Google yang kemudian digunakan raksasa teknologi itu untuk membangun perpustakaan Google Books, yang kini menjadi salah satu perpustakaan digital terbesar di dunia. Memperluas fungsi reCAPTCHA, Google menggunakan perangkat lunak buatan Von Ahn untuk meminta pengguna mengidentifikasi nama jalan dan alamat dari Google Maps Street View.

Crowdsourcing seperti yang dilakukan von Ahn dalam reCAPTCHA adalah salah satu inovasi yang telah mengubah cara kita melihat interaksi manusia dengan teknologi digital. Dengan memanfaatkan upaya kolektif ratusan juta orang untuk melakukan tugas yang sangat penting yang tidak dapat dilakukan oleh teknologi otomatis pada saat itu.

Bayangkan saja, setahun setelah berdiri, reCAPTCHA telah digunakan oleh lebih dari 40.000 situs dengan lebih dari 1,2 miliar CAPTCHA terpecahkan. Dengan kata lain, lebih dari 440 juta kata tak dikenal berhasil dicatatkan dan lebih dari 17.600 buku mampu ditranskripsi secara manual.

Leave a Reply

Your email address will not be published. Required fields are marked *

  • All Post
  • Design Thinking
  • Edukasi
  • Eksklusif
  • Gaya Hidup
  • Innovation
  • Kesehatan
  • Keuangan
  • Open Innovation
  • Otomotif
  • Pemerintahan
  • Pertambangan
  • Teknologi
  • Uncategorized
  • Workshop

Investing in Innovation

Everyone can innovate, including you. We help people and organizations to innovate in the era of Industrial Revolution 4.0

building

Design Thinking

Newsletter

About Us

PT Investasi Inovasi Indonesia

innovesia.co.id

designthinking.id

Business Address:

Equity Tower, 35th Floor, SCBD Lot 9

Jl. Jendral Sudirman, Kav 52-53, Jakarta 12910

P: +62 21 2939 8903