創新點:他發明了辨別電腦前是否是真人的「驗證碼」(CAPTCHA),這是他的故事。
本文 4 大重點:1. 暑假娛樂是數學解題,到糖果工廠卻只愛拆機器。2. 用系統分辨電腦後面是不是人類,解決讓雅虎頭痛的問題。3. 隨機結合兩個人玩遊戲,順便為網路照片貼標籤。4. 想要免費使用服務,就要「義務」協助電子化紙本內容。
大家在網路上申請各種帳號的時候,常被要求填寫「驗證碼」;例如將一張圖片上扭曲的字打出來,或是從多張圖片中選出有「紅綠燈」的。這個技術主要是用來判斷申請者是不是人類,而它是由 Luis von Ahn 所發明的。但 Von Ahn 都將這個服務免費的提供給網路平台商,那他的公司如何賺錢?
1. 暑假娛樂是數學解題,到糖果工廠卻只愛拆機器
大家暑假時都會如何打發時間?每天睡到自然醒、24小時不斷玩電動、和朋友整天膩在一起、還是出門旅行?
出生並成長於 80 年代瓜地馬拉 (Guatemala) 的 Luis von Ahn沒有網路、手機,所以他暑假的娛樂就是找來下學年的數學課本,然後一題一題的解。在解題的過程中,von Ahn 愛上了數學,以及解決難題。
(同場加映:另一位和 von Ahn 一樣出生於中美洲的創業家,帶給了我們「善良」的零食。請看:亂世之中,我們是否能保持「善良」?這家企業發出「好人卡」,並將善良變成 30 億美金的大生意!)
除了解題,von Ahn 也愛玩電動。8 歲那年,von Ahn 要求母親買一台任天堂的遊戲機給他。但母親卻買了一台 Commodore 64 家用電腦。雖然 8 歲的 von Ahn 完全不懂得使用電腦,但想要玩電動,而且又熱愛解決問題的他,很快的就靠著閱讀使用者手冊,搞懂了如何操作這台機器。
圖說:Commodore 64 (圖片來源:Wikipedia)
同時,von Ahn 還發現他只要將向朋友借來的電腦遊戲,複製到自己的磁碟片中,就可以擁有這個遊戲。於是,他開始用手上的遊戲和附近的年輕人們交換,很快的他家裡成為了小小的電玩收藏室。
到了週末,von Ahn 會在他母親家開的糖果工廠中渡過。和他同輩的親戚們都愛到工廠吃免費糖果,但 von Ahn 對工廠裡的機器更有興趣。他每次都找機會將不同的機器拆開然後重組。雖然常因為有零件漏了沒有組回去而被罵,但他依然樂此不疲。
雖然 von Ahn 的成長的過程看來非常多姿多彩,但那個時候的瓜地馬拉其實正處於內戰中,局勢非常混亂,治安非常糟糕。15 歲那年,von Ahn 一位親人被綁架。這讓 von Ahn 決定要離開家鄉,到美國生活。
2. 用系統分辨電腦後面是不是人類,解決讓雅虎頭痛的問題
Von Ahn 在 18 歲時,被美國北卡州最頂尖的杜克大學 (Duke University) 錄取,就讀他最強的數學系。2000 年大學畢業後,他進入了卡內基梅隆大學 (Carnegie Mellon University) 就讀資訊工程系的博士班。
原本,von Ahn 想要繼續就讀數學系,但在一次和數學系教授的聊天中,發現教授正在研究一個 300 年來都沒有人能夠解開的難題。Von Ahn 馬上就在想,300 年都沒有人能夠解決的問題,他怎麼可能解開?
但他在拜訪資工系時,看到的結果就完全不一樣了。因為資工是比較新的科系,所以每一位教授都可以說出最近幾個月來他們解決了什麼問題。這讓喜歡解題的 von Ahn 覺得更有成就感,因此決定要轉換跑道。
一天 von Ahn 和指導教授一起去參與了由雅虎主辦的座談會。當天雅虎的工程師介紹了 10 個雅虎沒有辦法解決的問題。這讓愛解決難題的 von Ahn 精神一振。他在座談會結束後,馬上就開始和指導教授一起討論這些問題。
雅虎在 2000 年時,是一家頂尖的科技公司。因此,連雅虎都無法解決的問題當然都是非常複雜的。在思考了好幾個月之後,von Ahn 總算為其中一個問題找到可能的解決方法。
雅虎其中一個重要的服務是提供免費的電郵地址,但每個地址一天只能寄出 500 封信。於是,很多駭客就寫程式,不斷的申請新的帳號,然後用這些帳號發出大量的垃圾郵件。而這個現象讓雅虎非常頭痛。
Von Ahn 覺得,人類是無法 24 小時坐在電腦前申請新帳號,所以,要解決這個問題只要能夠分辨出操作電腦的是人類還是程式就好了。
那有什麼東西是人類可以輕易做到,而程式不行的?Von Ahn 認為「看圖說故事」是連小孩都可以輕易做到,但對電腦來說卻是非常困難的事。
因此,他設計了一個系統,將扭曲的文章與數字放在圖片中,然後請要申請電郵地址的人,輸入圖片中的字。成功輸入對的人,才被允許申請新的電郵地址。這就是第一版的「驗證碼」(CAPTCHA)了。
圖說:CAPTCHA 中的扭曲文字(圖片來源:Wikipedia)
Von Ahn 將這個系統簡稱為 CAPTCHA,因為 CAPTCHA 聽起來像是英文的「抓到你了」,代表他們成功抓出用程式申請電郵地址的人。而 CAPTCHA 的全名是:「全自動區分電腦和人類的公開圖靈測試」(Completely Automated Public Turing test to tell Computers and Humans Apart) 。
在確保 CAPTCHA 是可行的之後,von Ahn 寫了一封電郵給雅虎,並附上了他的程式與簡單的說明。大約一週後,雅虎就在它們電郵地址申請的頁面上,加入了這個驗證功能,可見它們真的很想要處理這個問題。
21 歲的 von Ahn 雖然解決了雅虎的問題,但並沒有因為這樣而致富。因為,他並沒有向雅虎收取任何費用,所以 CAPTCHA 是免費提供給雅虎的。
網路上其他的廠商看到雅虎的驗證碼,也開始推出類似的程式。不久後 CAPTCHA 就成為了網路上最常見的驗證方法。
(同場加映:Von Ahn 免費提供了 CAPTCHA 給全世界,而這位創業家更厲害,因為他提供免費的「知識」!請看:不收錢,照樣做出「免費的百科全書」!一起來看「維基百科」的成功故事)
3. 隨機結合兩個人玩遊戲,順便為網路照片貼標籤
在解決了雅虎的問題後,von Ahn 繼續回到他的博士論文:找出人類可以做到,但電腦無法完成的事,並設法讓人類來輔助電腦。
在有了 CAPTCHA 的經驗後,von Ahn 決定繼續的朝著「看圖說故事」的方向前進。他設計了一個網路遊戲,將參與者隨機配對成兩人一組,然後給他們一張圖片,並請他們猜對方看到圖片時會想到什麼。
例如,參與者看到一張 101大樓的照片,就可能會寫下:「101」、「建築」、「高樓」、「台灣」等不同的詞。而遊戲就是要看那一對能夠寫出最多相同的詞。
這個遊戲延續 von Ahn 優良的怪咖命名傳統,被稱為「ESP 遊戲」(Extrasensory perception,第六感)。
圖說:ESP遊戲的畫面(圖片擷取:Research Gate)
這邊表面上看來是「心靈感應」的遊戲,其實後面在解決的,是「電腦無法分辨照片」的問題。透過這個遊戲,von Ahn 就能為網路上照片貼上標籤,讓電腦以後也可以透過使用者的輸入,找到正確的照片。
今天,大家一定覺得這個技術沒什麼了不起,因為我們在 Google 輸入「101」,就能夠找到各式各樣 101 相關的照片。而這正是運用了 von Ahn 研究的成果。
ESP 遊戲在 2005 年正式上線,在 4 個月內,它成功吸引了 13,000 人使用,並為約 300,000 張照片加上了超過 130 萬筆標籤。
2006 年,Google 發現了這個研究,就向 von Ahn 購買了使用權,並設計了類似的產品。這個名為 Google Image Labeler 的工具就能夠讓使用者標註上傳到 Google 的照片。
4. 想要免費使用服務,就要「義務」協助電子化紙本內容
博班畢業後,von Ahn 打算繼續留在卡內基梅隆大學做研究。但這時,他接到了來自比爾蓋茲的電話。由於 von Ahn 之前曾在微軟實習,所以裡面的主管都很想招攬他加入微軟研究團隊。但 von Ahn 一直堅持要做自己的研究而婉拒。微軟因此決定要出絕招,找來了創辦人比爾蓋茲親自打電話給 von Ahn。他們在電話中聊了約半小時,但 von Ahn 最後還是沒有加入微軟。
回到卡內基梅隆大學當講師的 von Ahn 還是繼續思考「人類」和「電腦」如何搭配。這時,他忽然想起使用 CAPTCHA 人每次都要花 5 ~ 10 秒的時間,輸入驗證碼。但由於使用者很多,所以這些時間累積起來也非常可觀。於是,他開始思考如何更好的利用這些時間。
在這個時,隨著電子儲存技術的進步,很多公司都開始研究如何將過去數以萬計的紙本書籍數位化。而可行的方法只有兩種,第一是手動輸入,但這個方法耗時耗力,而且容易出現輸入錯誤。
另一種方法,就是將紙本掃描後,利用光學文字辨識技術 (OCR) 去辨別這些文字。但是,辨識技術一般來說大概有 20% 的字是無法辨識的。而那些年代久遠導致文字不清晰的書,就更難被辨識了。
於是,von Ahn 再次想起了人類「看圖說故事」的能力。於是,他改良了CAPTCHA 的做法,並將它命名為「reCAPTCHA」,然後又免費的提供給有需要的網站。唯一不同的是,使用這個服務的網站需要將使用者輸入的字回傳給 von Ahn。
reCAPTCHA 和 CAPTCHA 最大的分別,是在於它不是提供使用者一組扭曲了的文字,而是兩組。其中一組是系統已經知道答案的文字,另一組則是從掃描紙本得來的。只要使用者能夠正確的回答前一組,那系統就會認為後一組的解答也是正確的。
系統同時還會將同一張掃描內容發送給多個使用者交叉驗證,以確保不會有人答對了前一組,卻不小心打錯了後一組的狀況。所以,使用者在輸入驗證碼是,同時也在為紙本的電子化盡一份力。
圖說:reCAPTCHA 提供兩組扭曲文字(圖片來源:Wikipedia)
系統上線後,von Ahn 找了一些小網站合作,但在 2006 年,有一家新興的網站主動聯絡他,想要使用這個服務。這個網站就是後來著名的臉書,而這也讓 reCAPTCHA 的使用量暴增。
(同場加映:Von Ahn 在大學內的研究加強了網路運用;而這位創業家在大學的研究直接催生了網路!請看:如果你看得比老闆遠,那就趕快跳出來自己做!她無法說服老闆把握商機,自己跳出來做出市值 2190 億美金!)
之後一場演講中,von Ahn 分享了 reCAPTCHA 如何能夠協助電子化既有的紙本資訊,而紐約時報技術長正好在場。會後,這位技術長就告訴 von Ahn,紐約時報在全面電子化之前,有約 130 年的紙本內容。他想要 von Ahn 報個價,看看要將全部內容電子化大概需要多少錢。
一開始,von Ahn 並沒有想到 reCAPTCHA 能夠如何賺錢,甚至也沒有想要用它來賺錢(就如 CAPTCHA 和 ESP 遊戲一樣,只是他的研究)。因此,他只好急忙的想辦法估算需要的費用。最後,他不知從如何算出電子化一年的內容,要收 42,000 美元這個數字。但紐約時報沒有討價還價,只是要求他每完成轉換一年的內容,就請款一年的費用。
托臉書的福,reCAPTCHA 那時候已經有非常多的用戶,所以只要一週就大約能將紐約時報一年的紙本電子化。更好的是,von Ahn 其實並沒有需要做些什麼,只要確保 reCAPTCHA 的系統有正常運作,就可以每週收到 42,000 美元。
(同場加映:von Ahn 靠著副業一週賺進 42,000 美元,這位創業家的副業,則變成了龍蝦帝國!請看:景氣差,怎樣「斜槓」才能賺錢?這位「理專」將副業變成 6000 萬美金的龍蝦帝國)
Von Ahn 的老客戶 Google 在這個時候,正好啟動了自己的電子書計劃。它們看到了 reCAPTCHA 後,就決定再次向 von Ahn 購買這個系統。就這樣,von Ahn 再次將他的研究賣給 Google。
圖說:Luis von Ahn (圖片來源:PopTech)
在收購了 reCAPTCHA 後,von Ahn 因為合約的關係,短暫的進入了 Google 工作。而在 2012 年,reCAPTCHA 每天大概能夠協助辨識 1.5 億個需要被電子化的字。
但 von Ahn 的研究並沒有停止。很快的,他又再為「看圖說故事」找到新的應用,而且還設計出一個線上語言學習 App。不過,這又是另一個故事了!
推薦閱讀:
1. 他當過十年和尚,學過馬戲團的功夫,用吃「細嚼慢嚥吃咖哩飯」的心法,打造了價值 2.5 億美金的公司的冥想公司
3. 我愛老公,但每天戴鑽戒上班實在不方便。年收入一億美金的新產品,就從這個「痛點」出發
參考資訊:
1. reCAPTCHA and Duolingo: Luis von Ahn
2. The man teaching 300 million people a new language
3. Inside the mind of Duolingo CEO Luis von Ahn as $700M language learning startup eyes IPO in 2020
5. How Luis Von Ahn Turned Countless Hours Of Mindless Activity Into Something Valuable
6. reCAPTCHA: The Genius Who’s Tricking the World Into Doing His Work
7. The Player