做人工智能的眼睛_第1頁(yè)
做人工智能的眼睛_第2頁(yè)
做人工智能的眼睛_第3頁(yè)
做人工智能的眼睛_第4頁(yè)
做人工智能的眼睛_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

做人工智能的“眼睛”

張配豪

只需一掃,便可將書(shū)本、路牌上的字轉(zhuǎn)化到手機(jī)上任意編輯;出國(guó)旅行,手機(jī)

掃描一下,便可將看不懂的外文翻譯成漢語(yǔ)……不但免費(fèi),而且簡(jiǎn)單、好用的

特性,使其在沒(méi)有推廣的情況下,贏得了萬(wàn)千用戶(hù)交口稱(chēng)贊。日前,由曹天明

創(chuàng)立的貓起來(lái)科技將這一“拍照取字”的夢(mèng)想變成現(xiàn)實(shí)。其App也迅速成為

OCR市場(chǎng)的新寵。

“拍照取字”是一款年手機(jī)掃描書(shū)上、菜單的文字,然后進(jìn)行電子化排版、翻

譯的軟件。這款A(yù)pp的特點(diǎn)是頁(yè)面簡(jiǎn)潔,功能簡(jiǎn)單,沒(méi)有廣告,用完即走。該

項(xiàng)目通過(guò)所有的渠道,匯總每一個(gè)用戶(hù)的反饋信息,平均每周更新一次版本。

靈感來(lái)源于一次度假

曹天明是一個(gè)“不安分”的人,從“360”出來(lái)后一直在找尋創(chuàng)業(yè)方向。曹天明

又是一個(gè)“愛(ài)貓”之人,去年3月注冊(cè)“貓起來(lái)科技有限公司”,他每月在貓

身上要花一兩千塊,心里想著不平衡,一定要把這個(gè)錢(qián)從貓那里掙回來(lái)。正因

為如此,公司的標(biāo)志是一只紅眼、披披風(fēng)、背著兩把劍、殺氣騰騰的黑貓,稱(chēng)

之為“劍客靴貓”。

起初,曹天明并未想清楚創(chuàng)業(yè)方向?!柏埰饋?lái)”最初的計(jì)劃是做貓糧,調(diào)圻發(fā)

現(xiàn)頻次太低不是剛需,決定改換方向。后來(lái),打算做一款車(chē)前出行類(lèi)APP,提

供天氣、車(chē)壓監(jiān)測(cè)等出行前信息,結(jié)果做了兩三個(gè)月,創(chuàng)業(yè)止于PPT。

2017年5月,曹天明云日本、泰國(guó)、印度尼西亞旅游了一個(gè)月散心,在國(guó)外他

發(fā)現(xiàn)因?yàn)檎Z(yǔ)言不通,特別不方便,看到文字就想拍下來(lái)搞清楚。于是,他靈機(jī)

一動(dòng),想到要做一款掃描翻譯的軟件“拍照取字”。

說(shuō)干就干,從6月17日開(kāi)始討論這一“拍照取字”的想法到iOS上線(xiàn)了第一個(gè)

版本,只用了一個(gè)星期。“拍照取字”這款產(chǎn)品頁(yè)面簡(jiǎn)潔,用戶(hù)通過(guò)App或者

小程序掃描文字即可生成文檔,自動(dòng)進(jìn)行歸類(lèi)?!安蛔鰪V告,不給用戶(hù)浪費(fèi)時(shí)

間,用完即走”這是該產(chǎn)品給自己的定位。到了10月,該產(chǎn)品已有3萬(wàn)多用

戶(hù),海外用戶(hù)占比33.4%,4個(gè)月總共發(fā)布22個(gè)版本。

資金對(duì)一個(gè)創(chuàng)業(yè)初始團(tuán)隊(duì)來(lái)說(shuō)無(wú)疑是一個(gè)至關(guān)重要的影響因素。由于用于數(shù)據(jù)

流編程的開(kāi)源軟件庫(kù)越來(lái)越多,如MicrosoftCNTK和Accord.Net,機(jī)器學(xué)習(xí)

愛(ài)好者能夠以極低的成本進(jìn)行研究和學(xué)習(xí)。然而,并非所有問(wèn)題都能得到解決,

因?yàn)椴⒎且磺卸际且阎?。為了?shí)現(xiàn)產(chǎn)品創(chuàng)意,要平衡預(yù)算,公司仍有很長(zhǎng)的

路要走。起初,曹天明的整個(gè)團(tuán)隊(duì)就只有一個(gè)半人,全職的曹天明,以及兼職

的“阿甘”,辦公地點(diǎn)在曹天明的家里。但是很決,投資人的電話(huà)就紛至沓來(lái)

地打了過(guò)來(lái)。新進(jìn)創(chuàng)投洪奕領(lǐng)投,史玉柱巨人網(wǎng)絡(luò)跟投,120萬(wàn)天使輪融資到

位,這無(wú)疑給曹天明和他的團(tuán)隊(duì)吃了一劑“定心丸”。

聚焦學(xué)生人群和商務(wù)人士

OCR技術(shù)是光學(xué)字符識(shí)別的縮寫(xiě)(OpticalCharacterRecognition),是通過(guò)掃

描、拍照等光學(xué)輸入方式將各種書(shū)籍、報(bào)刊、票據(jù)、卡證及其他載體上的文字

轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像中的文字轉(zhuǎn)化為可以編輯的結(jié)構(gòu)

化數(shù)據(jù)的過(guò)程。簡(jiǎn)單來(lái)說(shuō),就是讓文字信息快速?gòu)姆墙Y(jié)構(gòu)化圖像轉(zhuǎn)化為可以在

電子媒介上直接使用的數(shù)據(jù)的技術(shù)。

比起英文為主體的OCR識(shí)別技術(shù),漢字的OCR識(shí)別明顯面臨著更大的難關(guān)。英

文字母加數(shù)字識(shí)別字符集只有62類(lèi),但中文識(shí)別字符集達(dá)到20000類(lèi)之多。加

上影響OCR識(shí)別效果的因素眾多,包括復(fù)雜背景、低分辨率、多種字體、非均

勻光照、圖像退化、字符變形、透視變形、多種排列方式等等,OCR識(shí)別技術(shù)

研究困難重重,這直接導(dǎo)致了國(guó)內(nèi)目前具有OCR漢別技術(shù)自主知識(shí)產(chǎn)權(quán)的團(tuán)隊(duì)

少之又少,只有不到十家,其中就包括易道博識(shí)。

相對(duì)于傳統(tǒng)的手工錄入方式來(lái)說(shuō),OCR智能錄入具有強(qiáng)大的優(yōu)勢(shì),OCR識(shí)別的速

度遠(yuǎn)快于手工錄入,提升用戶(hù)體驗(yàn)度,減少手工瑜入時(shí)間,OCR技術(shù)可以為用

戶(hù)提供高效率、低成本的數(shù)據(jù)采集方案,從而為業(yè)務(wù)快速發(fā)展提供有力的支

撐。

OCR技術(shù)可廣泛應(yīng)用于大量文字資料、檔案卷宗、銀行票據(jù)、文案的錄入和處

理領(lǐng)域,非常適合用于銀行、證券、保險(xiǎn)等需要對(duì)大量票據(jù)表格進(jìn)行數(shù)字化的

行業(yè)。實(shí)際上,這一技術(shù)很早就巳經(jīng)被應(yīng)用了,但是應(yīng)用行業(yè)比較小眾因此沒(méi)

有機(jī)會(huì)在互聯(lián)網(wǎng)圈子露臉,比如安防監(jiān)控,車(chē)牌浜別(沒(méi)錯(cuò),你開(kāi)車(chē)被拍違規(guī)

那就是這個(gè)技術(shù))等。今年大家覺(jué)得技術(shù)和市場(chǎng)都成熟了,因此開(kāi)始在互聯(lián)網(wǎng)

圈頻頻露臉,再加上DeepLearning概念興起,漸漸水漲船高。

“貓起來(lái)”現(xiàn)有團(tuán)隊(duì)成員7人,主要都是技術(shù)、產(chǎn)品設(shè)計(jì),團(tuán)隊(duì)有北郵、北大

等名校畢業(yè)的成員,民曹天明的話(huà)說(shuō)是:“錢(qián)少,加班多,事多,但是因?yàn)楫a(chǎn)

品大家都忍了“。當(dāng)前,該公司正在和票據(jù)公司合作,希望能夠訓(xùn)練人工智能,

開(kāi)發(fā)出一款專(zhuān)門(mén)針對(duì)票據(jù)識(shí)別的產(chǎn)品來(lái)。

產(chǎn)品主要針對(duì)的用戶(hù)群體是學(xué)生人群和商務(wù)人士。學(xué)生的作業(yè)、筆記、錯(cuò)題本,

經(jīng)掃描后可轉(zhuǎn)化為線(xiàn)上文本,方便后續(xù)的歸納整理;商務(wù)人士在掃描、傳輸文

件時(shí),只需使用該款A(yù)PP轉(zhuǎn)錄到線(xiàn)上再開(kāi)展后續(xù)噪作即可。

此外,某用戶(hù)若想把書(shū)中內(nèi)容分享給朋友,也可使用此款應(yīng)用掃描并錄入相應(yīng)

文本信息,并標(biāo)注出重點(diǎn)信息再做相應(yīng)分享。當(dāng)數(shù)據(jù)量足夠大時(shí),“拍照取

字”也會(huì)添加相應(yīng)的人工智能屬性。

將“走心主義”作為口號(hào)

在曹天明看來(lái),好的產(chǎn)品在戰(zhàn)略上要分為“兩步走”。首先要讓用戶(hù)“用爽”,

獲取足夠的黏性。第二部,以O(shè)CR作為起點(diǎn)后,拍照取字要給人工智能提供足

夠的數(shù)據(jù)供其練習(xí),并從B端企業(yè)收費(fèi)。

“由于OCR所使用的都是開(kāi)源代碼,底層技術(shù)其實(shí)都是一樣的。真正拉開(kāi)差距

的,是CEO后續(xù)對(duì)產(chǎn)品用戶(hù)人群的定位及商業(yè)戰(zhàn)咯的思考,大家拼的是產(chǎn)品而

非技術(shù)?!辈芴烀魅缡钦f(shuō)道。

目前OCR掃描方面做的比較大的企業(yè)有漢王和掃描全能王,前者是上市公司而

后者則已積攢了一批可觀的用戶(hù)數(shù)量。漢王主要是跟政府、企業(yè)合作來(lái)盈利。

而拍照取字后續(xù)也在思考通過(guò)平臺(tái)上積攢的用戶(hù)數(shù)據(jù)變現(xiàn),比如切向幼教市

場(chǎng)。

而目前OCR掃描技術(shù)所碰到的最大難題絕非技術(shù),就是用戶(hù)的市場(chǎng)教育,“很

多人并不知道有這樣的產(chǎn)品存在?!彼匀绾瓮茝V是團(tuán)隊(duì)要解決的問(wèn)題。而目

前拍照取字還是專(zhuān)注于產(chǎn)品的研發(fā),并沒(méi)有將資金投入推廣,”就是將這款產(chǎn)

品放到AppStore上,讓用戶(hù)自行下載?!?/p>

貓起來(lái)將“走心主義'’作為口號(hào),“拍照取字”追款A(yù)pp處處可見(jiàn)其用心之

處。不管是書(shū)本、路牌還是紙質(zhì)文件上的文字,用戶(hù)只要通過(guò)App或者小程序

掃描文字即可生成文檔,將“非計(jì)算機(jī)語(yǔ)言文字”轉(zhuǎn)化為"計(jì)算機(jī)語(yǔ)言文字”,

方便用戶(hù)自動(dòng)進(jìn)行歸類(lèi)、管理,從而省去了大量文字錄入和文件管理工作。

同時(shí),“拍照取字”免費(fèi)版還支持PDF文件掃描功能,無(wú)論是身份證等證件,

還是各種卡,需要掃描時(shí)都能通過(guò)App一鍵搞定,不但可以自動(dòng)識(shí)別、裁剪邊

緣,還可以一鍵導(dǎo)出P

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論