“我們和YouTube現在正在聯合研發一款智能識別圖片及視頻的系統。
研發完成后,它將用于甄別、封禁油管平臺上發布的仇恨、種族歧視、血腥、黃/暴及其他違反各國法律規定的圖片、視頻。”
得知夏景行前來視察工作,吳恩達和李飛飛作為復興工業(美國)人工智能研究院的正、副院長親自帶著大老板在各個實驗室參觀了起來。
一行人邊走邊聊。
夏景行笑著說道:“這段時間辛苦你們了,違禁視頻一直是油管的一塊心病。
因為這玩意兒,油管經常被社會各界抨擊,快被形容成傳播毒瘤的網站了。”
吳恩達笑道:“油管每個月有來自幾十個國家的幾億人訪問和上傳視頻,這種大型平臺的管理確實是件令人頭疼的事情。
光依靠人工審核視頻,很難實現高效的審核,同時還會造成大量的人力支出。
擁有一款高識別精準率的審核系統,可以為油管省很多事。
不過現階段的AI識別精準率很難達到完全不依賴人工審核的程度。
未來很長一段時間內,還是需要AI和人工一起搭配審核,AI為主,人工為輔。”
夏景行笑了一下,“我明白,人工智能也會出錯,把正常視頻判別成違禁視頻。”
吳恩達點點頭,道:“要想徹底解決這個問題,還需要繼續訓練我們的算法模型,才能使它的識別更精確。。
怎么訓練人工智能呢?我們需要更多的標注數據。”
李飛飛在一旁補充道:“我之前曾開發了一個Image數據庫,下載了10億張圖片,為了找人標注這些圖片,我使用了亞馬遜的眾包服務平臺AMT,但幾年時間過去了,僅僅只標注了幾百萬張圖片。”
夏景行微微點頭,亞馬遜AMT,又名AI富土康。
顧名思義,這就是一個網上接單做兼職的平臺,其中最多的任務就是標注數據。
怎么標注呢?很簡單,坐在電腦前,對數據進行手工輸入、分類,區分出一張照片中是否有“狗”,辨別語句中的“bass”到底是低音還是鱸魚。
每標注一張圖片、一段語音,可以掙3美分。
看起來掙得很少,但積少成多,IT外包業務發達的印度就有很多家庭婦女把這份兼職工作做成了全職工作,每天工作8小時,一個月能掙700美元。
聽起來感覺好像還不錯,但其實比工廠打螺絲還枯燥乏味。
不過畢竟是兼職工作,也沒人站在旁邊督促,想干就干,算是比較自由的工作。
夏景行問道:“我們開發的FX數據庫,現在標注了多少張照片?”
吳恩達嘆了口氣,“就一百多萬張,因為找不到那么多人干這活,亞馬遜AMT上面的活躍用戶太少,很多人干著干著就不干了。”
夏景行皺起了眉頭,“太少了,標注數據就是人工智能的飼料,要趕緊想個辦法把標注數量提升上去。”
說到這,夏景行心中突然一動,脫口而出道:“哎,我們可以考慮把這個產業引入中國啊?
一個月掙四五千塊,應該還是能吸引一些人當數據標注員的。”
夏景行一下子聯想到了很多東西,西哥可以在老家辦個外呼中心,自己也可以在老家辦個數據標注中心啊!
找一幫有一定文化基礎的婦女,培訓一下就可以上崗了,而且還可以在家里干活,相當于補貼家用了。
夏景行把自己的想法給吳恩達和李飛飛講了一下。
李飛飛老家也是蓉城的,而且這是為婦女提供工作崗位,她對這件事很感興趣,立馬針對性的提出了不少建議。
吳恩達提出了不同意見:“選擇眾包模式,估計標注員只能標注一些簡單的圖片。
而視頻標注和3D標注有些復雜,每一幀畫面都需要標注數據。
尤其是戴倫你提過的自動駕駛,想想都覺得數據量恐怖。”
夏景行記得前世涌現出了一些專業的數據標注公司,他們的主要服務對象就是自動駕駛技術公司。
為了完成一些高質量、高難度的標注,那些數據標注公司沒少研究如何高效標注數據的小工具。
“我們可以開發輔助標注工具,把圖像和視頻進行分割,標注員只需要在每個物體框里面打鉤打叉,或者選擇綠色、紅色就行了。”
吳恩達眼睛頓時一亮,“這是一個好辦法啊,不然一個圖像標注幾百上千組數據,能夠把人活活折磨死。”
夏景行笑了一下,這可不是他自己想出來的,而是前世那些數據標注公司總結設計出來的小方法。
眾所周知,數據標注越多,投食越多,喂養出來的人工智能就越精準。
開啟自動駕駛模式的汽車,需要行駛在復雜的城市路況,這就對人工智能、計算機視覺提出了更高的技術要求。
周邊的汽車、道路、指示牌等等,全都需要經過數據標注員無數次的標注,然后將大量的數據匯集在一起,最終才能培養出能夠安全上路的自動駕駛汽車。
不過自動駕駛是漸漸走向成熟、精準的一個發展過程,在此之前,估計少不了各種翻車事件。
假如某位車主運氣不好,在自動駕駛模式下,遇到了一個沒有收錄在自動駕駛數據庫里的路況場景,機器不認識,那就只能全村開席了。
“說到自動駕駛,戴倫你打算什么時候開始研發這個項目啊?”
吳恩達停下了腳步,李飛飛也站在一旁饒有興趣的看著夏景行。
“明年吧,先把手里的這攤事給做好。”
吳恩達搖了搖頭,微笑說道:“我在學校里聽說了,塞巴斯蒂安·特龍帶著一群人正在山景城搞一個秘密項目。
他們改裝了六輛豐田普銳斯、一輛奧迪TT,給每一輛汽車的車頂都安裝了一個支架,上面搭載了一個機械旋轉式激光雷達,能夠對車身360度方向進行掃描。
車頂的后部還安裝有GPS天線,能夠協助車輛進行定位。
4顆毫米波雷達分別安裝在車輛的前后保險杠以及車頭的兩側,前雷達主要用于檢測距離和速度…”
夏景行微微皺眉,塞巴斯蒂安·特龍也是斯坦福大學的教授,同時也是谷歌X實驗室的創辦人。
如果他沒猜錯的話,對方負責的這個項目就是Waymo,谷歌的自動駕駛品牌。
“你怎么了解得這么清楚啊?”
夏景行突然有些好奇,吳恩達描述的惟妙惟肖的,好像真見過那幾輛原型車似的。
“哈哈,因為我見過它們啊!”
吳恩達笑著揭曉了謎底:“特龍前段時間邀請我去參觀了他們的原型車,同時還邀請我加入他們團隊。”
挖人挖到我頭上來了?
這下,夏景行對佩奇的意見更深了。
當然了,他自己是不記得差點挖空谷歌中國這件事的。
夏景行掃了吳恩達一眼,心想對方說這話是什么意思?難道要離開?
他正要說話,被吳恩達搶先一步:“不過我已經拒絕他們了,雖然他們的項目很酷,不過我覺得復興工業也不差,我們一定可以研發出比他們更智能的自動駕駛技術。”
夏景行終于聽懂了,吳恩達想做自動駕駛。
他在心里想了一下,如今谷歌都已經正式下場了,看樣子確實不能再等了。
特斯拉目前的主要精力都放在了量產ModelS上面,暫時無暇兼顧自動駕駛的研發。
就算特斯拉將來研發了相關技術,也會選擇自用,而不是對外開放。
復興工業想要打造的是自動駕駛全棧服務商,未來將向汽車廠商輸出相關軟件和硬件技術。
當然了,如果因為復興汽車的緣故,沒友商敢用的話,那就像特斯拉一樣自用。
夏景行看了李飛飛一眼,圖像和視頻識別系統的研發工作可以交給對方領導。
國內的話,沈向陽還在哼哧哼哧的研發手機助手,也就是語音識別技術,未來該技術還可以搭載到平板、汽車、智能音箱等設備上面。
讓吳恩達開始做自動駕駛,也不會影響其他項目的研發進度。
反正現在又不缺錢,鉚足勁兒砸就完事了。
谷歌X實驗室為什么那么牛逼,就是因為砸錢很爽快,什么無腦項目都在搞。
當然了,有項目假如搞成功了,那就是有先見之明。
“好,安德魯(吳恩達英文名),你盡快招募團隊,我們也把自動駕駛的研發工作正式提上日程,需要什么,你直接報給林兵,他會全力配合你。”
見夏景行這么果斷的就同意把自動駕駛立項,吳恩達非常的高興,一個勁兒的表示自己一定不會辜負公司的期望。
夏景行其實想把自動駕駛這么重要的項目弄回國內,但吳恩達出生在倫敦,少年時期長在香港和新加坡,大學是在美國讀的,并且已經入美籍了,怕是不愿意到大陸工作。
不過夏景行很快想起吳恩達前世曾加入百度擔任首席科學家,參與研發了百度大腦,應該不會抗拒到大陸工作吧?
擔心出什么岔子,夏景行又趕緊旁敲側擊了一番。
“安德魯,你去過大陸嗎?”
“當然去過啊,大陸這些年發展很快,我每次去都感覺到了一個新城市。”
“假如公司以后派你回大陸工作幾年,你愿不愿意?”
“沒問題啊。”
吳恩達絲毫沒有猶豫,答應的非常爽快。
見狀,夏景行頓時放心了不少,畢竟讓吳恩達挑起自動駕駛重擔的話,那么他就是核心人物,如果中途出現什么變故的話,會很麻煩,還會拖累研發進度。
夏景行又多解釋了一句:“我們的總部始終在大陸,在那里獲取數據方便一點。”
吳恩達笑了笑,“戴倫,這些我都懂,一切都聽你的安排。”