欧美久久天天综合香蕉伊,h片在线免费观看,九九欧美,欧美1区2区3区,日本在线不卡一区,国产视频久久久,91久久久久久久

2023信創(chuàng)獨角獸企業(yè)100強
全世界各行各業(yè)聯(lián)合起來,internet一定要實現(xiàn)!

2020數(shù)據(jù)標(biāo)注公司排行

2020-04-08 eNet&Ciweek/2020數(shù)據(jù)標(biāo)注公司排行

2020數(shù)據(jù)標(biāo)注公司排行
排名簡稱全稱
1Testin云測北京云測信息技術(shù)有限公司
2數(shù)據(jù)堂數(shù)據(jù)堂(北京)科技股份有限公司
3龍貓數(shù)據(jù)北京安捷智合科技有限公司
4星塵紀(jì)元北京星塵紀(jì)元智能科技有限公司
5文德數(shù)慧北京文德數(shù)慧科技發(fā)展有限責(zé)任公司
6倍賽BasicFinder北京深度搜索科技有限公司
7標(biāo)貝科技標(biāo)貝(北京)科技有限公司
8愛數(shù)智慧北京愛數(shù)智慧科技有限公司
9夢動科技貴州夢動科技有限公司
10曼孚科技杭州曼孚科技有限公司
11點我科技鄭州點我科技有限公司
12翊澳數(shù)據(jù)河南翊澳信息科技有限公司
13薈萃上海丁火智能科技有限公司
14智成長宿州市智成長科技有限公司
15笑貓科技天津笑貓科技有限公司
2020《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行
2020數(shù)據(jù)標(biāo)注眾包平臺排行
排名平臺企業(yè)
1京東眾智京東數(shù)字科技控股有限公司
2百度眾測百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
3數(shù)據(jù)堂數(shù)據(jù)堂(北京)科技股份有限公司
4龍貓眾包北京安捷智合科技有限公司
5格物鈦格物鈦(上海)智能科技有限公司
6MBH莫比嗨客大連莫比嗨客智能科技有限公司
7有道眾包網(wǎng)易有道信息技術(shù)(北京)有限公司
8倍賽BasicFinder北京深度搜索科技有限公司
9淘金云四川淘金你我信息技術(shù)有限公司
10點我科技鄭州點我科技有限公司
2020《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行
人工智能燃料機(jī)

回想一下你的小時候,是如何學(xué)習(xí)認(rèn)識蘋果的?只需要有人拿一個蘋果在你面前展示一遍,告訴你這是蘋果,你就能舉一反三,認(rèn)識不同形態(tài),不同顏色的蘋果。這是人類特有的學(xué)習(xí)能力。

但是,如何教機(jī)器識別蘋果呢?我們要教它認(rèn)識一個蘋果,直接給它一張?zhí)O果的照片,它是完全不知道這是什么東西的。我們必須先給它學(xué)習(xí)大量蘋果的圖片,通過學(xué)習(xí)各種顏色、各種大小、各種形狀、各種成熟程度和各種光線明亮程度下的蘋果,掌握大量的圖片中的特征,這時候再給機(jī)器任意一張?zhí)O果的圖片,它才能認(rèn)出來這是蘋果。

人工智能在被投喂了大量數(shù)據(jù)之后,才能認(rèn)出三歲小孩子都能認(rèn)出的東西,學(xué)會“黑貓白貓都是貓”。

那么,這些供給機(jī)器學(xué)習(xí)的材料從哪里來呢?這就是我們今天要說的一個因為人工智能崛起而新興的行業(yè)——數(shù)據(jù)標(biāo)注行業(yè)。所謂數(shù)據(jù)標(biāo)注,就是人工為圖片、音頻和語音內(nèi)容做標(biāo)記,打標(biāo)簽,把大量非結(jié)構(gòu)性數(shù)據(jù)加工成機(jī)器可以識別的數(shù)據(jù),標(biāo)注好的數(shù)據(jù)會被人工智能公司用來訓(xùn)練算法模型,然后運用到圖像識別、語音識別、自動駕駛等不同領(lǐng)域。

在整個人工智能體系中,算力、算法和數(shù)據(jù)是人工智能進(jìn)化的三大元素,分別承擔(dān)著人工智能基礎(chǔ)設(shè)施能力、工作指導(dǎo)方法和算法進(jìn)化依據(jù)的角色。這三大元素相輔相成,共同推動人工智能的智慧化進(jìn)化水平。在人工智能運行模式中,“數(shù)據(jù)”作為至關(guān)重要的參與元素,從本質(zhì)上決定了人工智能的進(jìn)化水平。因為通常來說,數(shù)據(jù)標(biāo)注得越準(zhǔn)確,數(shù)量越多,模型效果越好,最后的產(chǎn)品效果就越好。換句話說,“數(shù)據(jù)”作為人工智能系統(tǒng)中的算法依據(jù),就是人工智能學(xué)習(xí)的教材,是人工智能的燃料機(jī)。

數(shù)據(jù)標(biāo)注的三種市場結(jié)構(gòu)

一個完整的數(shù)據(jù)標(biāo)注流程需要經(jīng)過任務(wù)分配、標(biāo)記程序設(shè)計、進(jìn)度跟蹤和質(zhì)量跟蹤等幾個環(huán)節(jié),環(huán)節(jié)中涉及到標(biāo)注員、審核員和管理員幾個角色,這些是任何一個數(shù)據(jù)標(biāo)注團(tuán)隊都具備的基本要素,不同的是組織工作的方式。

大多數(shù)AI實驗室、初創(chuàng)型AI公司在發(fā)展初期,都需要大量的數(shù)據(jù)來訓(xùn)練模型,但如果雇傭大量的人力進(jìn)行數(shù)據(jù)標(biāo)注,就不得不面臨這樣的處境:一是管理方面的挑戰(zhàn),在研發(fā)產(chǎn)品的同時還要把大量精力放在管理標(biāo)注人員身上;二是成本的挑戰(zhàn),大量全職標(biāo)注人員的薪酬對于初創(chuàng)型公司和研究實驗室都是一筆不小的支出。

于是,數(shù)據(jù)標(biāo)注公司隨著發(fā)展如火如荼的人工智能行業(yè)也發(fā)展起來。為了適應(yīng)人工智能公司對數(shù)據(jù)標(biāo)注不同程度的需求,當(dāng)前,我國數(shù)據(jù)標(biāo)注行業(yè)的市場結(jié)構(gòu)也分化為了幾種。

最開始興起的是眾包結(jié)構(gòu),在眾包平臺上,一端對接需求公司,一端對接大量有空余時間的志愿者(兼職人員)。眾包結(jié)構(gòu)的優(yōu)點是可以組織社會上的大量兼職人員進(jìn)行標(biāo)注,節(jié)省公司的運營成本,但缺點也很明顯,就是眾多分散的兼職人員之間合力完成一個大型標(biāo)注任務(wù),他們的專業(yè)背景和工作能力參差不齊,溝通成本高昂,數(shù)據(jù)保密也相對困難,一旦需求公司要調(diào)整原有標(biāo)注需求,兼職人員流動性大,無法給與需求公司靈活服務(wù)。意識到自身的缺點,近年來一些眾包平臺也開始對入駐的數(shù)據(jù)標(biāo)注團(tuán)隊進(jìn)行測評,以及采取末尾淘汰等措施,提升平臺整體的競爭能力。當(dāng)前,市場上典型的數(shù)據(jù)眾包平臺有京東眾智、百度眾測等。

另外一種就是工廠結(jié)構(gòu),即成立專門的數(shù)據(jù)標(biāo)注公司,有穩(wěn)定的標(biāo)注人員。相對于眾包結(jié)構(gòu),數(shù)據(jù)工廠的優(yōu)勢是標(biāo)注人員穩(wěn)定,需求方和數(shù)據(jù)標(biāo)注方能即時溝通,溝通成本降低,同時,數(shù)據(jù)傳遞也有源可溯,降低了數(shù)據(jù)泄露的可能性。但工廠結(jié)構(gòu)的公司也有它的煩惱?,F(xiàn)在市場上工廠結(jié)構(gòu)的數(shù)據(jù)公司兩極分化明顯,較大的長期員工可以達(dá)到上千人;而較小的,只有幾個人,很多小團(tuán)隊還存在有項目時成立,沒項目時解散的現(xiàn)象。由于人工成本風(fēng)險較高,兩極分化下的工廠結(jié)構(gòu)市場還衍生出了這樣的現(xiàn)象:大公司很少去對接短期且數(shù)據(jù)量較少的項目,小的公司可以承接這樣的項目但是有大批量數(shù)據(jù)任務(wù)到來時,數(shù)據(jù)標(biāo)注能力又會顯得捉襟見肘。目前,市場上規(guī)模較大的專業(yè)的數(shù)據(jù)標(biāo)注公司有Testin云測、星塵紀(jì)元、夢動科技等。

也有一些將眾包和工廠結(jié)構(gòu)融合的企業(yè),能夠根據(jù)項目大小和數(shù)據(jù)保密要求靈活部署,例如數(shù)據(jù)堂和龍貓數(shù)據(jù),都有自己的標(biāo)團(tuán)隊,同時也運營數(shù)據(jù)標(biāo)注眾包平臺。

這三種數(shù)據(jù)標(biāo)注的市場結(jié)構(gòu)都有各自的優(yōu)勢和局限性,結(jié)合眾包+工廠模式的第三種結(jié)構(gòu)是否會成為未來數(shù)據(jù)標(biāo)注行業(yè)的主流形式,還有待實踐的檢驗。因為除了市場結(jié)構(gòu),準(zhǔn)確率和靈活性在數(shù)據(jù)標(biāo)注中的重要性正在變得越發(fā)突出。

準(zhǔn)確率是核心競爭力

無論是工廠、眾包還是將兩者結(jié)合的市場結(jié)構(gòu),都是在成本、準(zhǔn)確率和靈活性上做選擇,隨著越來越多數(shù)據(jù)喂養(yǎng)給了人工智能算法,人工智能公司必須想辦法積累更多更準(zhǔn)確、符合自身應(yīng)用的數(shù)據(jù)。某種程度上來說,高質(zhì)量的標(biāo)注數(shù)據(jù),決定了人工智能公司的競爭力。

隨著AI應(yīng)用的加速落地,壓低報價和提交更多的數(shù)據(jù)標(biāo)注結(jié)果顯得不再那么重要,準(zhǔn)確率成為脫穎而出的命脈。在大型人工智能公司面前,數(shù)據(jù)標(biāo)注企業(yè)的準(zhǔn)確率提升一個百分點,競爭力將躍遷幾個層級。

任何一個行業(yè),在經(jīng)歷了早期的瘋狂生長后,最終一定會經(jīng)歷一番洗牌,變得更為規(guī)范化、透明化。屆時質(zhì)量會取代成本,成為需求方最優(yōu)先考慮的變量。

當(dāng)AI完成初級識別,要進(jìn)行深度學(xué)習(xí)訓(xùn)練后,甲方的人工智能公司對數(shù)據(jù)質(zhì)量和效率的要求將超越對成本的顧慮。往金字塔的高層發(fā)展,這個行業(yè)的缺口仍然非常巨大。

大浪淘沙,不妨大膽預(yù)測,數(shù)據(jù)標(biāo)注行業(yè)有兩類機(jī)構(gòu)最終會發(fā)展較好:一是注重質(zhì)量及服務(wù)的中小型數(shù)據(jù)標(biāo)注公司,二是自有整套數(shù)據(jù)技術(shù),能依靠人工智能增加準(zhǔn)確率的平臺。

人工智能背后的“人工”

形形色色的數(shù)據(jù)標(biāo)注公司、眾包平臺之下,不能忽視的是數(shù)據(jù)標(biāo)注員。

盡管對數(shù)據(jù)標(biāo)注的要求越來越高、越來越精準(zhǔn)是大勢所趨,但是,一個不容忽視的事實是,數(shù)據(jù)標(biāo)注行業(yè)現(xiàn)在還是勞動密集型產(chǎn)業(yè)。

重復(fù)的拉框、標(biāo)點,一個個數(shù)據(jù)標(biāo)注員通過大量重復(fù)勞動為AI輸送了幾十億甚至幾百億的喂養(yǎng)數(shù)據(jù),這些數(shù)據(jù)標(biāo)注員有一個被圈內(nèi)人默認(rèn)的外號:AI民工。

在中國廣袤的三四線城市、鄉(xiāng)鎮(zhèn),無數(shù)年輕人正成為“數(shù)據(jù)貼標(biāo)人”,他們每天坐在電腦前工作8小時以上,為AI公司的算法提供和處理大量數(shù)據(jù)。他們中的大多數(shù)人教育水平不高,重復(fù)的機(jī)械勞動為他們帶來了微薄的工資,全然不知自己正在參與“價值上億”的項目。

他們是“人工智能背后的人工”。當(dāng)前,人工智能行業(yè)依賴于大量的這種廉價的人工,因為算法和“機(jī)器學(xué)習(xí)”在很多情況下都是由真人訓(xùn)練。

這些類似富士康工廠的流水線工人,卻有著自己的夢想故事。從大眾的視角,他們是被忽視的一群人;在大眾關(guān)注不到的地方,數(shù)據(jù)標(biāo)注公司不僅僅是為人工智能賦能,也在賦能“人工”。

貴州夢動科技有限公司是少有的產(chǎn)教融合的數(shù)據(jù)標(biāo)注公司。公司緊鄰著一家扶貧高職“盛華職業(yè)學(xué)院”,此處的學(xué)生大多來自貧困山區(qū),該公司近一半的數(shù)據(jù)標(biāo)注員也來自與此。公司的一些工作人員,同時兼任著學(xué)校的老師。學(xué)校的學(xué)生在公司實習(xí),賺來的錢不僅足夠生活,有時還能拿出一些補貼家用。這份數(shù)據(jù)標(biāo)注的工作幫助他們改變了自己和家庭的命運,有時,一些優(yōu)秀的學(xué)生還能成為人工智能公司的專業(yè)標(biāo)注員,完成職業(yè)升級。

同樣賦能“人工”的還有京東眾智。京東眾智上有一千多名聾啞人數(shù)據(jù)標(biāo)注員,京東為他們成立專門的“靜公會”,項目上優(yōu)先照顧。

這些曾經(jīng)在社會上的邊緣人物,終于在“數(shù)據(jù)標(biāo)注”領(lǐng)域成了“有用的人”。一位京東眾智平臺的培訓(xùn)講師說:“想當(dāng)把英雄,承擔(dān)更多的責(zé)任。”聾啞人培訓(xùn)相對來說會費勁些,但是他們的優(yōu)點是專注、認(rèn)真、對視覺信號敏銳,數(shù)據(jù)標(biāo)注行業(yè)對他們來說是機(jī)會。

事實上,除了數(shù)據(jù)標(biāo)注員的職業(yè)升級野望,數(shù)據(jù)標(biāo)注行業(yè)還承載著很多創(chuàng)業(yè)者的人工智能夢。

一位小型數(shù)據(jù)標(biāo)注公司創(chuàng)始人曾說:“雖然標(biāo)注是相當(dāng)?shù)图墑e的工作,但進(jìn)入門檻相對較低,而且仍屬于人工智能行業(yè)?!彼f,“所以我們認(rèn)為,如果我們可以從這里開始,也有可能慢慢地、一步一步地走向更高價值的領(lǐng)域?!?/p>

機(jī)器會代替人類嗎?

數(shù)據(jù)標(biāo)注員也有一些擔(dān)憂,他們的工作是幫機(jī)器更好的學(xué)習(xí),促進(jìn)人工智能行業(yè)的發(fā)展,而當(dāng)行業(yè)發(fā)展到一定階段,那還需要人工嗎?數(shù)據(jù)標(biāo)注員所做的工作就是在加速自己失去這份工作。

開發(fā)一款能夠?qū)崿F(xiàn)自動化數(shù)據(jù)標(biāo)注的工具,既是在解放人力,又是行業(yè)發(fā)展的必然結(jié)果。一旦智能化的數(shù)據(jù)標(biāo)注工具能夠替代人工,即使是能部分替代,數(shù)據(jù)量和質(zhì)量都會快速提升,進(jìn)而推動算法成熟得更快。而市場上已有企業(yè)在開發(fā)自動化數(shù)據(jù)標(biāo)注工具,嘗試用AI取代“AI民工”。

機(jī)器會代替人類嗎?或許,馬云先生在2018世界人工智能大會上所說的話,至今仍有啟發(fā)意義:“蒸汽機(jī)釋放了人的體力,但是蒸汽機(jī)并不是模仿人的體力,汽車比人跑得快,但是汽車并不是模仿人的雙腿。未來的計算會釋放人的腦力,但是計算機(jī)不是按照人腦一樣去思考,機(jī)器必須要有自己的方式去思考?!?/p>

讓計算機(jī)擁有自己的思考方式,是一個復(fù)雜的過程,在這個復(fù)雜的架構(gòu)中,數(shù)據(jù)標(biāo)注是滋養(yǎng)這個系統(tǒng)運轉(zhuǎn)的燃料,通過不斷升級改變的標(biāo)注內(nèi)容來適應(yīng)不斷強大的人工智能。

汽車的出現(xiàn),讓馬夫失業(yè)了,但是馬夫并沒有活不下去,而是去做更高級的工作,比如司機(jī)、汽修人員。19世紀(jì)紡織業(yè)突飛猛進(jìn)發(fā)展,一些任務(wù)變得自動化,大量紡織工人下崗,但機(jī)器降低了制作衣服的成本,人們對布料的需求也在增長。服裝需求的增長又帶來了新的就業(yè)機(jī)會,工廠不得不雇傭新一代的工人,學(xué)習(xí)操作復(fù)雜的機(jī)械。

當(dāng)一些需求被滿足時,又會產(chǎn)生新的需求。新技術(shù)、新科技,從來都不是人類的限制,而是人類一種認(rèn)識和思考世界的方式,我們借助新技術(shù)為自己的未來確定一種生活方式。

結(jié)語

在探討數(shù)據(jù)標(biāo)注這個行業(yè)存在的合理性與是否能長久發(fā)展之前,能帶給從業(yè)者的改變和對人工智能的推動就已足夠振奮人心。

現(xiàn)在就已經(jīng)很有意義,未來會更有意義。

相關(guān)頻道: eNews 排行

您對本文或本站有任何意見,請在下方提交,謝謝!

投稿信箱:tougao@enet16.com