排行 | 簡(jiǎn)稱 |
---|---|
1 | 云測(cè)數(shù)據(jù) |
2 | 澳鵬appen |
3 | Magic Data |
4 | 海天瑞聲 |
5 | 數(shù)據(jù)堂 |
6 | 科樂(lè)園 |
7 | 龍貓數(shù)據(jù) |
8 | 曼孚科技MindFlow |
9 | 標(biāo)貝科技 |
10 | 慧聽(tīng)科技 |
11 | 37度數(shù)據(jù) |
12 | 文德數(shù)慧 |
13 | 星塵數(shù)據(jù) |
14 | 泛函科技 |
15 | 冰山數(shù)據(jù) |
16 | 景聯(lián)文 |
17 | 博菲數(shù)據(jù) |
18 | 博登智能 |
19 | 元坤智能數(shù)據(jù) |
20 | 未有科技 |
2022.05互聯(lián)網(wǎng)周刊/eNet研究院/德本咨詢聯(lián)調(diào) |
人工智能大道的“基石”
人工智能的目標(biāo)指向了對(duì)人思維過(guò)程的復(fù)刻,它希望將人的智能脫離肉體的限制,延伸到機(jī)器上,使得機(jī)器能夠像人類一樣面對(duì)變化的外部環(huán)境,綜合做出判斷和行為反應(yīng)。在這項(xiàng)探索的初始階段,我們已經(jīng)看到包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理等在內(nèi)的各分領(lǐng)域分級(jí)別的研究成果。
在大眾傳播和科幻想象中,人工智能往往以一種“酷炫”的形式作為最終的結(jié)果呈現(xiàn),而探究人工智能何以形成的機(jī)制則會(huì)發(fā)現(xiàn),它不似人想象的那樣輕松和神秘。
數(shù)據(jù)標(biāo)注就是目前機(jī)器實(shí)現(xiàn)智能化一個(gè)必不可少的過(guò)程,它指的是在采集數(shù)據(jù)后,通過(guò)分類、分割、關(guān)鍵點(diǎn)線標(biāo)注、畫(huà)框、追蹤等處理方式,對(duì)文本、圖片、語(yǔ)音、視頻等原素材進(jìn)行標(biāo)記注釋,將多源異構(gòu)的數(shù)據(jù)轉(zhuǎn)化成可識(shí)別的AI訓(xùn)練數(shù)據(jù),從而成為機(jī)器學(xué)習(xí)的基礎(chǔ)材料。
這個(gè)過(guò)程并不如同想象中那樣簡(jiǎn)便和迅速,反而顯得有點(diǎn)“笨拙”,機(jī)器的學(xué)習(xí)并不像人那樣具備主動(dòng)的記憶、認(rèn)知、理解能力,它更像是一種計(jì)算,在大量相似數(shù)據(jù)標(biāo)注為一件物品后,經(jīng)過(guò)比對(duì),它才能“認(rèn)識(shí)”到物品的屬性。
例如在圖像的數(shù)據(jù)標(biāo)注中,一張圖片包含的實(shí)體會(huì)逐一分割開(kāi)來(lái),進(jìn)行分類和檢測(cè),再進(jìn)行關(guān)鍵點(diǎn)和線段的標(biāo)記;在語(yǔ)音數(shù)據(jù)標(biāo)注中,一段發(fā)音就被切割成了韻律、音素、詞性以及更復(fù)雜的附屬的年齡、性別等屬性;在視頻數(shù)據(jù)標(biāo)注中,由于內(nèi)容是動(dòng)態(tài)的,還要進(jìn)行打點(diǎn)和追蹤,才能提取可使用的數(shù)據(jù)。
數(shù)據(jù)標(biāo)注的視角里,機(jī)器就像人的嬰兒時(shí)期,接受到的都是零散的、分隔的信息,暫時(shí)還理解不了其中的“意”,而機(jī)器不具備主動(dòng)汲取的能力,其成長(zhǎng)速度遠(yuǎn)遠(yuǎn)弱于嬰孩。
由此就可以理解,為什么在目前日常生活中得到應(yīng)用的人工智能有時(shí)因?yàn)槔斫獠涣巳祟惖闹噶畋粦蚍Q為“人工智障”,人類的語(yǔ)言、圖像、行為在長(zhǎng)期的發(fā)展中已經(jīng)具備了十分復(fù)雜的涵義,一個(gè)細(xì)節(jié)的不同就可能導(dǎo)致完全不同的意義,目前的機(jī)器學(xué)習(xí)量和覆蓋范圍還達(dá)不到高級(jí)智能的水平。
數(shù)據(jù)標(biāo)注的創(chuàng)新,人工智能的進(jìn)步
在我們的生活中,人工智能的應(yīng)用面越來(lái)越廣,智能交通、智能家居、智慧醫(yī)療……但無(wú)一例外,智慧場(chǎng)景要取得進(jìn)展,就要保證人工智能判斷的準(zhǔn)確度。無(wú)人駕駛要精準(zhǔn)判斷道路周邊環(huán)境,才能實(shí)現(xiàn)最為重要的安全行駛;智能音箱要對(duì)人的指令做出正確反應(yīng),就要提升對(duì)語(yǔ)音的理解分析能力;智慧醫(yī)療影像要實(shí)現(xiàn)為醫(yī)務(wù)人員分擔(dān)工作壓力,也要做到正確辨識(shí)患者疾病部位,等等。
而人工智能要取得進(jìn)步,追溯起來(lái),就需要從數(shù)據(jù)標(biāo)注這一步開(kāi)始,加強(qiáng)創(chuàng)新、改善質(zhì)量。
事實(shí)上,數(shù)據(jù)標(biāo)注并不完全是一個(gè)不需要知識(shí)儲(chǔ)備就能完成的勞動(dòng)密集型產(chǎn)業(yè),一些基礎(chǔ)的像是對(duì)應(yīng)指定位置、打點(diǎn)等雖然需要大量人力,也無(wú)需太多專業(yè)素質(zhì),但隨著行業(yè)發(fā)展,就需要進(jìn)一步解決數(shù)據(jù)數(shù)量大、要素復(fù)雜、專業(yè)領(lǐng)域數(shù)據(jù)標(biāo)注等問(wèn)題。
首先是專業(yè)領(lǐng)域的數(shù)據(jù)標(biāo)注問(wèn)題,要提升人工智能的質(zhì)量,擴(kuò)展人工智能的領(lǐng)域,在走過(guò)基礎(chǔ)的智能反應(yīng)階段后,像醫(yī)療等專業(yè)學(xué)科內(nèi)容的標(biāo)注,也逐漸需要進(jìn)行完善。因此,隨著人對(duì)數(shù)據(jù)的需求越來(lái)越深入,必然要求更多的專業(yè)性人才輔助完成數(shù)據(jù)標(biāo)注工作。
其次,機(jī)器學(xué)習(xí)要變得更準(zhǔn)確,需要大量標(biāo)注好的數(shù)據(jù)作為“原材料”,此時(shí)完全依靠人力工作對(duì)生產(chǎn)成本和效率都會(huì)形成挑戰(zhàn)。為了提升數(shù)據(jù)標(biāo)注效率,將人力資源投入到更具挑戰(zhàn)性的工作中去,如數(shù)據(jù)堂、Magic Data等企業(yè)已經(jīng)開(kāi)發(fā)了相關(guān)的集成自動(dòng)化標(biāo)注工具、人機(jī)協(xié)同數(shù)據(jù)處理平臺(tái),以半自動(dòng)化的數(shù)據(jù)標(biāo)注工具創(chuàng)新加快人工智能開(kāi)發(fā)進(jìn)程,優(yōu)化運(yùn)營(yíng)效率。
同時(shí),要讓機(jī)器的“理解”能力更強(qiáng),與人的互動(dòng)更順暢,同一段文字、一張圖片、一段語(yǔ)音和視頻,其數(shù)據(jù)標(biāo)注的層次一定是越詳細(xì)越有助于機(jī)器學(xué)習(xí),而為了數(shù)據(jù)規(guī)律能被機(jī)器識(shí)別,還需要建立清晰的標(biāo)注規(guī)范。
人工智能走過(guò)粗放式的發(fā)展階段,未來(lái)將需要更多高質(zhì)量、精細(xì)化、專業(yè)化的數(shù)據(jù),而這都要求數(shù)據(jù)標(biāo)注行業(yè)實(shí)現(xiàn)進(jìn)一步的研發(fā)與創(chuàng)新。
走向強(qiáng)人工智能
雖然人工智能的目標(biāo)和人的智力指向的是相同的目標(biāo),但目前的研究水平,機(jī)器對(duì)智能的模仿是“拼接”而成的,是對(duì)人的視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感官的模仿,這些是較為基礎(chǔ)的能力,它的最終目標(biāo)是對(duì)人的意識(shí)的模仿甚至超越。
但在機(jī)制上,對(duì)于機(jī)器而言,信息是以字符串形式存在的,對(duì)于人類而言,信息則是事物。因此,不管人工智能在表現(xiàn)上能達(dá)到多大程度的與人類反應(yīng)相似,它的有限性仍然比我們想象得更強(qiáng)。
人工智能的目標(biāo)也是希望機(jī)器能建立起認(rèn)知系統(tǒng),從而幫助人類社會(huì)實(shí)現(xiàn)更大的集體利益,要走向這樣的強(qiáng)人工智能,需要龐大的數(shù)據(jù)量,極強(qiáng)的計(jì)算能力,模擬人類各感官的傳感器,對(duì)人類大腦的工作機(jī)制實(shí)現(xiàn)更深度的突破等等。
從數(shù)據(jù)這一角度來(lái)說(shuō),它是人類行為、意識(shí)外化的集合和數(shù)字化表征,足夠充分的數(shù)據(jù)量和運(yùn)算能力有助于為機(jī)器提供關(guān)鍵信息,越精確的數(shù)據(jù)越能有效推動(dòng)機(jī)器的智能化,為其實(shí)現(xiàn)“自主”決策打下基礎(chǔ)。
強(qiáng)人工智能可能是人類社會(huì)最具挑戰(zhàn)性的事業(yè),它意味著人類徹底的自我探索與實(shí)現(xiàn)外部利用,同時(shí)也是時(shí)代的發(fā)展趨勢(shì),要實(shí)現(xiàn)這一偉大創(chuàng)新,需要數(shù)據(jù)、計(jì)算、聯(lián)通、傳感等各環(huán)節(jié)的開(kāi)創(chuàng)性探索。