中國(guó)工程院院士李德毅:聚類成大數(shù)據(jù)認(rèn)知突破口
發(fā)布時(shí)間:2015-04-14【賽迪網(wǎng)訊】4月9日,由工業(yè)和信息化部、深圳市人民政府主辦,中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院、中國(guó)電子報(bào)社協(xié)辦的新一代信息技術(shù)產(chǎn)業(yè)發(fā)展高峰論壇在深圳會(huì)展中心舉行。中國(guó)工程院院士李德毅在發(fā)言中指出,大數(shù)據(jù)作為網(wǎng)絡(luò)時(shí)代的一種客觀存在,是網(wǎng)絡(luò)時(shí)代人類社會(huì)的重要資產(chǎn),盡管目前對(duì)于大數(shù)據(jù)的認(rèn)知存在挑戰(zhàn),但聚類將會(huì)成為大數(shù)據(jù)認(rèn)知的突破口。
大數(shù)據(jù)用傳統(tǒng)工具
難以認(rèn)知
李德毅表示,大數(shù)據(jù)標(biāo)志著一個(gè)新時(shí)代的到來(lái),這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無(wú)所不在的互聯(lián)網(wǎng)帶來(lái)的方便的多樣化信息服務(wù),同時(shí)還包含區(qū)別于物質(zhì)的數(shù)據(jù)資源的價(jià)值發(fā)現(xiàn)和價(jià)值轉(zhuǎn)換,以及由大數(shù)據(jù)帶來(lái)的精神和文化方面的嶄新現(xiàn)象。
李德毅進(jìn)一步指出,大數(shù)據(jù)來(lái)源于人類的測(cè)量、記錄和分析世界的渴望和無(wú)盡的追求。隨著信息技術(shù),尤其是傳感器、通信、計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,人類獲取數(shù)據(jù)的手段越來(lái)越多,速度大大加快、成本急劇降低,層次和尺度更為精細(xì),揭示自然現(xiàn)象和社會(huì)現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,這樣一來(lái),大數(shù)據(jù)將成為網(wǎng)絡(luò)時(shí)代人類社會(huì)的重要資產(chǎn)。
在李德毅看來(lái),大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù)。它反映的是網(wǎng)絡(luò)時(shí)代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以3個(gè)數(shù)量級(jí)的階梯迅速增長(zhǎng),是用傳統(tǒng)工具難以認(rèn)知的、具有更大挑戰(zhàn)的數(shù)據(jù)。
在數(shù)據(jù)密集型的網(wǎng)絡(luò)時(shí)代,任何傳統(tǒng)的“學(xué)科”或“行業(yè)”的公理、原理和定理組合而成的語(yǔ)境,遇到“互聯(lián)網(wǎng)+”的挑戰(zhàn),這樣一來(lái),“學(xué)科”和“行業(yè)”拓展成為交叉學(xué)科或者“四不像”行業(yè),是“大數(shù)據(jù),小模型、小定律、交叉學(xué)科”的時(shí)代,模型和程序要圍繞數(shù)據(jù)轉(zhuǎn)。
李德毅認(rèn)為,大數(shù)據(jù)時(shí)代數(shù)據(jù)量巨大、價(jià)值密度低,實(shí)時(shí)在線,多源異構(gòu)、混雜敏捷、呈現(xiàn)復(fù)雜多樣的數(shù)據(jù)集合,需要跨媒體關(guān)聯(lián),難以在單機(jī)計(jì)算架構(gòu)上聚類,必須依托云計(jì)算,進(jìn)行并行/分布式處理。
聚類成為
發(fā)現(xiàn)大數(shù)據(jù)價(jià)值第一步
李德毅在演講中指出,盡管大數(shù)據(jù)在認(rèn)知上具有挑戰(zhàn)性,但是聚類將會(huì)成為大數(shù)據(jù)認(rèn)知的突破口?!拔镆灶惥?,人以群分”,是人類幾千年來(lái)認(rèn)識(shí)世界和社會(huì)的基本能力,是從大數(shù)據(jù)中發(fā)現(xiàn)價(jià)值必須面對(duì)的一個(gè)普遍性、基礎(chǔ)性問題,是認(rèn)知科學(xué)作為“學(xué)科的學(xué)科”要解決的首要問題。認(rèn)知科學(xué)要有所突破,首先要在大數(shù)據(jù)聚類上突破。
無(wú)論是政治、經(jīng)濟(jì)、文學(xué)、歷史、社會(huì)、文化,還是數(shù)理、化工、醫(yī)農(nóng)、交通、地理,各行各業(yè)的大數(shù)據(jù),或宏觀或微觀的任何價(jià)值發(fā)現(xiàn),無(wú)不借助于大數(shù)據(jù)聚類分析的結(jié)果。因此,數(shù)據(jù)分析和挖掘的首要問題是聚類,這種聚類是跨學(xué)科、跨領(lǐng)域、跨媒體的。大數(shù)據(jù)聚類是數(shù)據(jù)密集型科學(xué)的基礎(chǔ)性、普遍性問題。
李德毅以汽車保險(xiǎn)為例,物聯(lián)網(wǎng)時(shí)代,當(dāng)汽車成為輪式機(jī)器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個(gè)大數(shù)據(jù)發(fā)生體。每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會(huì)記錄在案。利用大數(shù)據(jù)聚類,保險(xiǎn)公司可對(duì)一個(gè)車況好、駕駛習(xí)慣好、常走線路事故率低、不勤開車的特定客戶,給予更大的優(yōu)惠,而對(duì)風(fēng)險(xiǎn)太高的客戶,即使他報(bào)高價(jià),也有可能拒絕,總之能夠給出包括保險(xiǎn)費(fèi)支付方式在內(nèi)的個(gè)性化解決方案,這就顛覆了保險(xiǎn)公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類成為保險(xiǎn)公司核心競(jìng)爭(zhēng)力的原因,而大數(shù)據(jù)聚類也將成為很多行業(yè)的核心競(jìng)爭(zhēng)力。
李德毅同時(shí)提醒,通過(guò)大數(shù)據(jù)聚類即時(shí)發(fā)現(xiàn)價(jià)值,要充分認(rèn)識(shí)大數(shù)據(jù)中的不確定性和價(jià)值的隱蔽性,要跨界創(chuàng)新、跨界構(gòu)建基于統(tǒng)計(jì)的可變視角和可變尺度的全新發(fā)現(xiàn)狀態(tài)空間,同時(shí),用大數(shù)據(jù)的規(guī)模來(lái)保證發(fā)現(xiàn)價(jià)值的精準(zhǔn)性,因?yàn)榱?xí)慣性認(rèn)知或傳統(tǒng)聚類工具難有創(chuàng)新。
機(jī)器人時(shí)代
真的來(lái)了
如何認(rèn)識(shí)機(jī)器人?李德毅指出,智能機(jī)器人是集新材料、新工藝、新能源、機(jī)械、電子、移動(dòng)通信、全球定位導(dǎo)航、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、自動(dòng)化、人工智能、認(rèn)知科學(xué)、乃至人文藝術(shù)等多個(gè)學(xué)科、多種技術(shù)于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設(shè)備,是人類社會(huì)走向智慧生活的重要伴侶,將引發(fā)人人聯(lián)網(wǎng)、物物聯(lián)網(wǎng)的嶄新形態(tài),也將改變?nèi)祟惖纳a(chǎn)活動(dòng)、經(jīng)濟(jì)活動(dòng)和社會(huì)生活。
李德毅認(rèn)為,機(jī)器人既使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動(dòng)者。機(jī)器人是大數(shù)據(jù)認(rèn)知的典型代表,而在目前,無(wú)論是搬運(yùn)、碼垛、研磨、拋光、挖掘等灰頭土臉的工業(yè)機(jī)器人,還是微電子產(chǎn)品生產(chǎn)線上精細(xì)靈巧的機(jī)器人,機(jī)器人在我們的生產(chǎn)生活中已經(jīng)隨處可見。
李德毅舉例,以達(dá)芬奇機(jī)器人為代表的多手臂、可遙控的微創(chuàng)手術(shù)工具,在從泌尿外科到心臟病的一系列手術(shù)中成功使用,手術(shù)時(shí)間短,痛苦少,費(fèi)用低,大大激發(fā)了人們?nèi)パ邪l(fā)柔軟、小巧、安全和智能的醫(yī)療機(jī)器人。而在不遠(yuǎn)的將來(lái),還將有更多工業(yè)機(jī)器人、農(nóng)業(yè)機(jī)器人、醫(yī)療與健康機(jī)器人、服務(wù)機(jī)器人、太空機(jī)器人、國(guó)防機(jī)器人出現(xiàn),可以說(shuō)機(jī)器人時(shí)代真的來(lái)了。
李德毅說(shuō),機(jī)器人革命是世界性的、時(shí)代性的。機(jī)器人換人首先不是換掉理發(fā)師之類的勞動(dòng)者,而可能是產(chǎn)業(yè)工人、醫(yī)生、服務(wù)員,甚至士兵,他們將升級(jí)轉(zhuǎn)型成為機(jī)器人的創(chuàng)造者和使用者,成為懂得集成、維修、管理機(jī)器人的專業(yè)人才??缃鐫B透和跨界創(chuàng)新誕生的智能制造也是我國(guó)正在抓住的一次歷史機(jī)遇。