郭朝暉
大數(shù)據(jù)的概念源于搜索引擎等互聯(lián)網(wǎng)行業(yè)。在這些行業(yè)中,成千上萬個(gè)網(wǎng)站的數(shù)據(jù)不斷加入,數(shù)據(jù)格式各種各樣。互聯(lián)網(wǎng)公司認(rèn)為這是個(gè)機(jī)會(huì),但數(shù)據(jù)量大到難以處理。于是,谷歌提出一套辦法解決這類問題,大數(shù)據(jù)的概念就此產(chǎn)生了。在這種背景下,人們總結(jié)出了大數(shù)據(jù)的幾個(gè)特征,如數(shù)據(jù)量大、價(jià)值密度低、類型多、增加快等。其中有一個(gè)關(guān)鍵的問題——數(shù)據(jù)量大了怎么辦?
伴隨著摩爾定律的延續(xù),工業(yè)企業(yè)的數(shù)據(jù)也在不斷增加。于是,也有人提出了“工業(yè)大數(shù)據(jù)”的概念。但是,工業(yè)企業(yè)和互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)背景很不一樣。傳統(tǒng)工業(yè)企業(yè)一般只采集必須的數(shù)據(jù),比如那些與生產(chǎn)控制和質(zhì)量標(biāo)準(zhǔn)有關(guān)的數(shù)據(jù),而設(shè)備狀態(tài)數(shù)據(jù)就很少存儲(chǔ)或存儲(chǔ)時(shí)間很短。人們希望得到更多的數(shù)據(jù),但必須考慮采集和存儲(chǔ)的成本問題。這是另外一種“數(shù)據(jù)量大了怎么辦”的問題?,F(xiàn)在,數(shù)據(jù)采集、傳輸和存儲(chǔ)的成本大大降低了,數(shù)據(jù)采集和存儲(chǔ)條件改善了,“數(shù)據(jù)量大了怎么辦”的困難也就弱化了。
由此可見,在工業(yè)和互聯(lián)網(wǎng)領(lǐng)域都曾面臨“數(shù)據(jù)量大了怎么辦”的問題。但是,在互聯(lián)網(wǎng)行業(yè),瓶頸是數(shù)據(jù)量大帶來的困難,這出現(xiàn)在數(shù)據(jù)量大的時(shí)候,需要用技術(shù)手段去解決;而在工業(yè)行業(yè),主要瓶頸是成本問題,出現(xiàn)在數(shù)據(jù)少的時(shí)候。所以,隨著數(shù)據(jù)越來越多,在互聯(lián)網(wǎng)行業(yè)的技術(shù)困難越來越大,而在工業(yè)行業(yè)獲得數(shù)據(jù)的經(jīng)濟(jì)困難卻越來越小。從某種意義上說,工業(yè)領(lǐng)域的大數(shù)據(jù)時(shí)代是“不必考慮數(shù)據(jù)量大了怎么辦”的時(shí)代——因?yàn)楝F(xiàn)在有辦法解決了。
事實(shí)上,工業(yè)和互聯(lián)網(wǎng)領(lǐng)域?qū)Υ髷?shù)據(jù)的理解還有很多不同。比如,互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)分析強(qiáng)調(diào)相關(guān)性,而工業(yè)領(lǐng)域往往需要因果關(guān)系支撐,否則,分析結(jié)果的可靠性就難以保證,會(huì)給應(yīng)用過程帶來極大的危害。再如,互聯(lián)網(wǎng)數(shù)據(jù)之間的關(guān)聯(lián)性相對(duì)較弱,而工業(yè)數(shù)據(jù)之間的關(guān)聯(lián)性很強(qiáng)。
然而,很多人仍然把互聯(lián)網(wǎng)公司的思想、概念和方法直接套用到工業(yè)界,這樣做會(huì)誤導(dǎo)工作的方向、喪失時(shí)代的機(jī)遇,是缺乏思考的表現(xiàn)。對(duì)于工業(yè)人來說,我們現(xiàn)在主要關(guān)心的不是“數(shù)據(jù)量大了怎么辦”,而是如何利用數(shù)據(jù)帶動(dòng)技術(shù)和管理水平的提升、如何用數(shù)據(jù)帶來價(jià)值。
寶鋼信息技術(shù)奠基人何麟生先生在多年前就有一個(gè)愿望:“要有一個(gè)虛擬的數(shù)字化寶鋼,能夠在計(jì)算機(jī)和網(wǎng)絡(luò)平臺(tái)上充分地描述實(shí)體寶鋼的實(shí)時(shí)活動(dòng)?!边@樣的愿望,只有在大數(shù)據(jù)時(shí)代才有條件實(shí)現(xiàn)。因?yàn)橹挥袛?shù)據(jù)足夠多的時(shí)候,才能完整、實(shí)時(shí)、準(zhǔn)確地描述和記錄生產(chǎn)過程。就像寶鋼老專家王洪水先生說的“像錄像一樣地記錄生產(chǎn)過程”,這樣,數(shù)據(jù)才能反映生產(chǎn)過程的因果關(guān)系。
有了這樣的數(shù)據(jù)基礎(chǔ)之后,我們可以全面深入地推進(jìn)智能化。在筆者看來,在短期內(nèi),鋼廠智能化的重點(diǎn)應(yīng)該是管理和控制的融合。美國大河公司的實(shí)踐,證明了這個(gè)方向的正確性。
在工業(yè)大數(shù)據(jù)時(shí)代,可以通過工業(yè)互聯(lián)網(wǎng)等技術(shù)重構(gòu)人和機(jī)器的界面來推進(jìn)決策革命、提升企業(yè)的整體價(jià)值。這些技術(shù)又會(huì)導(dǎo)致更深刻的變化,如組織流程的重構(gòu)、生產(chǎn)流程的再造、從服從到協(xié)同的文化轉(zhuǎn)變等。所有這一切,都是在“數(shù)據(jù)量大了不是問題”的前提下才能實(shí)現(xiàn)的。這才是工業(yè)大數(shù)據(jù)真正的意義所在。
(作者系優(yōu)也信息科技有限公司首席科學(xué)家,工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟工業(yè)大數(shù)據(jù)組副主席)
《中國冶金報(bào)》(2020年09月15日 04版四版)