一、“大數(shù)據(jù)”概述

  (一)大數(shù)據(jù)的概念和特征

  “大數(shù)據(jù)”(big data)是一個體量特別大、數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對其內(nèi)容進行抓取、管理和處理??傮w而言,大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。從數(shù)據(jù)類別上看,大數(shù)據(jù)指的是無法使用傳統(tǒng)流程和工具進行處理或分析的信息,它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集。亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)、大數(shù)據(jù)科學(xué)家John Rauser提到一個簡單的定義:大數(shù)據(jù)就是任何超過了一臺計算機處理能力的龐大數(shù)據(jù)量。大數(shù)據(jù)是可能不包含所有的信息,但包含了大部分的信息。對大數(shù)據(jù)的一部分認知在于,它是如此之大,分析它需要多個工作負載,這是AWS的定義。當(dāng)技術(shù)達到極限時,也就是數(shù)據(jù)的極限。大數(shù)據(jù)的關(guān)鍵不是如何定義,而是如何使用,最大的挑戰(zhàn)在于哪些技術(shù)能更好的使用數(shù)據(jù)以及大數(shù)據(jù)的應(yīng)用情況如何。

  大數(shù)據(jù)的特征主要體現(xiàn)在四個方面:首先是指數(shù)據(jù)體量大,大型數(shù)據(jù)集一般在10TB規(guī)模左右,但在實際應(yīng)用中,很多企業(yè)用戶把多個數(shù)據(jù)集放在一起,已經(jīng)形成了PB級的數(shù)據(jù)量;其次是指數(shù)據(jù)類別大,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);三是數(shù)據(jù)處理速度快,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實時處理;四是數(shù)據(jù)真實性高,隨著社交數(shù)據(jù)、企業(yè)內(nèi)容、交易與應(yīng)用數(shù)據(jù)等新數(shù)據(jù)源的興趣,傳統(tǒng)數(shù)據(jù)源的局限被打破,企業(yè)愈發(fā)需要有效的信息之力以確保其真實性及安全性。

  “大數(shù)據(jù)”的概念遠不止大量的數(shù)據(jù)(TB)和處理大量數(shù)據(jù)的技術(shù),更讓我們以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品和服務(wù),或深刻的洞見,最終形成變革之力。從數(shù)據(jù)分析的角度,包含五個方面:一是可視化分析(Analytic Visualizations),大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家,同時還有普通用戶,但是他們二者對于大數(shù)據(jù)分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現(xiàn)大數(shù)據(jù)特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了;二是數(shù)據(jù)挖掘算法(Data Mining Algorithms),這是大數(shù)據(jù)分析的理論核心,各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學(xué)的呈現(xiàn)出數(shù)據(jù)本身具備的特點,也正是因為這些被全世界統(tǒng)計學(xué)家所公認的各種統(tǒng)計方法才能深入數(shù)據(jù)內(nèi)部,挖掘出公認的價值。另外一個方面也是因為有這些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù),如果一個算法得花上好幾年才能得出結(jié)論,那大數(shù)據(jù)的價值也就無從說起了。三是預(yù)測性分析能力(Predictive Analytic Capabilities),預(yù)測性分析是大數(shù)據(jù)分析最重要的應(yīng)用領(lǐng)域之一,從大數(shù)據(jù)中挖掘出特點,通過科學(xué)的建立模型,之后便可以通過模型帶人新的數(shù)據(jù),從而預(yù)測未來的數(shù)據(jù)。四是語義引擎(Semantic Engines),由于非結(jié)構(gòu)化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新挑戰(zhàn),需要一系列的工具能夠從“文檔”中解析、提取、分析數(shù)據(jù)。五是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理(Data Quality and Master Data Management),大數(shù)據(jù)分析離不開數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理,高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理,無論是在學(xué)術(shù)研究還是在商業(yè)應(yīng)用領(lǐng)域,都能夠保證分析結(jié)果的真實和有價值。

  (二)大數(shù)據(jù)的作用

  政府部門越來越注重運用技術(shù)手段對數(shù)據(jù)資源進行深度的價值挖掘,滿足日益增長的精細化、科學(xué)化管理需要。與此同時,隨著社會經(jīng)濟文化的發(fā)展和進步,公眾對政府和職能部門的要求也越來越高,集中表現(xiàn)為要求提高行政效率和透明度、創(chuàng)新工作方式、提高對社會的服務(wù)能力等。

  首先,有利于為市民的日常生活提供服務(wù)。隨著生活水平的不斷提高,市民對包括氣象、食品安全、交通等在內(nèi)的生活資訊類信息愈發(fā)關(guān)注,實現(xiàn)此類信息的公開,為市民提供更準確、及時、便利的日常生活服務(wù),將促進政府服務(wù)轉(zhuǎn)型,樹立良好的政府形象。

  其次,有利于提高政府部門提高行政管理水平。體現(xiàn)在兩個方面:一是有利于提升政府部門協(xié)同共享。隨著經(jīng)濟社會的快速發(fā)展,資源環(huán)境的約束H益顯現(xiàn),城市的發(fā)展轉(zhuǎn)型迫在眉睫,對政府管理部門的管理能力提出了更高的要求,將倒逼政府部門問實現(xiàn)公共信息資源的共享。二是有利于提升管理決策水平。在政策制定階段,數(shù)據(jù)分析是決定政策質(zhì)量高低的關(guān)鍵性因素。在政策實施階段,數(shù)據(jù)分析能夠有效監(jiān)控政策實施情況。通過數(shù)據(jù)分析監(jiān)控,可以掌握政策是否按計劃實施,對于計劃實施過程中出現(xiàn)的問題或失誤,數(shù)據(jù)分析工作可以及時、準確地反映。在政策評估階段,需要通過科學(xué)的數(shù)據(jù)分析來解答,對未來政策的完善提供借鑒。

  第三,有利于為企業(yè)發(fā)展提供服務(wù)。政府信息公開,側(cè)重于政府信息的社會屬性。在創(chuàng)新驅(qū)動、轉(zhuǎn)型發(fā)展的背景下,政府部門公共信息資源的經(jīng)濟屬性越來越受到企業(yè)的關(guān)注。當(dāng)前,政府部門的公共信息資源已成為一種創(chuàng)造價值的新的生產(chǎn)要素,向企業(yè)開放后,將會極大地推動本市信息服務(wù)業(yè)的發(fā)展。

  (三)政府“大數(shù)據(jù)”應(yīng)用的需求分析

  1、政府職能轉(zhuǎn)變迫切地需要大數(shù)據(jù)加以支撐

  從內(nèi)部管理的角度看,政府需要降低行政成本、提高決策的科學(xué)化水平。在信息化時代,政府機構(gòu)、職能有效發(fā)揮依賴高效、實時的信息系統(tǒng)、尤其是大數(shù)據(jù)的支持。信息化時代,政府掌握著大量的、關(guān)鍵的數(shù)據(jù),是數(shù)據(jù)時代的財富擁有者,但以往由于信息技術(shù)、體制機制等限制,各級政府及各部門之間的信息網(wǎng)絡(luò)往往自成體系,相互割裂,相互之間的數(shù)據(jù)難以實現(xiàn)互通和共享,導(dǎo)致目前政府掌握的數(shù)據(jù)大多處于割裂和休眠狀態(tài)。同時由于政府各部門信息系統(tǒng)分割,許多數(shù)據(jù)往往需要重復(fù)采集,數(shù)據(jù)采集成本較高。隨著大數(shù)據(jù)和云計算技術(shù)的發(fā)展,建設(shè)統(tǒng)一的政府信息系統(tǒng)平臺成為可能。通過統(tǒng)一的信息平臺,實現(xiàn)數(shù)據(jù)的標(biāo)準、格式的統(tǒng)一和共享,利用大數(shù)據(jù)技術(shù),數(shù)據(jù)獲取、處理及分析響應(yīng)時間大幅減少,工作效率明顯提高,有利于壓縮政府開支,降低行政成本。同時,對于數(shù)據(jù)的統(tǒng)一和共享所產(chǎn)生的大數(shù)據(jù),通過數(shù)據(jù)挖掘等技術(shù),能夠增強政府社會管理水平。大數(shù)據(jù)在政府和公共服務(wù)領(lǐng)域的應(yīng)用,可有效推動政務(wù)工作開展,提高政府部門決策的科學(xué)化水平、服務(wù)效率和社會管理水平。

  從對外服務(wù)的角度看,政府提供公共服務(wù)、促進經(jīng)濟社會發(fā)展的職能發(fā)揮同樣需要大數(shù)據(jù)支持。政府掌握了大量關(guān)于人口、法人和城市空間地理等數(shù)據(jù),提供滿足群眾需求、針對性的公共服務(wù)需要對所掌握數(shù)據(jù)的精細分析。憑借大數(shù)據(jù),城市公共衛(wèi)生、教育、城市規(guī)劃、交通服務(wù)能夠得到改善,基于大數(shù)據(jù)分析結(jié)論的政府公共服務(wù)決策能夠更好的滿足市民需求。目前,各個地方政府大力興建智慧城市,智慧城市已成為國內(nèi)信息化建設(shè)的潮流,“智慧”的關(guān)鍵在于對大數(shù)據(jù)的研究,只有利用大數(shù)據(jù)分析,才能實現(xiàn)電子政務(wù)信息系統(tǒng)有效整合,實現(xiàn)跨部門的政府信息資源共享和政務(wù)協(xié)同,讓政府的管理服務(wù)效能提升,讓民眾感受到政府無處不在服務(wù)。政府另一項職能是促進經(jīng)濟社會發(fā)展,如在經(jīng)濟異常波動時實施宏觀調(diào)控,政府對大數(shù)據(jù)信息的掌握和分析,直接決定了宏觀調(diào)控的效果。這些都對大數(shù)據(jù)提出了要求。

  2、統(tǒng)一共享的數(shù)據(jù)平臺是實現(xiàn)大數(shù)據(jù)發(fā)展的重要前提

  對于大數(shù)據(jù)基礎(chǔ)庫,代表性的有人口、法人和空間地理三大基礎(chǔ)庫。這三大基礎(chǔ)庫收集了大量的居民、企業(yè)和城市空間地理信息,數(shù)據(jù)量龐大,這些數(shù)據(jù)的有效發(fā)揮需要大數(shù)據(jù)收集、存儲、管理、運用技術(shù)的支持。同時三大基礎(chǔ)數(shù)據(jù)庫與各專業(yè)庫的統(tǒng)一及共享,有利于降低政府信息使用成本,提高行政效率。同時也為專業(yè)庫和應(yīng)用庫層次提供了信息系統(tǒng)基礎(chǔ)設(shè)施支撐。目前,政府掌握數(shù)據(jù)中大部分都是非結(jié)構(gòu)化的數(shù)據(jù),現(xiàn)有的軟件和工具主要適用于以結(jié)構(gòu)化數(shù)據(jù)為主的傳統(tǒng)數(shù)據(jù),要想及時捕捉、存儲、聚合和管理這些大數(shù)據(jù),以及對數(shù)據(jù)進行深度分析和挖掘,政府首先需要全面整合并打通三大基礎(chǔ)數(shù)據(jù)庫與各專業(yè)庫的互連阻礙,建立統(tǒng)一的、共享的基礎(chǔ)數(shù)據(jù)平臺。

  專業(yè)庫是基于基礎(chǔ)庫的專業(yè)數(shù)據(jù)庫,如教育庫、醫(yī)療庫、交通庫等,這些專業(yè)數(shù)據(jù)庫為方便居民生活提供了條件??梢灶A(yù)見,隨著經(jīng)濟社會的發(fā)展,政府的公共服務(wù)職能將更加突出,主動服務(wù)群眾、提供公開透明的信息是時代對政府的要求?;诨A(chǔ)庫,政府各部門對教育、醫(yī)療、交通等專業(yè)庫信息進行深度共享、數(shù)據(jù)挖掘,有利于政府掌握更細致的信息,為居民提供更加個性化、更加貼心的公共服務(wù)。如個性化醫(yī)療:比如對病人的醫(yī)療數(shù)據(jù)、電子病歷、遺傳情況、職業(yè)特征、飲食狀況等運用大數(shù)據(jù)技術(shù)進行分析、挖掘,可以幫助大夫提供更個性化的醫(yī)療服務(wù)。

  應(yīng)用庫是基于基礎(chǔ)庫和專業(yè)庫的數(shù)據(jù)基礎(chǔ),可為社會提供針對性的應(yīng)用服務(wù)。政府職能之一就是促進經(jīng)濟發(fā)展,尤其是在上海市“創(chuàng)新驅(qū)動、轉(zhuǎn)型發(fā)展”的大背景下,大數(shù)據(jù)、云計算等新興技術(shù)層出不窮,新應(yīng)用、新商業(yè)模式不斷涌現(xiàn),要求政府向社會、企業(yè)開放大數(shù)據(jù)服務(wù),并引導(dǎo)企業(yè)探索創(chuàng)新數(shù)據(jù)產(chǎn)業(yè)業(yè)務(wù)模式,積極培育大數(shù)據(jù)產(chǎn)業(yè)。隨著數(shù)據(jù)開放度的加大,基于開放數(shù)據(jù)開發(fā)的應(yīng)用系統(tǒng)越來越多,這種大眾創(chuàng)新和社會創(chuàng)新模式將越來越普遍。開放大數(shù)據(jù)服務(wù),不僅有利于本市形成完善的數(shù)據(jù)產(chǎn)業(yè)鏈,有利于培育戰(zhàn)略性新興產(chǎn)業(yè),并將有力促進本市經(jīng)濟結(jié)構(gòu)轉(zhuǎn)型。

  (四)當(dāng)前政府?dāng)?shù)據(jù)管理的主要特征

  “政府?dāng)?shù)據(jù)管理”有兩個含義:一是對政府信息本身的管理,即對政府信息的收集、加工、存儲、傳遞、反饋和利用的過程管理;二是對涉及政府信息活動的各種信息資源要素管理,如公務(wù)人員、行政組織、政府信息及其開發(fā)利用支撐技術(shù)等結(jié)合起來進行管理,從而有效地滿足政府部門行政管理需求的全過程。政府?dāng)?shù)據(jù)管理的目的是政府?dāng)?shù)據(jù)資源得到充分開發(fā)和利用,以實現(xiàn)政府辦公業(yè)務(wù)數(shù)據(jù)資源共享與網(wǎng)上政府向社會公眾提供政府信息服務(wù)。政府?dāng)?shù)據(jù)管理貫穿信息收集、整理、貯存、發(fā)布、服務(wù)等全過程,內(nèi)容包括信息網(wǎng)絡(luò)、應(yīng)用系統(tǒng)、信息的采集和發(fā)布及相關(guān)的管理體制、程序、實施模式和項目管理。

  當(dāng)前,國內(nèi)政府?dāng)?shù)據(jù)管理的主要特征為:

  一是政府部門對數(shù)據(jù)資源的獨占性較為嚴重。據(jù)統(tǒng)計,目前國內(nèi)約80%的社會信息資源由政府部門控制,這種局面是在長期計劃經(jīng)濟體制下形成的。改革開放以來,雖然信息服務(wù)市場的需求情況已發(fā)生了很大變化,但在信息服務(wù)供給方面,數(shù)據(jù)資源開發(fā)以政府為主,信息系統(tǒng)建設(shè)為政府服務(wù),相關(guān)投入由政府資助的基本格局并沒有發(fā)生根本性的改觀。

  二是數(shù)據(jù)共享性較差。數(shù)據(jù)共享意識較落后,部分政府部門認為擁有數(shù)據(jù)越多,權(quán)力就越大,不愿把數(shù)據(jù)資源在網(wǎng)上共享。部分行業(yè)(部門)各自開發(fā)自己的網(wǎng)上數(shù)據(jù)服務(wù)系統(tǒng),信息產(chǎn)品重復(fù)、不足與閑置并存,造成資源的嚴重浪費,也不能形成規(guī)模優(yōu)勢和效益。在現(xiàn)有國內(nèi)的3000多個數(shù)據(jù)庫中,真正流通起來被利用的不足10%。公用信息與保密信息的界限不明,數(shù)據(jù)價值無法確定。在全國范圍內(nèi)目前還未形成通過網(wǎng)絡(luò)利用政府?dāng)?shù)據(jù)資源的態(tài)勢,且缺乏行之有效的組織和辦法,網(wǎng)上可利用的政府信息資源較少。

  三是政府?dāng)?shù)據(jù)資源管理系統(tǒng)標(biāo)準不統(tǒng)一。盡管我國的政府信息化建設(shè)已經(jīng)歷了20年的時間,國家在這方面也投入了大量的財政資金,我國政府辦公業(yè)務(wù)網(wǎng)(政務(wù)內(nèi)網(wǎng))已基本建成,政府公眾信息網(wǎng)(政務(wù)外網(wǎng))也形成了相當(dāng)規(guī)模。但是由于標(biāo)準不一、各自為政、自成一體、不聯(lián)不通,缺乏有效整合,政府大小部門問最終形成了一個個“信息孤島”,隔斷了部門內(nèi)業(yè)務(wù)上的內(nèi)在聯(lián)系,致使豐富的數(shù)據(jù)資源難以得到共享,大量資金投入的結(jié)果,卻不能獲得為社會提供便利的政府公共服務(wù)的回報。

  四是缺乏統(tǒng)一的、常設(shè)的管理協(xié)調(diào)機構(gòu)。我國政府組織結(jié)構(gòu)是縱向?qū)蛹壷坪蜋M向職能制交叉組成的二維模式,政府對數(shù)據(jù)資源并未做統(tǒng)一的管理,也沒有設(shè)立相應(yīng)的統(tǒng)一的管理機關(guān)。當(dāng)需要對跨部門的信息資源進行管理時,只能設(shè)立臨時性的協(xié)調(diào)、管理機構(gòu)。因缺乏統(tǒng)一的、常設(shè)的管理協(xié)調(diào)機構(gòu),我國政府的信息資源管理表現(xiàn)為缺乏監(jiān)督和協(xié)調(diào),壁壘林立,沒有統(tǒng)一的標(biāo)準,沒有統(tǒng)一的目標(biāo),也沒有統(tǒng)一的政策及指導(dǎo)思想,管理相對混亂。

  五是數(shù)據(jù)收集、加工、存儲、利用的規(guī)范性差。目前與數(shù)據(jù)資源管理相關(guān)的只有《檔案法》、《保密法》、《統(tǒng)計法》等少數(shù)法律。從總體上來看,這些法律對相關(guān)數(shù)據(jù)信息管理的程序、期限、方式等方面的規(guī)定都比較簡單。尤其是實際工作中,數(shù)據(jù)管理人員多傾向于保密,因為不公開就無須承擔(dān)責(zé)任,若公開的話,則有可能要冒因公開不當(dāng)而導(dǎo)致泄密的風(fēng)險。由于法律、法規(guī)缺位,行政機關(guān)對數(shù)據(jù)資源管理認識的缺乏以及行政機關(guān)工作經(jīng)驗的不足,導(dǎo)致現(xiàn)階段我國的數(shù)據(jù)管理處于相對隨意的狀況。[page]

  二、國內(nèi)外促進大數(shù)據(jù)發(fā)展的案例分析及經(jīng)驗啟示

  (一)國外政府及國際組織應(yīng)用案例

  1、英國——政府在關(guān)鍵行業(yè)的大投資獲得大回報

  英國政府在大數(shù)據(jù)應(yīng)用方面無疑是走在全球前列的,2010年1月以來,英國政府OpenData網(wǎng)站的人均訪問頁面數(shù)增長了285%,總訪問量比法國和美國(data.gov)的同類網(wǎng)站還要高??梢钥闯鲇诖髷?shù)據(jù)領(lǐng)域的大手筆投資已經(jīng)開始收到回報:一份行業(yè)報告顯示,英國政府通過高效使用公共大數(shù)據(jù)技術(shù)每年可節(jié)省約330億英鎊,相當(dāng)于英國每人每年節(jié)省約500英鎊。

  雖然經(jīng)濟不景氣,財政被迫收緊,但大數(shù)據(jù)依然是英國政府舍得為之一擲千金的“寵兒”。2013年年初,英國商業(yè)、創(chuàng)新和技能部宣布,將注資6億英鎊發(fā)展8類高新技術(shù),大數(shù)據(jù)獨攬其中的1.89億英鎊。

  英國首個綜合運用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研中心坐落在牛津大學(xué)。這一中心的成立給英國醫(yī)學(xué)研究和醫(yī)療服務(wù)帶來革命性變化,它促進醫(yī)療數(shù)據(jù)分析方面的新進展,幫助科學(xué)家更好地理解人類疾病及其治療方法。

  這個研究中心總投資達9000萬英鎊,可容納600名科研人員。中心通過搜集、存儲和分析大量醫(yī)療信息,確定新藥物的研發(fā)方向,從而減少藥物開發(fā)成本,同時為發(fā)現(xiàn)新的治療手段提供線索。

  作為新生事物,大數(shù)據(jù)的發(fā)展仍面臨許多挑戰(zhàn)。牛津大學(xué)統(tǒng)計學(xué)教授彼得·唐納利認為目前大數(shù)據(jù)技術(shù)的一個瓶頸就是信息采集,拿牛津大學(xué)新成立的醫(yī)藥衛(wèi)生科研中心來說,首先要有足夠量的病人、藥物等相關(guān)信息,這是數(shù)據(jù)分析的基礎(chǔ),然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業(yè)也有可能因為商業(yè)利益不愿共享藥物成分等敏感信息。

  要從海量數(shù)據(jù)中得出有用結(jié)論,專業(yè)的數(shù)據(jù)分析是關(guān)鍵。牛津大學(xué)教授羅里·柯林斯認為,采集到足夠信息后,需要由相關(guān)領(lǐng)域的專業(yè)人士與信息技術(shù)專家一起對數(shù)據(jù)進行有針對性的歸納和分析,而這種跨學(xué)科、跨領(lǐng)域合作能否順利實現(xiàn),也是大數(shù)據(jù)實際應(yīng)用中的一個問題。

  2、美國——注重區(qū)域及行業(yè)應(yīng)用,以人為本,小項目大回報

  相比英國政府高投入高回報相比,美國政府的大數(shù)據(jù)計劃開展比較早,形式更松散,效益回報分布在社會的各個方面。

  例如西雅圖市與微軟和埃森哲試點大數(shù)據(jù)節(jié)能項目。項目基于微軟的Azure云計算平臺,將手機和分析來自四個城區(qū)建筑管理系統(tǒng)的數(shù)百個數(shù)據(jù)集。通過預(yù)測分析工具,大數(shù)據(jù)系統(tǒng)能找出可行的節(jié)能措施,預(yù)計目標(biāo)是將耗電量降低達到25%。

  專為車主停車開發(fā)的一個手機應(yīng)用,支持iOS和Android手機,能夠跟蹤入網(wǎng)城市的停車位。用戶只需要輸入地址或者在地圖中選定地點,就能看到附近可用的車庫或停車位,以及價格和時間區(qū)間。該移動應(yīng)用能夠?qū)崟r跟蹤停車位數(shù)量變化,目前已經(jīng)能夠?qū)崟r監(jiān)控包括華盛頓、紐約、芝加哥、巴爾的摩、波士頓、密爾沃基和紐瓦克等七個城市的停車位。有效緩解了上班高峰的停車問題。

  在面對暴雪等災(zāi)害天氣時,美國的地方政府也通過大數(shù)據(jù)進行非常獨特的控制和管理,例如波士頓和芝加哥每到冬季就會有很厚的積雪,波士頓新城區(qū)辦公室發(fā)布了一款名為:“領(lǐng)養(yǎng)消防栓”的移動應(yīng)用,芝加哥市政府則類似的推出“領(lǐng)養(yǎng)人行道”的應(yīng)用。這兩款應(yīng)用作為大數(shù)據(jù)終端,能夠收集和傳遞大雪時道路和消防栓被積雪掩埋的信息,同時能夠在城市志愿者的幫助下,對于已經(jīng)清理積雪的人行道、消防栓,及時的上報情況。這些數(shù)據(jù)被傳遞到城市的路況監(jiān)測中心,為市民雪天出行提供了可靠的信息。

  無論是英國政府的集中投資、上大項目的方式,還是美國以城市為單位小投資大效用的項目建設(shè)理念,都可以看出無論投資規(guī)模,大數(shù)據(jù)分析對政府職能優(yōu)化,提升城市管理能力,降低政府管理成本都能起到極大的推動作用。

  3、世界銀行——大數(shù)據(jù)提高援助效果,遏制財務(wù)腐敗

  繼歐美等國政府乃至聯(lián)合國紛紛宣布推動開放數(shù)據(jù)計劃(Open Data)后,世界銀行也奮不顧身的投入到大數(shù)據(jù)分析的浪潮之中。世界銀行的開放數(shù)據(jù)計劃是一個由世界銀行與其他機構(gòu),包括聯(lián)合國發(fā)展計劃署,聯(lián)合國商業(yè)發(fā)展署,UNGlobalPulse以及卡塔爾計算研究院等共同參與的一個計劃。由世界銀行的開放財務(wù)團隊以及非盈利組織DataKind發(fā)起的8個項目組成。在推動社會組織之間在數(shù)據(jù)與發(fā)展之間的合作。

  比如,在利用肯尼亞的糧食價格,香蕉和大米的消費量可以快速地分析和預(yù)測當(dāng)?shù)氐耐ㄘ浥蛎浡省亩鵀楦侠淼貙Ξ?dāng)?shù)剡M行援助提供支持。此外,世界銀行利用“主動式的數(shù)據(jù)分析來保證企業(yè)的反腐敗合規(guī)”。針對歐美各國的企業(yè)反腐敗法規(guī),傳統(tǒng)的企業(yè)自檢方式是企業(yè)檢查自身的規(guī)章制度是否符合法規(guī)的要求,然后對一些交易進行抽查。不過,既然大部分企業(yè)都已經(jīng)存儲了他們的財務(wù)數(shù)據(jù),隨著大數(shù)據(jù)分析的普及,企業(yè)的內(nèi)部審計人員就可以利用數(shù)據(jù)分析工具和技術(shù),對那些高風(fēng)險的交易進行“定點”檢查了。而一旦發(fā)生了違法行為,企業(yè)具有針對反腐敗的數(shù)據(jù)分析也能夠幫助企業(yè)減輕一部分法律責(zé)任。

  比如,通過大數(shù)據(jù)分析,企業(yè)可以確定一些高風(fēng)險的交易類型。如那些與政府部門往來的資金,分析涉及大額現(xiàn)金的交易,或者涉及招投標(biāo)方面的交易等等。內(nèi)部審計可以針對這些項目進行專門的審查。

  (二)國內(nèi)地方案例

  1、廣東省——率先啟動大數(shù)據(jù)戰(zhàn)略

  2012年12月廣東省率先啟動大數(shù)據(jù)戰(zhàn)略,根據(jù)《廣東省實施大數(shù)據(jù)戰(zhàn)略工作方案》,廣東省將建立省大數(shù)據(jù)戰(zhàn)略工作領(lǐng)導(dǎo)小組等,為保證大數(shù)據(jù)戰(zhàn)略有效實施,廣東省還將建設(shè)政務(wù)數(shù)據(jù)中心,并為高等院校和企業(yè)等成立大數(shù)據(jù)研究機構(gòu)提供支持。廣東省還將在政府各部門開展數(shù)據(jù)開放試點,并通過部門網(wǎng)站向社會開放可供下載和分析使用的數(shù)據(jù),進一步推進政務(wù)公開。

  廣東省將采用行政收集、網(wǎng)絡(luò)搜取、自愿提供、有償購買等多種方式拓寬數(shù)據(jù)收集渠道。同時,全省網(wǎng)上辦事大廳、政府?dāng)?shù)據(jù)檔案、企業(yè)信用信息網(wǎng)等骨干網(wǎng)絡(luò)系統(tǒng)正在建設(shè)和完善過程中。

  廣東不僅是全國率先開展網(wǎng)絡(luò)問政的省份,而且政府微博數(shù)量也位居全國第一。目前,全省已初步建成集信息公開、網(wǎng)上辦理、便民服務(wù)、電子監(jiān)察于一體的網(wǎng)上辦事大廳,首批45個省級單位和21個地市已全部進駐,并面向企業(yè)和民眾提供“一站式”辦事服務(wù)。

  此外,廣東省已經(jīng)建立了一個橫向聯(lián)通112個省級單位、縱向連接21個地市和121個縣(市、區(qū))的電子政務(wù)網(wǎng)絡(luò)平臺。同時,省級電子政務(wù)信息資源共享平臺也已建成,實現(xiàn)了35個省級部門、185類信息的網(wǎng)絡(luò)共享。

  另外,與大數(shù)據(jù)相配套的數(shù)據(jù)分析工作也在有條不紊的進行著,包括數(shù)據(jù)分析人才的培養(yǎng),數(shù)據(jù)分析行業(yè)的發(fā)展。項目數(shù)據(jù)分析師廣東授權(quán)管理中心,負責(zé)數(shù)據(jù)分析人才的培養(yǎng)工作。

  2、重慶市——發(fā)布行動計劃、明確目標(biāo)任務(wù)

  重慶市政府在2013年7月發(fā)布《重慶市大數(shù)據(jù)行動計劃》,明確提出要推動企事業(yè)單位數(shù)據(jù)共享開放,加快大數(shù)據(jù)產(chǎn)業(yè)布局,促進大數(shù)據(jù)技術(shù)及解決方案在公共服務(wù)、城市管理及產(chǎn)業(yè)發(fā)展等方面的廣泛應(yīng)用;并提出打造2-3個大數(shù)據(jù)產(chǎn)業(yè)示范園區(qū),培育10家核心龍頭企業(yè)、500家大數(shù)據(jù)應(yīng)用和服務(wù)企業(yè),引進和培養(yǎng)1000名大數(shù)據(jù)產(chǎn)業(yè)高端人才,形成500億元大數(shù)據(jù)產(chǎn)業(yè)規(guī)模,實現(xiàn)大數(shù)據(jù)技術(shù)在電子商務(wù)、工業(yè)制造、交通物流、醫(yī)療衛(wèi)生、食品藥品安全、金融、傳媒等行業(yè)的全面應(yīng)用。

  3、南京市——與智慧城市建設(shè)相結(jié)合

  2013年南京市發(fā)布了《2013年全市社會信息化工作要點》,今年南京市“智慧南京”建設(shè)將加快推進,基本實現(xiàn)市民卡城鄉(xiāng)居民全覆蓋。此外,無線寬帶網(wǎng)絡(luò)、智慧醫(yī)療、智慧旅游、數(shù)字化節(jié)能、等領(lǐng)域的信息化建設(shè),將直接改變廣大市民的生活。

  “智慧醫(yī)療”將越來越多地體現(xiàn)在市民看病拿藥中。繼續(xù)深化市民卡在醫(yī)療行業(yè)的應(yīng)用,推進醫(yī)療服務(wù)智能化、健康管理智能化,推進預(yù)約掛號服務(wù)與his、排隊叫號系統(tǒng)深度對接。實行多種途徑掛號、分時段掛號、多種方式支付、預(yù)付費后結(jié)算;加快推進急救車載系統(tǒng)和智能調(diào)度系統(tǒng)建設(shè),向急救車輛提供實時路線導(dǎo)引,實現(xiàn)與現(xiàn)場雙向互動,提高急救資源使用效率;加快推進南京區(qū)域衛(wèi)生信息平臺建設(shè),逐步實現(xiàn)醫(yī)院電子病歷數(shù)據(jù)與市、區(qū)平臺健康檔案數(shù)據(jù)的自動歸檔、自動更新,與公共衛(wèi)生、醫(yī)療保障、藥品監(jiān)管、基層醫(yī)療衛(wèi)生服務(wù)機構(gòu)以及相關(guān)單位進行信息交換與共享;進一步加大新農(nóng)合人群市民卡發(fā)卡力度。

  南京將開展全市道路停車泊位管理智能化項目建設(shè),構(gòu)建全市停車管理服務(wù)平臺,依托車輛智能卡和市民卡,實現(xiàn)停車泊位信息共享和誘導(dǎo)、停車費陜捷支付、停車收費監(jiān)督等功能;推進河西地區(qū)智能交通應(yīng)用試點,通過智能信號控制實現(xiàn)交通的動態(tài)管理,促進公交優(yōu)先戰(zhàn)略實施。

  (三)經(jīng)驗與啟示

  1、大數(shù)據(jù)上升到國家戰(zhàn)略的層次

  大數(shù)據(jù)所帶來的社會變革已經(jīng)深入到人們生活的各個方面,日常的出行、購物、運動、理財?shù)鹊?。從目前國?nèi)外大數(shù)據(jù)發(fā)展歷程和趨勢來看,掌握海量有效數(shù)據(jù)和具有強大數(shù)據(jù)處理分析能力的公司和企業(yè)將走在大數(shù)據(jù)發(fā)展的前沿。為了掌握更多數(shù)據(jù),各大企業(yè)均在搶占互聯(lián)網(wǎng)入口,包括移動瀏覽器、搜索引擎、操作系統(tǒng)、應(yīng)用商店等。

  大數(shù)據(jù)的發(fā)展從以Google、Amazon、Yahoo!為代表的互聯(lián)網(wǎng)大公司,蔓延到越來越多的創(chuàng)業(yè)公司以及金融、電力、電信等各種傳統(tǒng)行業(yè),這些公司和行業(yè)在不同的維度進行數(shù)據(jù)挖掘和分析,創(chuàng)造出更多的商業(yè)模式和經(jīng)濟增長點。同時,包括美國在內(nèi)的諸多國家,都將大數(shù)據(jù)管理上升到國家戰(zhàn)略層面,從國家層面通盤考慮其發(fā)展戰(zhàn)略。

  2、大數(shù)據(jù)仍處于初級發(fā)展階段

  大數(shù)據(jù)的核心價值在于預(yù)測和決策。從數(shù)據(jù)到信息,再到知識,最后形成智慧,這是一個通過大量數(shù)據(jù)挖掘,不拘泥于過往因果認識,重新發(fā)現(xiàn)新規(guī)律,對行為進行判斷的過程。通過大數(shù)據(jù)挖掘所發(fā)現(xiàn)的因果關(guān)系,不僅能揭示存在的規(guī)律,而且能夠預(yù)測未來發(fā)展趨勢。一言以蔽之,大數(shù)據(jù)的意義,就在于能夠通過服務(wù)和管理來積累數(shù)據(jù),再通過數(shù)據(jù)的挖掘和預(yù)測來提升服務(wù)和管理水平。

  但真正大數(shù)據(jù)運用仍處于發(fā)展初級階段。據(jù)美國麥肯錫咨詢機構(gòu)在其一份關(guān)于大數(shù)據(jù)研究報告中指出,大數(shù)據(jù)已經(jīng)對美國健康醫(yī)療、歐洲的政府公共管理、個人位置數(shù)據(jù)、美國的零售業(yè)及制造業(yè)等五個部門產(chǎn)生了重大的經(jīng)濟影響。據(jù)市場研究中心統(tǒng)計分析發(fā)現(xiàn),目前我國在公共領(lǐng)域?qū)Υ髷?shù)據(jù)的運用主要集中在電力行業(yè)、智能交通、電子政務(wù)、司法系統(tǒng)等四個方面。

  3、大數(shù)據(jù)對政府服務(wù)能力有促進作用

  通過政府信息化,大數(shù)據(jù)能夠提高政府決策的科學(xué)性和精準性,提高政府預(yù)測預(yù)警能力以及應(yīng)急響應(yīng)能力,節(jié)約決策的成本。以財政部門為例,基于云計算、大數(shù)據(jù)技術(shù),財政部門可以按需掌握各個部門的數(shù)據(jù),并對數(shù)據(jù)進行分析,做出的決策可以更準確、更高效。另外,也可以依據(jù)數(shù)據(jù)推動財政創(chuàng)新,使財政工作更有效率、更加開放、更加透明。

  當(dāng)前,我國正處在全面建成小康社會征程中,工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化任務(wù)很重,建設(shè)下一代信息基礎(chǔ)設(shè)施,發(fā)展現(xiàn)代信息技術(shù)產(chǎn)業(yè)體系,健全信息安全保障體系,推進信息網(wǎng)絡(luò)技術(shù)廣泛運用,是實現(xiàn)四化同步發(fā)展的保證。大數(shù)據(jù)分析對我們深刻領(lǐng)會世情和國情,把握規(guī)律,實現(xiàn)科學(xué)發(fā)展,做出科學(xué)決策具有重要意義,我們必須重新認識數(shù)據(jù)的重要價值。

  4、大數(shù)據(jù)需要機制體制上的創(chuàng)新和突破

  中國人口居世界首位,將會成為產(chǎn)生數(shù)據(jù)量最多的國家,但我們對數(shù)據(jù)保存不夠重視,對存儲數(shù)據(jù)的利用率也不高。此外,我國一些部門和機構(gòu)擁有大量數(shù)據(jù)卻不愿與其他部門共享,導(dǎo)致信息不完整或重復(fù)投資。政府應(yīng)通過體制機制改革打破數(shù)據(jù)割據(jù)與封鎖,應(yīng)注重公開信息,應(yīng)重視數(shù)據(jù)挖掘。

  當(dāng)前,大數(shù)據(jù)的政府應(yīng)用有兩個值得研究的方向。其一是跨界應(yīng)用,跨界應(yīng)用能打破信息壁壘,提高政府職能部門間信息傳遞和確認的速度。另一個方向則是開放運用,這是國內(nèi)各級政府進展較慢的領(lǐng)域。從美國政府開放數(shù)據(jù)以來,很多國家和地區(qū),如新加坡、韓國、日本、加拿大、歐盟都在效仿,甚至一些非洲國家也不甘落后。但在國內(nèi),雖然如北京、上海等地區(qū)開放數(shù)據(jù)的說法已提了很多年,國信辦還下發(fā)34號文倡導(dǎo)此事,但是各地方開放數(shù)據(jù)的第一步依然沒有邁出去。[page]

  三、上海“大數(shù)據(jù)”發(fā)展的現(xiàn)狀及主要問題

  (一)上海市政府信息資源的現(xiàn)狀

  1、城市基礎(chǔ)數(shù)據(jù)庫基本建成

  基礎(chǔ)數(shù)據(jù)庫是本市政務(wù)信息資源開發(fā)利用的基礎(chǔ)。“十一五”期間,上海市堅持“一數(shù)一源,一源多用”,以跨部門應(yīng)用系統(tǒng)建設(shè)帶動政務(wù)信息資源的開發(fā)利用,重點圍繞人口、法人及空間地理信息,完善了集中與分布相結(jié)合的基礎(chǔ)數(shù)據(jù)庫建設(shè)。

  2、制度建設(shè)不斷完善

  上海政府信息公開工作起步早,走在全國前列,經(jīng)過多年的探索和實踐,目前已初步建立了較為完整的信息公開制度體系。早在2004年,上海就制定出臺了《上海市政府信息公開規(guī)定》(以下簡稱《信息公開規(guī)定》),并確定了“公開為原則,不公開為例外”的總體要求。2008年,在國務(wù)院《信息公開條例》的基礎(chǔ)上,上海進一步修改完善了《信息公開規(guī)定》。2009年,下發(fā)了《關(guān)于進一步加強政府信息公開工作的若干意見》(以下簡稱《若干意見》),提出了6大類30條109項工作任務(wù),并逐一明確了責(zé)任部門和工作要求。此外,為配合《信息公開規(guī)定》和《若干意見》的實施,上海率先于全國出臺了一系列配套的規(guī)章制度,如主動公開政府信息送交制度、信息公開年度報告制度等,為加大政府信息公開力度提供了較完善的制度保障。

  3、信息目錄庫建設(shè)有序推進

  在公文類信息方面(非結(jié)構(gòu)化數(shù)據(jù)),建立了公文類政府信息目錄備案管理系統(tǒng),形成全市公文類信息目錄庫,為全面掌握全市公文類信息底數(shù)、加強公開屬性審核管理、提供全市公文類信息“一站式”檢索服務(wù)奠定了基礎(chǔ)。在非公文類政務(wù)信息資源方面(結(jié)構(gòu)化數(shù)據(jù)),在資源梳理、資源分類、資源編目等方面進行了試點實踐,并形成了本市政務(wù)信息資源編目和注冊的試點規(guī)范和標(biāo)準。同時,組織開發(fā)了上海市政務(wù)信息資源目錄服務(wù)平臺原型,各試點單位向目錄服務(wù)平臺開展目錄備案工作。

  4、推進機制不斷健全

  為加強政府信息公開工作的組織領(lǐng)導(dǎo),上海不斷完善信息推進機制建設(shè)。2004年建立了政府信息公開聯(lián)席會議制度;2008年5月,按條例要求,政府信息公開主管部門作了調(diào)整,市政府辦公廳、市法制辦、市經(jīng)信委、市監(jiān)察局、市政府新聞辦、市國家保密局等聯(lián)席會議成員單位合力做好信息公開各項推進工作;2009年,市政府辦公廳新“三定”方案增加了主管指導(dǎo)、推進、協(xié)調(diào)、監(jiān)督政府信息公開工作的職責(zé);2010年,市政府辦公廳政府信息公開處成立。同時,各區(qū)縣、各部門也相應(yīng)建立了信息公開聯(lián)席會議或領(lǐng)導(dǎo)小組,明確了分管領(lǐng)導(dǎo),設(shè)立了工作機構(gòu)。此外,上海還建立了一系列配套工作機制,如建立健全依申請公開咨詢會商機制、保密審查機制、信息發(fā)布協(xié)調(diào)機制、監(jiān)督保障機制等,以有效推進政府信息公開工作,及時處理工作中出現(xiàn)的熱點難點問題。

  5、公開內(nèi)容不斷豐富,公開渠道不斷拓寬

  從內(nèi)容看,上海政府信息公開的理念重在“保證公眾對政府行政信息的知情權(quán),以促進政府依法行政”,因此,《上海市人民政府關(guān)于進一步加強政府信息公開工作的若干意見》中提出,政府信息公開的內(nèi)容主要側(cè)重在“資金、項目、政策、服務(wù)”等領(lǐng)域。從渠道看,為滿足公眾多層面的信息需求,上海不斷探索政府信息公開渠道,目前已形成政府網(wǎng)站為主,新聞發(fā)布會、政府公報、國家檔案館、公共圖書館、政府信息公開查閱點、社區(qū)信息苑和農(nóng)村基層信息服務(wù)站等為補充的覆蓋城鄉(xiāng)、多層次的公開渠道,有力地加大了政府信息公開力度,在一定程度上為確保公眾知情權(quán)提供了保障。

  (二)上海市大數(shù)據(jù)應(yīng)用存在的主要問題

  現(xiàn)狀來看,上海市政府?dāng)?shù)據(jù)資源管理存在著對政府信息資源蘊藏的巨大價值認識不夠、政府信息資源的家底不清、部門問數(shù)據(jù)信息共享不充分,統(tǒng)計制度改革滯后造成一些重要的經(jīng)濟社會統(tǒng)計數(shù)據(jù)公布缺少穩(wěn)定性和連續(xù)性、以及部分重要信息匯聚的平臺還未建成等問題。具體表現(xiàn)為:

  1、政府信息資源公開有待加強

  上海雖然缺少天然的土地、礦藏和能源等傳統(tǒng)資源,但在建設(shè)“四個中心”和“世界城市”的過程中累積了極為豐富、獨具優(yōu)勢的信息資源,這塊資源為上海降低商務(wù)成本提供了一個可靠的抓手,因為它可以同時提供給眾多信息服務(wù)企業(yè)加工增值。當(dāng)前,上海政府信息公開工作主要按照中央要求,解決公眾的“知情權(quán)”,以更好地依法行政、接受群眾監(jiān)督。但是隨著上海經(jīng)濟領(lǐng)先全國發(fā)展,解決企業(yè)、社會組織對政府信息資源的“使用權(quán)”問題,促使政府、企業(yè)及社會對數(shù)據(jù)資源的共同分析應(yīng)用已迫在眉睫。

  2、非公文類政務(wù)信息資源編目工作有待推進

  全面梳理政府部門的數(shù)據(jù)和信息資源,建立信息資源目錄體系,是政府部門間信息共享及向社會開放的一項基礎(chǔ)性工作。目前,上海市統(tǒng)一的公文類信息目錄庫已基本建成,但非公文類政務(wù)信息資源(結(jié)構(gòu)化數(shù)據(jù)),盡管已在資源梳理、資源分類、資源編目等方面形成了上海市政務(wù)信息資源編目和注冊的試點規(guī)范和標(biāo)準,但從全市范圍看,由于涉及的部門眾多,任務(wù)繁重,各部門對編制政務(wù)資源目錄體系重要性的認識不一,且受人力、物力、財力所限,部門對非行政信息進行深加工的積極性和動力不足,一定程度上延緩了市政府部門信息共享及對社會開放的進程。

  3、城市基礎(chǔ)信息尚未在政府部門之間實現(xiàn)有效共享

  經(jīng)過多年努力,上海市已經(jīng)基本建立起了包括人口、法人、空間地理、交通、房地產(chǎn)等多個領(lǐng)域在內(nèi)的城市基礎(chǔ)數(shù)據(jù)庫,在一定程度上解決了城市運行所需的各類基礎(chǔ)信息的匯聚問題。但從應(yīng)用情況看,除了少數(shù)數(shù)據(jù)庫(如人口庫、法人庫等)在業(yè)務(wù)相關(guān)的委辦局之間實現(xiàn)了部分數(shù)據(jù)交換和信息共享外,大部分基礎(chǔ)數(shù)據(jù)庫在政府部門問的共享并不充分,更不用說對社會開放了。這種數(shù)據(jù)和信息沒有在政府部門間充分共享的狀況,不僅不利于提高政府部門分析決策能力和工作效率,也制約了政府部門的數(shù)據(jù)和信息向社會開放。

  4、部分重點領(lǐng)域統(tǒng)一的數(shù)據(jù)匯聚平臺還未形成

  上海已形成的統(tǒng)一匯聚平臺的數(shù)據(jù)庫,大多集中于城市運行基礎(chǔ)領(lǐng)域(如法人庫、人口庫、空間地理信息交換平臺等),而對于經(jīng)濟社會某些重點發(fā)展領(lǐng)域的行業(yè)性統(tǒng)一數(shù)據(jù)平臺仍較缺乏。經(jīng)濟領(lǐng)域來看,金融、貿(mào)易中心建設(shè)發(fā)展的相關(guān)數(shù)據(jù)仍分散于不同的政府部門,集中式的數(shù)據(jù)平臺仍未建立。社會領(lǐng)域,包括氣象、城市管理等在內(nèi)的數(shù)據(jù)信息,受關(guān)注的程度日益提升,集中統(tǒng)一的信息平臺亟待建立。[page]

  四、對策建議

  目前情況看,上海各條線系統(tǒng)相對較多,協(xié)同共享項目相對較少,數(shù)據(jù)共享和交換主要障礙是信息交換不對稱等問題。在今后的信息化建設(shè)中可能更多的工作將是信息化協(xié)同共享項目。從審批上控制新增信息化建設(shè),使得新增信息化項目在審批的制約下走向集約化。在政府管理層面逐步實現(xiàn)購買服務(wù)的形式推進信息化建設(shè)。在初始階段對在信息化服務(wù)提供企業(yè)進行扶持,在成長之后放歸市場進行競爭。

  (一)建立數(shù)據(jù)管理機構(gòu)統(tǒng)籌數(shù)據(jù)治理工作

  1、組織架構(gòu)

  鑒于政府大數(shù)據(jù)管理涉及到整個政府部門,建議在市級層面建立更高層面、統(tǒng)籌度更高的數(shù)據(jù)協(xié)調(diào)管理機構(gòu),由該管理機構(gòu)負責(zé)統(tǒng)一數(shù)據(jù)規(guī)范標(biāo)準,明晰數(shù)據(jù)分布情況,把分布在各部門之間的數(shù)據(jù)統(tǒng)籌管理服務(wù),提升上海在大數(shù)據(jù)背景下政府對數(shù)據(jù)的管理能力。

  全市層面的數(shù)據(jù)中心可分屬三個數(shù)據(jù)中心群:SDC-1市級各委辦局信息中心、SDC-2市場各行業(yè)、WDC世界數(shù)據(jù)中心(見圖2)。SDC-1下包含各區(qū)級委辦局信息中心,SDC-2下包含政策形勢、上海產(chǎn)業(yè)、上海企業(yè)、上海經(jīng)驗、上海人物、上海招商、上海競爭力等目錄,涉及宏觀綜合數(shù)據(jù)、經(jīng)濟中心數(shù)據(jù)、金融中心數(shù)據(jù)、貿(mào)易中心數(shù)據(jù)、航運中心數(shù)據(jù)、經(jīng)濟轉(zhuǎn)型數(shù)據(jù)、能源環(huán)保數(shù)據(jù)等不同指標(biāo)數(shù)據(jù)。與世界數(shù)據(jù)中心(WDC)合作打開國際性數(shù)據(jù)合作方向。主要包括:WDC-A美國、WDC-B前蘇聯(lián)、WDC-C歐洲和日本、WDC-D中國。目前,中國的數(shù)據(jù)中心主要成立九個分中心(見表2)。數(shù)據(jù)中心能更好地打開政府各部門間、政府與市民間的邊界,提高各機構(gòu)協(xié)同辦公效率和為民辦事效率,同時提升政府社會治理能力和公共服務(wù)能力。在城市管理和服務(wù)的過程中,使已有數(shù)據(jù)透明化,使數(shù)據(jù)的提供方和數(shù)據(jù)的需求方有效對接找到有效途徑。

  2、管理職能

  市級層面數(shù)據(jù)中心管理構(gòu)架(如圖3),主要分為日常運行管理及應(yīng)急聯(lián)動管理兩類,制定統(tǒng)一數(shù)據(jù)信息安全管理標(biāo)準、信息數(shù)據(jù)標(biāo)準化格式。同時明確數(shù)據(jù)使用、數(shù)據(jù)安全、數(shù)據(jù)發(fā)布、相關(guān)者的權(quán)力、法律保護、監(jiān)管機構(gòu)、對數(shù)據(jù)的特殊使用、特殊使用的種類、處罰規(guī)定、過渡和最終規(guī)定等。

  數(shù)據(jù)中心通過對三個數(shù)據(jù)中心群的統(tǒng)籌管理和系統(tǒng)化運行,承擔(dān)同化、編目、分類檢索、發(fā)布、制定數(shù)據(jù)公開查詢辦法。數(shù)據(jù)同化是將碎片數(shù)據(jù)系統(tǒng)化、統(tǒng)一制定數(shù)據(jù)格式標(biāo)準化(一級數(shù)據(jù)源)。數(shù)據(jù)編目是按照一級、二級數(shù)據(jù)層次采用自然歸類法進行系統(tǒng)編目,使數(shù)據(jù)層次清晰,口徑一致,統(tǒng)籌管理。數(shù)據(jù)分類檢索是對各數(shù)據(jù)中心群提供的數(shù)據(jù),根據(jù)編目建立數(shù)據(jù)查詢系統(tǒng),并引導(dǎo)需求方更快地搜索到相應(yīng)機構(gòu)部門的數(shù)據(jù),數(shù)據(jù)統(tǒng)一對外發(fā)布管理,理清數(shù)據(jù)分布結(jié)構(gòu)、公開數(shù)據(jù)獲得途徑。在大數(shù)據(jù)背景下,開放數(shù)據(jù)的意義,不僅僅是滿足公民的知情權(quán),更在于讓大數(shù)據(jù)時代最重要的生產(chǎn)資料數(shù)據(jù)自由地流動起來,以催生創(chuàng)新,推動知識經(jīng)濟和網(wǎng)絡(luò)經(jīng)濟的發(fā)展,更好地促進上海的創(chuàng)新驅(qū)動、轉(zhuǎn)型發(fā)展。

  (二)搭建統(tǒng)一、共享的基礎(chǔ)數(shù)據(jù)平臺

  公共數(shù)據(jù)應(yīng)該被作為公共資源向公眾開放,建議在目前基礎(chǔ)信息數(shù)據(jù)資源基礎(chǔ)上,整合建立更加統(tǒng)一、共享度更高的基礎(chǔ)數(shù)據(jù)平臺,形成基礎(chǔ)庫、專業(yè)庫、應(yīng)用庫,有效提升政府服務(wù)效率和社會管理水平。

  基礎(chǔ)庫,建立集人口庫、法人庫和城市地理空間信息系統(tǒng)三大基礎(chǔ)庫于一體的數(shù)據(jù)共享平臺。有效掌握居民、企業(yè)、城市公共基礎(chǔ)設(shè)施等大量有效實時數(shù)據(jù),推進政府非結(jié)構(gòu)化數(shù)據(jù)的挖掘與運用。打破傳統(tǒng)低效方式,即采用OCR等傳統(tǒng)文字識別軟件掃描進入系統(tǒng),缺點是往往對文件格式有特殊的要求,無法應(yīng)對非結(jié)構(gòu)化數(shù)據(jù)多樣性的問題。通過構(gòu)建智能獲取、有效管理、快速流轉(zhuǎn)、及時搜索這四方面功能的整合性技術(shù)平臺,包括輸出管理解決方案,流程管理和內(nèi)容管理解決方案。將非結(jié)構(gòu)化信息快速提取、轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù),并和核心系統(tǒng)有效連接起來,大大降低了管理和使用非結(jié)構(gòu)化信息的難度。處理非結(jié)構(gòu)化數(shù)據(jù),有效管理這類數(shù)據(jù),控制這類數(shù)據(jù)的增長,在實際使用中使這類數(shù)據(jù)成為信息結(jié)構(gòu)的一部分,以便于決策及查找信息。有利于降低政府信息使用成本,提高行政效率。

  專業(yè)庫,用大數(shù)據(jù)打造更細致貼心的政府公共服務(wù)。集醫(yī)療、教育、交通等數(shù)據(jù)庫于一體,提高政府便民服務(wù)的主動性、公開性、透明性。比如,公共醫(yī)療服務(wù),引導(dǎo)醫(yī)院通過采取云存儲架構(gòu),提高診斷效率,緩解醫(yī)療資源緊張,降低整體數(shù)據(jù)管理成本,把醫(yī)療數(shù)據(jù)轉(zhuǎn)化為生活數(shù)據(jù),將日常生活個人身體信息進行收集分析。使醫(yī)療信息進一步融入個人生活。對于“信息高速公路”的擁堵提示,防止網(wǎng)絡(luò)供應(yīng)商的壟斷,提高其透明度,確保居民享受公平公正市場環(huán)境下的自由自主選擇。

  應(yīng)用庫,提供更符合社會應(yīng)用需求的大數(shù)據(jù)服務(wù)庫。大數(shù)據(jù)作為一種重要的戰(zhàn)略資產(chǎn),已經(jīng)不同程度地滲透到每個行業(yè)領(lǐng)域和部門,其深度應(yīng)用不僅有助于企業(yè)經(jīng)營活動,還有利于推動國民經(jīng)濟發(fā)展。在上海努力實現(xiàn)“創(chuàng)新驅(qū)動、轉(zhuǎn)型發(fā)展”發(fā)展方針的指引下,提高大數(shù)據(jù)成果在各相關(guān)部門的分享程度,提高整個管理鏈條和產(chǎn)業(yè)鏈條的投入回報率,更好地培育出一批商業(yè)模式、產(chǎn)品和服務(wù)創(chuàng)新的新興產(chǎn)業(yè),為創(chuàng)新注入新動力,推動轉(zhuǎn)型發(fā)展。

  (三)加強信息資源開放力度,鼓勵市場化應(yīng)用

  借鑒發(fā)達國家經(jīng)驗,加強原始數(shù)據(jù)的歸集與處理,創(chuàng)新體制機制,進一步通過市場化手段,促進政府信息資源的開發(fā)利用水平??紤]到政府信息資源向社會開放的現(xiàn)實基礎(chǔ),以及工作的復(fù)雜性與艱巨性,實際操作時,統(tǒng)籌考慮不同類別信息服務(wù)業(yè)企業(yè)、社會組織及個人需求的緊迫程度和政府信息資源開放對經(jīng)濟社會發(fā)展的作用,在特定領(lǐng)域、聚焦重點,針對數(shù)據(jù)開放呼聲較高的政府部門開展試點開放,鼓勵形成具有典型性和代表性的市場化數(shù)據(jù)開發(fā)利用模式與體制機制。

  (四)創(chuàng)新管理途徑。保障公眾數(shù)據(jù)安全

  大數(shù)據(jù)時代,信息安全已經(jīng)成為一個核心問題,對信息進行隱私保護是政府對數(shù)據(jù)管理的職責(zé)之一,需要圍繞數(shù)據(jù)的歸集與使用,進行規(guī)范化、制度化設(shè)計。首先需要對“數(shù)據(jù)”進行明確定義,從內(nèi)容上可以分一般數(shù)據(jù)和敏感數(shù)據(jù),一般數(shù)據(jù)包括姓名、年齡、住址等,敏感數(shù)據(jù)包括宗教、信仰、健康狀況等等。上述所有數(shù)據(jù)都因受數(shù)據(jù)法的保護。同時規(guī)定調(diào)查、采集、儲存、留存、整理、比較、修訂、鏈接、復(fù)制、征詢、發(fā)放、轉(zhuǎn)讓、封鎖、刪除、銷毀以及其他各種形式的處理,均屬于“數(shù)據(jù)處理”。如果收集的數(shù)據(jù)會進入政府部門或企業(yè)機構(gòu)的自動處理程序,則需要向數(shù)據(jù)監(jiān)管機構(gòu)報告。

  同時數(shù)據(jù)監(jiān)管機構(gòu)要規(guī)定服務(wù)商的義務(wù):如禁止擅自傳送采集的數(shù)據(jù);必須采取必要的數(shù)據(jù)安全措施;只能雇用向公司承諾為數(shù)據(jù)保密或依法宣誓保密的人;要與委托人簽署包括知情權(quán)、糾正權(quán)、刪除權(quán)、轉(zhuǎn)送權(quán)等內(nèi)容的委托合同;每筆業(yè)務(wù)完成后,除非委托方委托留存,否則要銷毀;要向委托人提供相關(guān)數(shù)據(jù),以便其向監(jiān)管機構(gòu)報告。通過嚴格的數(shù)據(jù)保護措施,一方面可以提升民眾的數(shù)據(jù)保護意識,另一方面也給了消費者一個相對干凈的使用環(huán)境。

  管理上的兩個創(chuàng)新途徑:創(chuàng)新途徑一,“差別隱私”,將數(shù)據(jù)模糊處理,促使對大數(shù)據(jù)庫的查詢不能顯示精確的結(jié)果,只有相近的結(jié)果。個人隱私保護從個人許可到數(shù)據(jù)使用者承擔(dān)責(zé)任的轉(zhuǎn)變是一個本質(zhì)上的重大變革。大數(shù)據(jù)時代,需要設(shè)立新型的隱私保護模式,該模式應(yīng)更著重于數(shù)據(jù)使用者為其行為承擔(dān)責(zé)任。監(jiān)管機制可以決定不同種類的個人數(shù)據(jù)必須刪除的時間,再利用的時間框架則取決于數(shù)據(jù)內(nèi)在風(fēng)險和社會價值觀的不同。創(chuàng)新途徑二,“大數(shù)據(jù)審計員”,在使用預(yù)測分析時考慮個人動因以及催生大數(shù)據(jù)審計員。評估數(shù)據(jù)源的挑選,分析和預(yù)測工具的選取,包括運算法則和模型,以及計算結(jié)果的解讀是否正確合理。一旦出現(xiàn)爭議,有權(quán)考察與分析結(jié)果相關(guān)的運算法則、統(tǒng)計方法以及數(shù)據(jù)集。采取這一靈活的自我監(jiān)管方式的專業(yè)人員保護大眾利益,與政府共同商議公共領(lǐng)域大數(shù)據(jù)的最佳使用辦法。

  (五)提升大數(shù)據(jù)輔助科學(xué)決策水平

  除提供服務(wù)外,還要進一步發(fā)揮大數(shù)據(jù)在提高政府部門決策的科學(xué)化水平方面的突出作用。大數(shù)據(jù)是信息化發(fā)展到一定階段的必然產(chǎn)物。其本義是對數(shù)據(jù)的開發(fā)利用,以支撐科學(xué)決策,追求以最小的資源消耗,獲得最大的價值。安全、效率、成本是其科學(xué)化決策的重要依據(jù)。在掌握實時數(shù)據(jù)的運行管理系統(tǒng)下,能更清楚地了解群眾需求、人口變動情況,從而更準確地進行規(guī)劃、布局,提升政府公共服務(wù)。上海在努力建設(shè)智慧城市中已經(jīng)應(yīng)用了大數(shù)據(jù)的理念。通過利用客觀存在的海量數(shù)據(jù),能夠有效降低調(diào)查成本。

  為了更好地促進經(jīng)濟發(fā)展,應(yīng)鼓勵促進政府部門、社會組織及研究機構(gòu),加大開發(fā)、應(yīng)用大數(shù)據(jù)輔助決策的力度,在輔助決策的流程、方式、展示與工作機制等方面加快創(chuàng)新,使決策部門可以更敏銳地把握經(jīng)濟社會發(fā)展走向,制定并實施科學(xué)的公共政策,從而提高數(shù)據(jù)及時性、準確性。

責(zé)任編輯:admin