精品主題,實戰(zhàn)科普,最新行業(yè)熱點話題,隨時掌握云上咨訊。
NoSQL的出現(xiàn)
關系數(shù)據(jù)庫管理系統(tǒng)(RDBMS) 是在E.F.Codd博士發(fā)表的論文《大規(guī)模共享數(shù)據(jù)銀行的關系型模型》(Communications of the ACM雜志1970年6月刊)基礎上設計出來的。它通過數(shù)據(jù)、關系和對數(shù)據(jù)的約束三者組成的數(shù)據(jù)模型來存放和管理數(shù)據(jù)。目前許多企業(yè)的在線交易處理系統(tǒng)、內部財務系統(tǒng)、客戶管理系統(tǒng)等大多采用了RDBMS。太字節(jié)級關系型數(shù)據(jù)庫在大型企業(yè)集團中已是司空見慣。常用的數(shù)據(jù)庫軟件有Oracle、SQL Server等。
非關系型數(shù)據(jù)庫
非關系型數(shù)據(jù)庫(NoSQL = Not Only SQL)意即“不僅僅是SQL”,是一項全新的數(shù)據(jù)庫革命性運動,早期就有人提出,發(fā)展至2009年趨勢越發(fā)高漲。NoSQL的擁護者們提倡運用非關系型的數(shù)據(jù)存儲,相對于鋪天蓋地的關系型數(shù)據(jù)庫運用,這一概念無疑是一種全新的思維的注入。簡單地講,NOSQL數(shù)據(jù)庫可以按照它們的數(shù)據(jù)模型分成4類:
鍵-值存儲庫(Key-Value-stores)
BigTable實現(xiàn)(BigTable-implementations)
文檔庫(Document-stores)
圖形數(shù)據(jù)庫(Graph Database)
圖像數(shù)據(jù)庫(Graph Database)
圖形數(shù)據(jù)庫是一種非關系型數(shù)據(jù)庫,它應用圖形理論存儲實體之間的關系信息。最常見的一個例子,就是社會網(wǎng)絡中人與人之間的關系。關系型數(shù)據(jù)庫用于存儲“關系型”數(shù)據(jù)的效果并不好,其查詢復雜、緩慢、超出預期,而圖形數(shù)據(jù)庫的獨特設計恰恰彌補了這個缺陷。
網(wǎng)絡(如一個電網(wǎng)、一個企業(yè)供應鏈或者整個生態(tài)系統(tǒng))通常由大量共享多重關系弧的節(jié)點構成。圖像數(shù)據(jù)庫發(fā)揮它這強大的能力來表示網(wǎng)絡的組成和鏈接。圖像數(shù)據(jù)庫在支持開發(fā)、知識管理甚至預測方面已逐步成熟起來。
在互聯(lián)網(wǎng)世界,各種不同類型的網(wǎng)絡越來越卓越,正如具備上網(wǎng)能力已經(jīng)成為了現(xiàn)代社會必須。然而,圖像數(shù)據(jù)庫(像RDBMS)只是盒子里的另一個工具,可以利用好或者不好。因此,考慮新技術的大規(guī)模安全影響并不過早,至少應該從最高的水平開始。
圖像探索(Graph Discovery)
因為處理屬性和鏈接,圖像數(shù)據(jù)庫包括了海量仍隱藏著的信息。圖形數(shù)據(jù)庫最初并沒有被視為一種有益于探索的工具,它需要一個特別設計的超級計算機家族才能實現(xiàn)圖像發(fā)掘的全部威力。盡管它可以直接展示圖像,并數(shù)量增加到數(shù)十億,只有最為強大的機器才有能力在計算限制內快速遍歷多路徑。
像是緊密排列的蛋白質網(wǎng)絡一樣,圖像也如此密集。在這里,圖片細節(jié)查詢能夠壓垮計算能力較弱的系統(tǒng)。而超級計算機則克服了時間與能力的限制。有些這樣的設備運用了Hadoop分析工具。
為探索而創(chuàng)造的高端圖形超級計算機確實為業(yè)界帶來了巨大的希望。例如,它可以支持建立復雜的海洋與構成氣候條件的大氣之間的關系。當氣候發(fā)生巨大變化時,會進一步發(fā)現(xiàn)非線性因素與結果變得越來越重要。同樣,一臺圖形超級計算機能夠加速發(fā)現(xiàn)西非的埃博拉傳播情況,這會有助于防范疾病的傳播。
圖1:基本圖形推理。這個簡單的node-arc-node三位一體,常被成為三元組,是被用來詳細描述構建描述各種各樣復雜網(wǎng)絡的基本工具。
圖2:用于探索的圖形數(shù)據(jù)庫。這樣的探索可以支持構建海洋與大氣的關系,也可以用來加速發(fā)現(xiàn)埃博拉病毒在西非的傳播。
探索:隱私與安全
圖像探索被認為是一種解決復雜且相互關聯(lián)問題的良好工具,然而卻存在大量對于隱私和安全問題的擔憂。舉個例子,如果圖像超級計算機未來成為我們社會或金融交易的監(jiān)測工具,那么有針對性的廣告與其他的蓄意利用將會侵犯個人隱私,個人的身份很可能被進一步曝光。
期望通過立法來阻止存在的全部威脅是很容易被人理解的,但是社會要付出怎樣的代價呢?正如那些急于通過各種手段將銷售產(chǎn)品的人將會通過大數(shù)據(jù)而獲利,卻忽略了一旦他們受到攻擊要付出的個人代價又是什么呢?現(xiàn)實就是在這樣一個高端開發(fā)僅僅是目前被建立的一個趨勢的投影。
在這種社會經(jīng)濟研究學設計中,尤其是廣泛涉及社會和商業(yè)事物關系的領域,安全要求應該是更高的。近來發(fā)生黑客針對信用卡發(fā)行方或者電影公司等企業(yè)的攻擊事件造成了大規(guī)模的破壞,然而任何蓄謀的犯罪攻擊、大數(shù)據(jù)泄露都能造成更具毀滅性的影響。當由無數(shù)傳感器、執(zhí)行器和移動設備構成的“互聯(lián)網(wǎng)+所有”(Internet of Anything,簡稱IoA)會進一步增加安全隱患,這一切似乎都為隱私泄露提供了極大的方便。
圖像知識管理:隱私與安全
安全——特別是定制建筑設計——一定要將這一點考慮在內。如果Web共享被認為是一個生成大量典型三元組系統(tǒng)的合理方式,設計一個RDF(Resource Description Framework,一種用于描述Web資源的標記語言)數(shù)據(jù)儲存的傳送門將變得異常重要。同樣,用戶身份驗證和檢定都很重要。
盡管知識管理并不是探索運用的廣泛,但是由于關聯(lián)的數(shù)據(jù)庫的特殊身份屬性仍必須受到嚴格保護。前端規(guī)定必須同時保證圖像數(shù)據(jù)庫的防入侵及個人數(shù)據(jù)隱私的的安全。若數(shù)據(jù)庫不能提供足夠保護可能會被取消資格,因為備選圖像數(shù)據(jù)庫產(chǎn)品的接口仍易受攻擊。
圖像預測:隱私與安全
例如天氣或者經(jīng)濟趨勢,在涉及一個演變過程的動態(tài)環(huán)境中,預測未來行為的能力變得非??赡?。
圖像有助于提高預測的準確性,讓我們可以有資格同時量化一個系統(tǒng)代表的網(wǎng)絡。能夠聯(lián)系節(jié)點與?。ǖ刂?、時間、重量或者數(shù)量)的能力讓我們基于相似的屬性從而定性地評價圖像。更重要的是,量化技術讓我們在幾乎所有的圖像中評估內在指標。這也適用于許多領域,像是神經(jīng)科學。
當前維護網(wǎng)絡安全的最佳實踐通常建議在研究其安全性和隱私性的漏洞時對系統(tǒng)進行快照,以獲得證明系統(tǒng)“安全性”的證明。這種實踐的繆誤在于大多數(shù)系統(tǒng)都會受到不斷變化的環(huán)境的影響,這些影響將改變系統(tǒng)的活動。所以,這只適用于證明快照拍攝那一瞬的安全。
鑒于數(shù)據(jù)庫的日趨復雜性,為我們監(jiān)控實時動態(tài)變化提供了有利條件。通過檢測數(shù)據(jù)流異常節(jié)點或關系模式改變了我們使用定量方法,我們能夠檢測以及調查盡早地發(fā)現(xiàn)入侵和其他安全漏洞,迅速對任何監(jiān)測到的犯罪作出反映。
總結
從預測的角度來看,數(shù)據(jù)完整性必須搶占先機。因此,由于預測的風險很高,數(shù)據(jù)來源變得至關重要。預測的結果將盡可能的與預測工具暗示的數(shù)據(jù)一致。錯誤數(shù)據(jù)會嚴重影響結果,安全也將變?yōu)榭罩袠情w。
良好的安全實踐將帶來最高級別的道德準則。盡管圖像數(shù)據(jù)庫蘊含著世界各種網(wǎng)絡的巨大希望,它同時帶來了潛在的安全風險還未被完全了解和鑒別。與追求流行時尚不同,IT專業(yè)人士必須認真評估預期操作環(huán)境與執(zhí)行必要交易時的潛在風險,以此達到安全和數(shù)據(jù)保護的基準線。如果安全與隱私問題圍繞新的技術(例如日益流行的圖像數(shù)據(jù)庫)大量產(chǎn)生,那么在后期會成為一種新燒錢途徑。因為不安全,所以很昂貴。