信息孤島項目解決方案_第1頁
信息孤島項目解決方案_第2頁
信息孤島項目解決方案_第3頁
免費預覽已結束,剩余5頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、信息孤島的解決方案樊夢真269779216qq.容提要:產生信息孤島的根本原因在于當前的軟件設計模式存在問題,人們是先設計 出數據結構各不相同的信息系統(tǒng),然后再通過轉化數據結構而實現互聯(lián)互通,猶如火車通 過換車輪而實現互通?;疖囍钥梢曰ネㄊ且驗榛疖囀且詷藴驶匿撥墳榛A而設計。 本文的獨立數據庫技術借鑒 “以標準的鋼軌為基礎而設計火車”的“標準化模式”,通過“數據結構的標準化”及“數據的標準化”方式而從根本上避免信息孤島問題的產生。1.1火車的互聯(lián)互通及機械零部件的互換性對信息系統(tǒng)設計的啟示:標準化火車之所以能夠在全國各地互聯(lián)互通,是因為全國的鋼軌都是標準的,我國的各種火車都是以標準的鋼軌

2、為基礎而設計的。機械零部件的互換性是機械中的一個非常重要特性。機械工程師在設計機械設備時都要盡量采用標準的零部件?;疖嚨幕ヂ?lián)互通及機械零部件 的互換性都是以“標準化”為基礎。然而,對IT行業(yè)的軟件工程師而言,他們幾乎沒有標準的概念。軟件設計人員在設計 軟件系統(tǒng)時幾乎不考慮任何標準,各種信息系統(tǒng)中的數據完全由軟件設計人員自己任意定 義,其結果就是各種信息系統(tǒng)中的數據全是不標準、不規(guī)的異構數據。如果全國各地的火車鋼軌都是不標準的,那么火車要在全國各地行駛,就必須不斷地“換車輪”,火車換一次車輪需要80分鐘。當前的信息系統(tǒng)通過轉換數據結構的方法實現互聯(lián)互通就猶如火車“換車輪”。鐵路 交通以“鋼軌的標

3、準化”而從根本上避免了“鐵路交通孤島”問題的產生。如果各種信息 系統(tǒng)的數據及數據結構也采用標準化的數據和數據結構,那么,也可以從根本上實現各種 信息系統(tǒng)之間的互聯(lián)互通!然而利用關系數據庫技術,不可能使數據結構標準化、統(tǒng)一化。 獨立數據庫(源于發(fā)明專利技術“醫(yī)學信息的結構化存貯方法”)中的“事物信息表”可存貯各種各樣的結構化數據,可以成為標準的數據結構表。1.2以“數據結構的標準化”+ “數據的標準化”而避免信息孤島產生從關系數據庫的角度而言,產生信息孤島的根本原因有兩個,一是各個信息系統(tǒng)中的 數據結構多種多樣、各不相同,二是各個信息系統(tǒng)中的數據不標準、不規(guī),因此,當一個 信息系統(tǒng)中的數據發(fā)送到

4、另一個信息系統(tǒng)時,數據的接收方不能存貯、識別處理接收到的 數據。當前解決信息孤島、實現數據的共享交換的方法是:“轉換數據結構,把數據轉換為數據的接收方可以存貯、識別處理的形式”,例如BI、EAI、EDI、ETL、ESB等都是通用轉換數據結構模式,猶如火車通過換車輪而實現互通。獨立數據庫是一種與關系數據庫理論完全不同的新型數據庫理論。對于關系數據庫而 言,數據庫中的數據的結構完全由設計人員自己決定,設計人員可以隨意地定義數據的結 構。然而利用獨立數據庫設計各種信息系統(tǒng)時,不允許設計人員隨意定義數據的結構,存 貯所有數據時都必須全部采用統(tǒng)一的、標準的、固定的數據結構,即必須全部采用“事物 信息表”

5、來存貯數據,這樣做的目的是為了讓數據可以象火車那樣在全國各地的標準的鋼 軌上互聯(lián)互通。下面的表1是獨立數據庫的“事物信息表”,“事物信息表”是通用表,可以只用一表而存貯各種關系數據庫中的任意結構的數據。表1只用一表就存貯了“ 1、動物檔案;2、銷售訂單表;3、銷售訂單明細表;4、患者基本情況;5、癥狀;6、員工身高體重;7、通 信錄;8醫(yī)療費用”的數據。若用關系數據庫理論中的方法來存貯這些數據就需要8結構各不相同的表。表1 :事物信息表只用一即可存貯各種各樣的結構化數據ID事物 代號事物特征事物特征值超長特征值單 位附件時 間652367事物分類動物管理系統(tǒng)662367事物分類企鵝672367

6、事物分類帝企鵝682367事物分類動物檔案692367動物編號3702367名字漢武帝812367動物簡介帝企鵝(學名: Aptenodytes forsteri):也稱皇帝企鵝,是企鵝家族中個體最大 的,一般身高在 90厘米以上,最大可達 到120厘米,體重可達 50千克。其形態(tài) 特征是脖子底下有一片橙黃色羽毛,向下逐漸變淡,耳朵后部最深。全身色澤協(xié)調。 頸部為淡黃色,耳朵的羽毛鮮黃橘色,腹 部乳白色,背部及鰭狀肢則是黑色,鳥喙 的下方是鮮桔色。帝企鵝在南極嚴寒的冬 季冰上繁殖后代,雌企鵝每次產1枚蛋,雄企鵝孵蛋。雄帝企鵝雙腿和腹部下方之 間有一塊布滿血管的紫色皮膚的育兒袋, 能讓蛋在環(huán)境溫

7、度低達零下40攝氏度的低溫中保持在舒適的36攝氏度。群居性動物。每當惡劣的氣候來臨,它們會擠在 一起防風御寒??梢詽撊胨?50至50(米,最深的潛水記錄甚至可達565米。主要以甲殼類動物為食,偶爾也捕食小魚和 烏賊。唯種在南極洲的冬季進行繁殖的企鵝。在南極以及周圍島嶼都有分布。712367購入日期2013/3/21722367身高1.2m732367體重20kg742367出生日期2011/4/2752367照片JPG762367籠舍編號98772367管理員三782367父1792367母2802367性別雄2128事物分類銷售訂單表3128訂單ID102484128客戶名稱山泰企業(yè)512

8、8銷售負責人軍6128訂購日期1996/7/47128到貨日期1996/8/18128發(fā)貨日期1996/7/169128運貨商聯(lián)邦貨運10128運貨費32.38元11128貨主名稱余小姐12128貨主地址光明北路12號149813事物分類產品銷售系統(tǒng)159813事物分類銷售訂單明細 表169813訂單ID10248179813產品名稱豬肉189813單位14元199813數量12Kg209813折扣0%3728事物分類住院病歷3828事物分類患者基本情況3928病案號199109-2-2154028身份證號XXXXXXXXXXX;f4128徐XX4228工作單位石化總廠4328職務機械工442

9、8地址上海市路4528年齡434628入院日期1991 /8/194728婚否已婚4828病史采取日期1991 /8/194928籍貫省市5028病史記錄日期1991 /8/195128民族漢5228病情述者患者本人5429事物分類住院病歷5529事物分類現病歷5629事物分類癥狀5729病案號199108-2-2155829身份證號XXXXXXXXXXX5929三豐6029癥狀寒戰(zhàn)6129癥狀腹瀉6229誘因洗澡時著涼6329癥狀開始時間1991 /8/1682280事物分類人事管理系統(tǒng)83280事物分類員工身高體重8428085280性別男86280年齡56歲87280體重72KG8828

10、0身高180CM189280身份證號410305XXXXX919753事物分類通信錄9297531三939753手機1366086XXXX949753單位軟件公司959753QQ6667567XXX9697536668QQ.COM979753地址大道2號989753照片JPG1001280事物分類住院病歷1011280事物分類醫(yī)療費用1021280身份證號XXXXXXXXXX1031280住院號XXXXXXXXXX1041280三1051280性別男1061280中藥費56元1071280西藥費72元1081280其它費用180元1091280事物分類住院病歷當前的信息孤島問題之所以非常嚴重,

11、就是因為利用關系數據庫理論在設計各種信息 系統(tǒng)時,各信息系統(tǒng)的數據結構(猶如鋼軌)各不相同。要使數據在各個信息系統(tǒng)之間互 聯(lián)互通,就必須轉換數據的結構(猶如火車在不同的鋼軌之間行駛時需要換車輪一樣)。當前的各種信息系統(tǒng)之間的數據的互聯(lián)互通全部都是采用這種“換車輪(轉換數據結構)”的方式來實現。隨著信息系統(tǒng)的數量的增多,數據量的增加,信息孤島問題已成為大數據時 代的一個非常嚴重的問題。因為信息系統(tǒng)越多、數據量越大,在實現互聯(lián)互通時“換車輪” 的次數也隨著增加。獨立數據庫所考慮的最重要的一個問題就是如何讓數據在各個信息系統(tǒng)之間互聯(lián)互 通,這就需要做到不但要自己可以存貯、識別處理自己的數據,還要使其

12、它信息系統(tǒng)也可 以存貯、識別處理接收到的數據。關系數據庫中的二維表非常符合人們的日常使用報表的習慣。然而這種結構形式的數 據在互聯(lián)互通時就會遇到嚴重的問題:由于數據的接收方的數據庫中沒有相應的表結構而 無法直接把數據存貯到數據的接收方的數據庫中。獨立數據庫之所以采用“事物信息表”存貯數據,其根本目的就是讓“事物信息表” 成為標準的數據結構(猶如標準的鋼軌),有了標準的數據結構,各種各樣的結構化數據就可以很容易地存貯到數據接收方的數據庫中,只要數據的接收方建立一事物信息表即可。由于利用本發(fā)明所設計的各種各樣的信息系統(tǒng)的數據的結構都是統(tǒng)一的、標準的、固 定的,全部都采用“事物信息表”(猶如標準的鋼

13、軌)存貯數據,因此使數據在這樣的信息系統(tǒng)之間的互聯(lián)互通非常容易。對于利用本發(fā)明所設計的信息系統(tǒng)而言,(在技術上)不存在信息孤島問題,因為數據可以象火車那樣在標準的鋼軌(事物信息表)上高速運行而不 必“換車輪”。有人會認為采用獨立數據庫設計信息系統(tǒng)會出現性能問題,以及多占用存貯空間的問 題。所有的事物都是有一利必有一弊,利用事物需要權衡利弊。當前的信息孤島為社會帶 來了巨大的損失,僅我國就擁有數百萬個以上的各種各樣的信息系統(tǒng),數萬億條結構各不 相同的數據,若用當前的轉換數據結構這種“換車輪”的方式實現數據的互聯(lián)互通、共享 交換,代價非常高,不可承受。計算機的速度及存貯容量以摩爾定律的速度飛速發(fā)展

14、,計 算速度及存貯容量已不是問題,獨立數據庫的確多占用了一倍左右的存貯空間,但其代價 非常低。利用本發(fā)明也會使表的記錄數增加10倍左右,專業(yè)人士認為會產生大表問題,針對此問題的解決方案很簡單,只要把大表分成若干個小表即可。獨立數據庫的突出優(yōu)勢是 面對數百萬以上的信息系統(tǒng)、數萬億條以上的數據的大數據環(huán)境,若這些信息系統(tǒng)中的數 據的結構都是相同的,數據都滿足數據的完整性,那么,實現數據的互聯(lián)互通、共享交換 以及數據挖掘非常容易,兩相權衡,利遠大于弊!1.3當前的軟件設計模式存在的問題產生信息孤島的根源在于當前的軟件設計模式有問題,當前的各種信息系統(tǒng)全部采用“換車輪模式”而實現互聯(lián)互通。如果全國各地

15、的火車的鋼軌都是不標準的,那么火車要 在全國行駛就必須不斷地更換車輪,更換一次車輪需要80分鐘的時間。我國的火車全部是以標準的鋼軌為基礎而設計各種各樣的火車,從而很容易地實現了鐵路交通的互聯(lián)互通。當前的BI、EAI、ETL、EDI、ESB等等都是采用“換車輪模式”而實現互聯(lián)互通,事實表明 這些方法的效果不能令人滿意。察的皿的稠的詵冏厶鐵踣孤島白骨補址的快臨掙忻空家的r 懂蟾材黑 的験杠十屮確廳f科年IM常宋的跌畤獨立數據庫采用全新的軟件設計模式“標準化模式”,“數據結構的標準化”及“數據的標準化”,在軟件的設計階段就從根本上避免了信息孤島問題的產生。1.4當前的信息孤島為什么是不治之癥人們從2

16、0年前就已注意到了信息孤島問題。為了解決信息孤島問題人們發(fā)明了BI、EAI、ETL、EDI、ESB等等,然而事實表明,這些解決信息孤島的方法都不能令人滿意。通過下面的分析、計算就會發(fā)現當前的信息孤島是不治之癥,因為設計人員在開發(fā)各 種信息系統(tǒng)時都沒有考慮數據的互聯(lián)互通問題,沒有通用的數據接口。如果需要與某個系 統(tǒng)實現數據的互聯(lián)互通,則需要開發(fā)專用的“點對點式的數據接口”。如果與N個系統(tǒng)實現數據的互聯(lián)互通,那么至少要開發(fā)N個數據接口。從理論上而言,利用現有技術可以通過轉換數據結構的方式而實現任意兩個信息系統(tǒng)之間的特定數據的互聯(lián)互通、開放共享,然 而由于全球的各種信息系統(tǒng)的數量超過千萬,全球所產生

17、的數據超過數萬億條,而且信息 系統(tǒng)及數據還在不斷地增加,面對如此海量的異構的、不標準的數據,“轉換數據結構”的方法所花的成本非常高、不可承受。因此,當前的信息孤島只能在局部進行緩解,而不能 整體上得到根治。利用現有技術設計信息系統(tǒng)時,每增加一個信息系統(tǒng),就增加了一個孤 島。兩個系統(tǒng)之間的互聯(lián)互通約需要1個人月的工程量;三個系統(tǒng)之間的互聯(lián)互通約需要(3-1)+( 3-2)=3個人月的工程量;四個系統(tǒng)之間的互聯(lián)互通約需要(4-1)+( 4-2)+(4-3 ) =6個人月的工程量;N個信息系統(tǒng)之間的互聯(lián)互通約需要(N-1 ) +(N-2)+(N-3)+3+2+1 )個人月的工程量。由計算公式可看出,

18、隨著信息系統(tǒng)的數量的增多,系統(tǒng)之間的 互聯(lián)互通的工程量十分巨大,無法承受。因此,當前的信息孤島是不治之癥。這與當前的 事實是相符的,自從關系數據庫理論產生的40多年來,世界各地的信息孤島問題都未能得到有效解決。用關系數據庫理論開發(fā)信息系統(tǒng),會產生無窮無盡的數據結構,也會產生無窮無盡的 不標準、不規(guī)的數據。僅我國就會有數千萬個以上的信息系統(tǒng),數萬億條以上的數據。對于用關系數據庫理論所設計的信息系統(tǒng)而言,隨著信息系統(tǒng)的數量的增加,信息孤 島問題也將會更加嚴重。也可以說關系數據庫理論是信息孤島的發(fā)源地,人們雖說想盡各 種方法來解決信息孤島讓數據互聯(lián)互通,然而信息孤島問題不降反增。信息孤島一旦產生,就

19、不可根治。因為當前的信息系統(tǒng)中的數據的數據結構是不標準的、數據是不標準的,數據與數據庫系統(tǒng)密不可分,數據與應用程序密不可分,數據只有在原系統(tǒng)中才是有意義的,一旦脫離了原來的系統(tǒng),就會變成無意義的數據。當前解決信 息孤島實現互聯(lián)互通的方法(例如BI、EAI、EDI、ETL ESB等等)都是通過轉換數據結構(換車輪模式)、開發(fā)點對點式的數據接口而實現,然而這種方法只能治標,不能治本。利 用現有技術無法開發(fā)出通用的數據接口。1.5信息孤島的根源在于關系數據庫理論是單機時代的產物,沒有互聯(lián)互通的容產生信息孤島的根本原因在于關系數據庫理論,因為關系數據理論單機時代的產物,創(chuàng)始人當時未考慮數據在各個信息系統(tǒng)之間的互聯(lián)互通問題!關系數據庫理論是在互聯(lián)網產生之前的單機時代創(chuàng)立的。 關系數據庫理論于1970年6月由IBM公司的埃德加考特(Edgar Frank Codd )創(chuàng)立。ORACLE誕生于1979年。互聯(lián)網誕生于 1973年至1984年之間。1984 年,美國國防部將 TCP/IP作為計算機網絡的標準。關系數據庫理論中沒有數據交換共享的概念,也沒有數據接口的概念。關系數據庫所關心的只是如何處理自己的數據(單機中的數據),而未考慮如何處理從其它數據庫發(fā)過來的數據,也未考慮如何把數據發(fā)送到其它數據庫。關系數據庫的特點是:“你的數據庫處理你的數據,我的數據庫處理我的數據。我不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論