畢業(yè)設計開題報告(簡化版)
1。 設計的依據(jù)與意義
隨著企業(yè)信息化和網(wǎng)絡技術的迅猛發(fā)展,越來越多的企事業(yè)單位都建立了自己的信息系統(tǒng)。由于這些信息系統(tǒng)在不同階段不同環(huán)境下開發(fā),而且大都建立在面向各自部門內(nèi)部業(yè)務處理的基礎之上,因此每個系統(tǒng)有各自的運行環(huán)境和數(shù)據(jù)存儲方式。同時在信息組織上面,往往各個部門之間又存在交叉信息。而這些交叉信息的組織無疑導致了大量的重復勞動;甚至,由于獲取信息的渠道、時間等的差異,而導致表征相同信息的數(shù)據(jù)出現(xiàn)歧義,無法確定信息的正確版本。為了更好地實現(xiàn)資源共享, 提高資源管理效率,迫切需要建立1個公共的集成環(huán)境,對用戶提供統(tǒng)1和透明的訪問界面。
在打破各信息系統(tǒng)間的彼此封閉,實現(xiàn)數(shù)據(jù)交換和共享的努力中,往往會遇到以下這些問題:
1、數(shù)據(jù)庫建立的時候沒有考慮到數(shù)據(jù)共享的問題;
2、不同的數(shù)據(jù)庫采用了不同的DBMS,甚至是不同的操作系統(tǒng);
3、不同數(shù)據(jù)庫中表征相同信息的表或表征相同屬性的字段可能命名各異;
4、各數(shù)據(jù)庫可能不在同1個網(wǎng)絡中。
為解決上述數(shù)據(jù)共享問題,我們在此提出在統(tǒng)1安全框架下,面向各自信息描述、分布式異構數(shù)據(jù)環(huán)境下數(shù)據(jù)集成的概念。通過數(shù)據(jù)的標準化,相關分布式異構數(shù)據(jù)源得以共享數(shù)據(jù)資源,并保持實時同步更新。
在數(shù)據(jù)集成環(huán)境下,當某個數(shù)據(jù)源數(shù)據(jù)有變動時,必須把數(shù)據(jù)變動信息及時傳遞給相關目標數(shù)據(jù)源。這就需要為每個數(shù)據(jù)源分別建立1個叫數(shù)據(jù)源伺服器的組件來實現(xiàn)異構數(shù)據(jù)源間的同步通信。具體來說數(shù)據(jù)源伺服器負責異構數(shù)據(jù)差異監(jiān)控信息的保存、異構數(shù)據(jù)源同步客戶端用戶的信息維護、實時安全的更新信息的主動式同步分發(fā),以及接收更新信息后向本地數(shù)據(jù)源的數(shù)據(jù)同步?梢姅(shù)據(jù)源伺服器在異構數(shù)據(jù)集成中是必不可少的,這正是設計研究它的意義所在。
2。 國內(nèi)外同類設計的概況綜述
數(shù)據(jù)集成是指1種中間件(Middle-Ware或Mediator),它屏蔽了各種異構數(shù)據(jù)間的差異,提供1個訪問異構數(shù)據(jù)的統(tǒng)1接口。能夠使應用程序以統(tǒng)1的方式訪問各種分布的、結構各異的數(shù)據(jù)源,就如同訪問單1數(shù)據(jù)源1樣。并能為數(shù)據(jù)和內(nèi)容源提供實時的讀和寫,能變換這些數(shù)據(jù)以進行商業(yè)分析和數(shù)據(jù)交換。
集成平臺與集成框架技術是在20世紀80年代末90年代初,隨著企業(yè)信息集成與系統(tǒng)集成復雜度的提高,采用常規(guī)的集成方法已難以適應集成的要求,于是作為先進的應用集成工具,集成平臺與集成框架技術就應運而生。
目前常用的數(shù)據(jù)集成方法有:聯(lián)邦系統(tǒng)、數(shù)據(jù)倉庫和Mediated系統(tǒng)。
1、聯(lián)邦系統(tǒng)
將所有數(shù)據(jù)源統(tǒng)1到1個單1的集成系統(tǒng)中。該方法比較簡單,集成系統(tǒng)有統(tǒng)1的模式,不用考慮分布數(shù)據(jù)的轉化和統(tǒng)1。但是,構造這樣的集成系統(tǒng)需要很長的開發(fā)時間,要求高性能的主機設備,實現(xiàn)代價較高。
2、數(shù)據(jù)倉庫(Data Warehouse)
將所有數(shù)據(jù)源的數(shù)據(jù)都抽取出來進行預處理,合成1個全局模式,并存儲在單1的數(shù)據(jù)倉庫中供用戶查詢。數(shù)據(jù)倉庫支持對歷史數(shù)據(jù)的訪問,用戶也可以通過數(shù)據(jù)倉庫提供的統(tǒng)1數(shù)據(jù)接口進行決策支持的查詢。這種方法查詢處理性能高,但數(shù)據(jù)可能缺乏時效性,并且創(chuàng)造數(shù)據(jù)倉庫比較費時費力(數(shù)據(jù)倉庫中的數(shù)據(jù)在存儲之前必須經(jīng)過1定的篩選處理)。
3、Mediated系統(tǒng)
通過提供所有異構數(shù)據(jù)源的虛擬試圖來完成數(shù)據(jù)集成,集成的數(shù)據(jù)源可以是數(shù)據(jù)庫、遺產(chǎn)系統(tǒng)和Web數(shù)據(jù)源等。系統(tǒng)提供用戶1個全局模式,用戶的操作只針對該模式,不必關心數(shù)據(jù)源的位置、模式和訪問方法。虛擬數(shù)據(jù)庫不存儲任何自己的數(shù)據(jù),而是將用戶的查詢翻譯成1個或多個對數(shù)據(jù)源的查詢,然后中介器(Mediation)對各個數(shù)據(jù)源的查詢結果進行綜合處理,將結果返回給用戶。該方法并不將各數(shù)據(jù)源的數(shù)據(jù)集中存放,而是通過中介器/包裝器(Mediation/Wrapper)體系結構滿足上層的集成應用需求。Mediation/Wrapper方法解決了數(shù)據(jù)更新的問題從而彌補了數(shù)據(jù)倉庫方法的不足。但是,由于針對各個數(shù)據(jù)源的包裝器(Wrapper)要分別建立,因此異構數(shù)據(jù)源的Wrapper建立問題又給人們提出了新的挑戰(zhàn)。
通過對以上數(shù)據(jù)集成方法的分析比較,Mediated系統(tǒng)性價比高,時效性強,是較合理的集成方法。隨著組件技術的發(fā)展,還可將組件技術應用到數(shù)據(jù)集成中。Web Services是1個嶄新的分布式計算模型,利用XML、SOAP、UDDI、WSDL和WSFL等標準構造1個松耦合的分布式計算環(huán)境,實現(xiàn)各個異構平臺的通訊和數(shù)據(jù)共享。
在此背景下,本文提出的異構數(shù)據(jù)集成框架是采用中介器/包裝器體系結構的Mediated系統(tǒng)。該系統(tǒng)基于面向對象的Java和XML技術,以元數(shù)據(jù)為基礎、Web Service為實現(xiàn)手段。Mediated異構數(shù)據(jù)集成系統(tǒng)主要采用數(shù)據(jù)源伺服器屏蔽各種數(shù)據(jù)源的差異 ,通過1個 XML 接口引擎作為低層關系數(shù)據(jù)庫或其他數(shù)據(jù)源的包裝 ,在不改變數(shù)據(jù)源數(shù)據(jù)類型和結構信息的前提下 ,完成某種數(shù)據(jù)類型與系統(tǒng)集成模(XML Schema)之間的雙向映射 ,并實現(xiàn)集成模式操作至低層數(shù)據(jù)源操作的轉換 ,為用戶提供了對數(shù)據(jù)源的查詢和更新機制。
3。 課題設計的內(nèi)容
本課題主要研究基于Web Services 面向服務的公用異構數(shù)據(jù)集成平臺的搭建、統(tǒng)1安全認證、異構數(shù)據(jù)共享與安全傳輸。本人側重于數(shù)據(jù)源伺服器的設計。數(shù)據(jù)源伺服器完成異構數(shù)據(jù)差異監(jiān)控信息的保存、異構數(shù)據(jù)源同步客戶端用戶的信息維護(包括:更新狀態(tài)、在線狀態(tài)監(jiān)控等)、實時安全的更新信息的主動式同步分發(fā),以及接收更新信息后向本地數(shù)據(jù)源的數(shù)據(jù)同步。
數(shù)據(jù)源伺服器包含3個主要功能模塊:數(shù)據(jù)接收整理模塊、數(shù)據(jù)差異比較模塊與數(shù)據(jù)同步更新模塊。數(shù)據(jù)接收整理模塊對主本數(shù)據(jù)進行適當?shù)恼砗图庸,便于后面的模塊功能處理;數(shù)據(jù)差異比較模塊掃描經(jīng)過整理的主本數(shù)據(jù),通過數(shù)據(jù)間的比較獲得數(shù)據(jù)的變化,生成主本數(shù)據(jù)變動信息;數(shù)據(jù)同步更新模塊根據(jù)主本數(shù)據(jù)變動信息完成對副本的刷新。
數(shù)據(jù)伺服器接收主本數(shù)據(jù)源通過TCP連接傳過來的數(shù)據(jù)流暫存在緩沖池,經(jīng)過整理和差異比較后將變動信息通過UDP協(xié)議轉發(fā)給副本數(shù)據(jù)源。主本數(shù)據(jù)變化信息包括變化了的數(shù)據(jù)以及完成這1變化的數(shù)據(jù)操作,這些信息保存在"主體數(shù)據(jù)變動信息"的數(shù)據(jù)表中。在數(shù)據(jù)量較大的情況下,可考慮轉化成相應XML格式文檔后經(jīng)壓縮成jai包再轉發(fā)給副本數(shù)據(jù)源伺服器,完成副本數(shù)據(jù)源選擇性的數(shù)據(jù)同步更新。
4。 設計方法
4。1研究方法:
1、采用Java編程技術,通過TCP協(xié)議完成變動信息的接收和臨時存儲。
2、采用Java編程技術,通過UDP協(xié)議完成同步客戶端的更新數(shù)據(jù)高速傳輸。
3、采用JDBC和XML技術,實現(xiàn)本地數(shù)據(jù)源選擇性的數(shù)據(jù)同步。
4。2研究措施:
異構數(shù)據(jù)集成數(shù)據(jù)源伺服器的設計基于Java網(wǎng)絡編程。因此首先必須熟悉網(wǎng)絡分層、網(wǎng)絡協(xié)議以及網(wǎng)絡通信原理,并且熟悉Java網(wǎng)絡編程API。另外也要求掌握XML數(shù)據(jù)格式化和數(shù)據(jù)打包傳輸。以上這些知識要點本人已選修過相關課程或自學過相關內(nèi)容,而且進行過1些實踐練習,可以說有所準備。數(shù)據(jù)差異比較和轉化是數(shù)據(jù)源伺服器功能的關鍵和難點,對此我認為需要更深入了解各種數(shù)據(jù)表結構及字段類型。
畢業(yè)設計論文開題報告(簡化版)相關文章推薦:
1.音樂畢業(yè)設計(論文)開題報告
2.大學生畢業(yè)論文設計的開題報告范文
3.碩士畢業(yè)設計論文開題報告的要求
4.職業(yè)技術學院畢業(yè)設計(論文)開題報告
5.大學畢業(yè)論文的開題報告
6.大學本科畢業(yè)設計開題報告模板
7.法學畢業(yè)論文設計開題報告模板
8.大專畢業(yè)論文開題報告范文
9.材料工程畢業(yè)設計開題報告
10.網(wǎng)站設計畢業(yè)論文開題報告范文