基于模糊聚類的電子信息資源整合方法
摘要:由于進行電子信息資源整合的過程中,沒有進行資源轉換降維處理,導致資源整合效率低,為此提出基于模糊聚類的電子信息資源整合方法。通過模糊ORM技術抽取電子信息資源,采用等效轉換降維的方法對抽取的電子信息資源進行轉換降維處理,根據處理結果,結合模糊聚類分析,構建EAD電子信息資源整合模型,采用模糊聚類分析的方式,將所屬的信息資源依據特征或者屬性劃分為不同額定整合區域,計算整合隸屬度,布設信息資源的整合層級。最終的測試結果表明:與傳統的LAM信息資源整合測試組及傳統改進ORM信息資源整合測試組相對比,所設計的模糊聚類信息資源整合測試組最終得出的響應時間相對較短,電子信息資源整合效率較高,所提方法具有實際的應用價值。
本文引用地址:http://www.ex-cimer.com/article/202308/449387.htm電子信息資源是以數字化形式( 即二進制代碼0,1)把文字、圖象、聲音、動畫等多種形式的信息存儲在光、磁等非印刷型介質上,并以光信號、電信號的形式傳輸,通過響應的計算機和其他外部設備再現出來的信息資源。電子信息資源整合主要是針對于龐大的數據信息群,構建的一種特殊的數據匯總方法[1]。近年來,隨著計算機以及網絡技術的成熟普及,數據資源急劇增長,逐漸成為資源處理的主流。通常情況下,數字資源自身具有復雜性、異構性、海量性以及多元性等特征,這在一定程度上也增加了信息資源整合的速度以及效率,增加元數據的可靠性,給未來信息發展奠定更為堅實的基礎[2]。
模糊聚類,實際上指的是一種按模糊界限以及基本要求對事物進行分類的數學方法[3]。本質上是客觀的劃分,并采用數理統計的方式,獲取最終處理結果。模糊聚類為信息整合處理提供了極大的便利條件,進一步確保數據計算的精準度,同時,關聯系統聚類法和逐步聚類法等方法,形成一個可無限延伸與擴展的資源整合體系,優化需要整合的信息資源,避免出現信息孤島這一類問題,推動信息整合相關企業邁入一個新的發展階段。因此,本文提出一種基于模糊聚類的電子信息資源整合方法??紤]到最終測試結果的精準性與可靠性,本文會在較為真實的背景下進行實驗測試,并驗證本文方法能夠安全、高效的進行信息資源整合。
1 模糊聚類下電子信息資源整合方法
1.1 基于模糊ORM技術的電子信息資源抽取
在對模糊聚類下電子信息資源整合方法設計之前,需要先采用模糊ORM 技術對電子信息資源抽取。通常情況下,針對于不同的整合范圍,所導出的資源以及定向整合目標也是不同的,這也使得內部執行程序存在差異[4-6]??梢圆捎秒p向處理模式,在平臺中構建多層級的模糊ORM 資源整合程序,與數據庫相關聯的同時,獲取數據集,在聚類中心,對信息劃歸分類,計算出聚類質心數,具體如式(1)所示。
(1)
式(1)中: B 表示聚類質心數; p 表示聚類范圍; Z 表示質心集合;f 表示映射系數。通過上述計算,最終可以得出實際的聚類質心數[7]。根據得出的聚類質心數,核定不同層級數值資源的占比,以此為基礎,在特定的電子信息資源庫中,利用雙向信息集成法來代替傳統的單一信息集成方式,結合模糊ORM 技術,電子信息資源抽取,具體如式(2)所示。
(2)
式(2)中:H表示數據定向抽取結果;a 表示疊合距離;d 表示集成次數; s 表示允許出現的極限差值。此時,完成對信息的抽取,隨后,在標定的資源整合范圍之內,依據實際的處理標準,更改調整ORM 模糊引導指令,在確保數據唯一性、準確性、及時性、完整性的同時,實現整合目標的更改調整,為后續的匯總處理奠定基礎[8]。
1.2 電子信息資源轉換降維處理
在通過模糊ORM 技術對信息資源進行抽取后,對電子信息資源進行轉換降維處理。所謂轉換降維處理,主要指的是在對信息資源抽取的過程中,信息資源通常處于集合的狀態,資源維數也存在較大的差異,而維數的存在并不利于數據的整合、匯總,嚴重的甚至會造成數據誤差等,因此,需將高維信息資源轉換為低維信息資源??梢圆捎玫刃мD換降維的方法,按照統一的元數據標準或者降維格式進行周期性轉換,計算出轉換降維比率,具體如式(3)所示。
(3)
式(3)中:A 表示轉換降維比率;n 表示中心整合距離;c表示聚類差值。通過上述計算,最終可以得出實際的轉換降維比率。根據信息資源的屬性與特征,結合轉換降維比率,實現定向轉換。
接下來,在實現標定信息資源的轉換降維后,結合定向集成信息資源整合現狀,計算出信息資源處理的單元速度,具體如式(4)所示。
(4)
式(4)中: U 表示信息資源處理單元速度; x 表示縱向整合距離; q 表示傳輸路徑; t 表示動態平均值。通過上述計算,最終可以得出實際的信息資源處理單元速度。在中心元數據庫中,依據降維映射規則將統一元數據標準分化為幾個轉換降維層級。不同降維層級的轉換格式也是不同的,可以根據所設定的整合目標,作出更改調整,舉例來說:可以賦予定義XML、RDF 等輸出格式,一定程度上擴大整體的信息整合降維范圍,以此來適應用戶的不同需求。
1.3 EAD模糊聚類整合模型構建
在完成電子信息資源轉換降維處理后,構建EAD模糊聚類整合模型。將上述轉換降維處理后的電子信息資源輸入到模型之中,將模型調整為可共享的形式化概念模型,關聯局域網以及聚類數據中心,調整數據組織形式為單向。將不同元數據指令應用到本體集成框架中,設定具體的集成速度和資源整合映射比,具體如表1所示。
表1 集成速度、資源整合映射比測定表
根據表1,可以完成對集成速度、資源整合映射比的測定。隨后,遵循標定的整合目標,結合模糊聚類分析,構建EAD 信息資源整合結構,具體如圖1所示。
圖1 EAD信息資源整合模型結構圖示
根據圖1,可以完成對EAD 信息資源整合模型結構的建立。此時以本體為中心的,調整定向映射標準,使用多層級的映射描述框架,綜合EAD 模型執行基準,完成對EAD 模糊聚類整合模型的構建,細化信息資源的整合效果。
1.4 分布式自適應處理實現信息資源整合
在完成對EAD 模糊聚類整合模型的構建之后,接下來,需要采用分布式自適應處理,實現信息資源整合。首先,采用模糊聚類分析的方式,將所屬的信息資源依據特征或者屬性劃分為不同額定整合區域,設定整合目標為動態,依據虛擬整合的范圍,對定向目標作出更改和調整,計算出信息資源整合的隸屬度,具體如式(5)所示。
K=3.5T+(7y?1) (5)
式(5)中: K表示隸屬度; T表示質心聚類系數; y表示歐氏距離。通過上述計算,最終可以得出實際的隸屬度。與此同時,利用所得的隸屬度,布設自適應模糊整合區域,細化引導的指令,采用EAD 模糊聚類整合模型測定出此時電子信息的自適應程度,具體如式(6)所示。
F=5W?1.5+6G (6)
式(6)中: F 表示自適應程度; W表示定向資源分析速度; G 表示特征向量。通過上述計算,最終可以得出實際的自適應程度,依據得出的自適應程度,布設信息資源的整合層級,采用分布式的整合方式,對信息資源定向分類,結合模糊聚類法實現最終的整合分析。構建對應的信息資源整合環節,具體如圖2所示。
圖2 信息資源整合環節
2 方法測試
為了驗證本文提出的基于模糊聚類的電子信息資源整合方法在實際應用中的效果,選取A 數據庫作為測試的主要目標,通過在Matlab 軟件進行測試分析。分別設定傳統LAM 信息資源整合測試組、傳統改進ORM信息資源整合測試組以及本文所設計的模糊聚類信息資源整合測試組。采用對比的方式,確保3 種方法在相同的環境之下同時測試,最終得出的結果以對比的方式展開分析,接下來,進行測試環境的搭建。
2.1 測試準備
在對模糊聚類下電子信息資源整合方法的實際應用效果進行分析與研究,需要先搭建相關的測試環境。根據測定的實際需求以及執行標準,先對測試基礎指標參數進行預設,具體如下表2所示。
表2 基礎指標參數預設表
根據表2,可以完成對基礎指標參數的預設。實驗數據主要針對RBI、AWS、UCI、KDD Cup、MovieLens相關數據。
表3 數據集
隨后,利用測定的設備,營造相應的信息整合環境。為進一步確保信息資源整合的穩定性,采用無線局域網的通信模式,結合模糊聚類框架,對數據資源的基礎整合情況作出分析,具體如圖3所示。
圖3 信息資源整合程度對比分析圖示
根據圖3,可以完成對信息資源整合程度的對比分析。調整信息資源的單元處理速度,調整整合處理標準,完成對測試環境的搭建。核定測試的設備與網絡是否處于穩定的運行狀態,同時確保不存在影響最終測試結果的外部因素,核定無誤后,開始具體的測定分析。
2.2 測試過程及結果分析
在完成對上述測試環境的搭建之后,接下來,需要進行具體的測試。首先,為了提升信息資源整合的速度,本文選擇使用指令引導的方式,關聯對應的局域網和數據庫,在網絡中尋找所需要的信息資源,并采用特殊的格式,按照指令的歸納順序,分批次導入數據庫的對應位置中,結合數據的種類,劃定對應的處理階層,獲取基礎指標數值。計算信息資源的整合定向范圍,具體如式(7)所示。
(7)
式7中: Y表示整合定向范圍; V表示單向引導距離。通過上述計算,最終可以得出實際的整合定向范圍。在標定的范圍之內,結合模糊聚類方式,將所屬的信息資源整合,劃歸至對應的整合層級之中。在模糊聚類分析背景下,構建批量信息資源的整合環節,具體如圖4所示。
圖4 信息資源模糊聚類整合環節設計圖示
根據圖4,可以完成對信息資源模糊聚類整合環節的設計。與此同時,關聯無線局域網絡,構建定向的信息整合程序,賦予每一個層級對應的聚類指令,營造穩定的信息處理整合環境。隨后,將測試數據庫與XML數據中心相關聯,可以更好地完成局部數據模式向全局數據模式的定向轉化,實現信息資源的適配處理之后,對數據庫中的元數據定義,將所選擇的數據劃定為4 個小組,每一個小組的數據量均不同,利用模糊聚類分析法,對電子信息資源整合的響應時間計算,具體如式(8)所示。
M=3b-0.2+ (8)
式8中:M 表示響應時間; b 表示定向測定距離;g表示虛擬迭代次數。通過上述計算,最終可以得出實際的響應時間。對得出的結果對比分析,如表3 所示。
表3 測試結果對比分析表
根據表3,可以完成對測試結果的對比分析:與傳統的LAM 信息資源整合測試組及傳統改進ORM 信息資源整合測試組相對比,本文所設計的模糊聚類信息資源整合測試組最終得出的響應時間相對較為迅速,表明在對電子信息資源整合的處理上,效率較高,誤差較小,整合環節得到了更好地處理,具有實際的應用價值。
3 結束語
綜上所述,便是對基于模糊聚類的電子信息資源整合方法的分析和研究。對比于傳統的信息資源整合方法,本文在模糊聚類分析的輔助之下,構建更為靈活、多變的信息整合模式,在復雜的背景環境之下,可以更為迅速、清晰地完成目標任務的處理,最大程度降低信息整合誤差的發生概率,與網絡相關聯,形成動態的信息處理程序,通過指令引導,營造一個穩定、安全的處理環境,更加符合現代化發展的需求,促使信息資源整合配置更為高效,通信效率大幅提升,發展前景廣闊。
參考文獻:
[1]朱智斌. 大數據背景下不動產登記檔案信息資源整合方法研究[J]. 城建檔案,2020,14(12):109-110.
[2]孟學堯,郭倩倩,郭海儒. 一種改進螢火蟲算法的模糊聚類方法[J]. 小型微型計算機系統,2021,42(6):1165-1170.
[3]王慧,王海江,高攀,等. 新疆生產建設兵團農業資源數據采集與整合方法研究[J].農業大數據學報, 2021,3(2):31-41.
[4]顧羽. 基于FCM模糊聚類方法以變電站為單元的電力系統負荷分類研究[J]. 機電信息,2020, 25(33):22-23+25.
[5]熊學鋒,彭小慶,曹鑫. 基于改進ORM的Oracle數據庫異構資源整合方法研究[J]. 電子設計工程,2020,28(21):38-41 +46.
[6]張小靜,楊曉靈,劉青松. 數字轉型背景下科研檔案資源整合實踐路徑和方法研究[J]. 城建檔案,2021, 34(12):44-45.
[7]馮國禮,李蓉,吳雙. 基于人工智能技術的電力信息系統運維數據整合方法[J]. 電力信息與通信技術, 2022, 20(1): 68-73.
[8]賈君枝. LAM館藏資源的元數據整合方法比較分析[J]. 檔案學研究,2022, 21(1):79-84.
(本文來源于《電子產品世界》雜志2023年7月期)
評論