上海代寫論文網專業提供代寫畢業論文、代寫本科論文服務
您現在的位置:首頁 > 計算機論文 > 軟件工程論文 >
軟件工程中數據挖掘的運用探析
發布時間:2020-04-28

  摘    要: 大數據的應用為各行各業的數據分析工作帶來了巨大的便利。大型軟件工程無論是在技術還是管理方面都涉及到大量的數據,但如何有效管理并充分利用這些數據是當前的難點之一。本文著重從軟件漏洞掃描、執行記錄分析、開源軟件挖掘、版本信息管理等方面介紹了據挖掘技術在軟件工程中的應用,可以為軟件行業提供參考。

  關鍵詞: 數據挖掘; 軟件工程; 大數據技術;

  數據挖掘是大數據分析領域中的一個新的數據處理理念,它的核心思想是通過對數量巨大、但價值密度低的數據進行分析處理,從而提取出一些對所研究的問題有價值的信息。隨著軟件工程的發展,在軟件開發和項目管理過程中也逐漸出現了海量數據分析的難題,例如源代碼管理、版本管理、漏洞分析、系統操作記錄。軟件長期運行所積累下來的數據,由于數據量過大,傳統的數據處理技術顯然是不可能完成的。為此,研究數據挖掘技術在軟件工程中的應用具有重要意義。

  一、軟件工程數據挖掘技術的發展

  數據挖掘技術最早誕生于20世紀80年代,當時是為了挖掘數據庫中的知識價值而提出的,并且主要集中在理論研究。隨著大數據問題的日益突出,數據挖掘技術開始受到人們的廣泛關注,研究的焦點也開始由理論轉向實踐,在各領域中得到了廣泛的應用。而軟件工程的概念則是大約產生于20世紀60年代末,當時則是為了解決“軟件危機”而提出的。可見,數據挖掘技術與軟件工程在發展上大致保持同步,這為數據挖掘技術在軟件工程中的應用奠定了良好的基礎。進入21世紀以來,軟件工程的發展更加迅速,在短短十幾年內就實現了許多國家和地區的信息化改造,使軟件工程進入一個全新的發展階段。軟件工程的大發展使得系統中的數據越來越多,處理難度日益增加,而此時的大數據技術已有一定的理論基礎,采用數據挖掘技術解決軟件工程中遇到的難題,成為一種必然的選擇。

  二、數據挖掘在軟件工程中的應用

  (一)軟件漏洞掃描

  漏洞檢測是軟件工程的重要內容,是發現安全隱患、提高軟件質量、保障系統安全的有效措施。在傳統的漏洞檢測技術中,由于需要掃描的數據量過大,如果逐條依次分析,將導致長時間的等待,可操作性不強。在漏洞掃描中引入數據挖掘技術,可以有效提高掃描效率。典型的基于數據挖掘的軟件漏洞掃描應用步驟如下:第一,創建測試項目。根據用戶的具體需求制定軟件測試方案,明確需要掃描哪些類型的漏洞,采用什么方案進行掃描。第二,收集漏洞信息。掃描漏洞的前提是要認識漏洞,也就是對漏洞進行定義。需要收集有關軟件缺陷的大量信息,并對一些屬性進行定量化處理。第三,選擇理論模型。根據掃描要求,選取適當的數據挖掘模型,根據前期收集的數據資料,對模型進行充分的訓練,得到有效的訓練集與測試集,取得最佳掃描策略。第四,開展漏洞掃描。采用前一步得到的模型,將其應用于軟件掃描測試過程,經過數據的分類和特征分析,提取漏洞信息。第五,根據掃描結果,修復漏洞,并重新掃描以確認漏洞的成功修復。
 

軟件工程中數據挖掘的運用探析
 

  (二)執行記錄分析

  分析程序的執行路徑對于代碼關聯性分析具有重要意義,對軟件的執行記錄進行數據挖掘,有助于深入理解代碼功能以及軟件的維護。執行記錄的數據挖掘在本質上看就是對其執行路徑進行跟蹤,然后逆向建立模型。其數據挖掘的過程一般包含插裝、跟蹤、記錄、分析等步驟。首先在待測試的軟件代碼中插裝相應的信息,并執行軟件,將其執行過程記錄下來,經預處理后,采用分類、類聚、關聯等大數據分析手段提取出關鍵記錄信息,從而繪出系統功能模型或架構。

  (三)開源軟件挖掘

  復制代碼是開源軟件數據挖掘分析技術中最常見的應用領域,在軟件工程中,代碼復用是十分常見的,根據筆者經驗,至少有一半的通用源代碼都會在多個項目中反復使用。這意味著采用代碼克隆檢測技術可以有效完成對軟件內部代碼之間,以及不同軟件之間的代碼進行檢測,快速提取出具有利用價值的代碼段。通過對代碼特征的分析,可以避免代碼克隆過程中引入漏洞,還可以更好地為軟件的后期維護或升級提升參考。

  (四)版本信息管理

  代碼管理是軟件工程中涉及的重要問題,幾乎所有軟件企業都會采用版本控制系統對軟件或代碼版本進行維護,以確保團隊成員之間可以獲取全局一致的代碼。但在大型軟件開發團隊中,代碼管理是一件十分復雜的事,任何一次更新都會引入代碼管理混亂的風險。數據挖掘技術可以對軟件的變更歷史信息進行挖掘,通過大量代碼的對比分析確立各模塊和版本之間內部聯系,在保證代碼高效融合的過程中,也有效地避免了漏洞的引入。

  三、小結

  隨著軟件產業的不斷壯大,軟件工程只有不斷引入新的管理和技術工具才能適應快速發展的需求,作為一種可實現快速精確測量的數據分析技術,數據挖掘成為了軟件工程不斷向前發展的重要支撐。與此同時,數據挖掘技術也在不斷地發展進步,各種新的數據挖掘理論不斷涌現,使大數據的處理變得日益方便快捷。不難發現,在未來的軟件工程中,各類大數據分析技術將與軟件開發和管理過程更加緊密地融合在一起,為軟件項目的評估、開發過程管理、系統測試及維護等工作提供重要的決策依據。

  參考文獻

  [1] 唐海燕,蘭兵.數據挖掘技術在軟件工程中的應用[J].電子技術與軟件工程,2019(23):141-142.
  [2] 喬磊.軟件工程數據挖掘的發展趨勢[J].電子技術與軟件工程,2019(7):172.
  [3] 趙亮,梁勝彬,馮天偉.面向數據的軟件工程方法研究[J].信息系統工程,2018(10):28.

對應分類:
下一篇:沒有了
版權所有:上海論文網專業權威的論文代寫、論文發表的網站,秉承信譽至上、用戶為首的服務理念,服務好每一位客戶
本站部分論文收集于網絡,如有不慎侵犯您的權益,請您及時致電或寫信告知,我們將第一時間處理,郵箱:shlunwen@163.com
网赚qq群 天天网赚靠谱吗 中创网赚是骗人的吗 北京28预测 极速快乐8 pk10开户 做网赚什么软件好 靠谱的网赚有哪些 自建网站网赚 2019美元网赚