數據準備
? 數據準備又可分為四個子步驟:數據選取、數據集成.數據預處理和數據變換。 ?
? 1、數據選取:根據用戶的需要從原始數據庫,數據文件等處抽取相關數據。確定發現任務的操作對象。
? 2、數據集成:將多種數據源集成到統一的數據倉庫中,組合在一起,以便于數據的進一步處理。
? 3、數據預處理:一般包括消除噪聲、推導計算缺值數據、消除重復記錄完成數據類型轉換。有的數據挖掘算法專門針對離散值,因此,需要將連續值數據轉換為離散值的數據以便于符號歸納;而有的算法需要將離散值轉換為連續值,這些變換都可以在該階段完成。
? 4、數據變換:可以將數據變換或統一成適合挖掘的形式,并可以消減數據維數,從初始特征中找出真正有用的特征以減少數據開采時要考慮的特征或變量的個數。
CRM模型建立
? 有些人認為數據挖掘即為這一步,這可以說是狹義的數據挖掘。首先要確定任務或目的是什么,如分類、聚類、概念描述、關聯規則發現等。任務確定后,要決定使用什么樣的挖掘算法。同樣的任務可以用不同的算法來實現。
? 選擇算法的時候主要從以下兩方面考慮:一是根據數據的特點來選擇與之相關的算法;是根據用戶或是運行系統的要求來選擇相應的算法,有的用戶希望獲取描述型的容易理解的知識,有的用戶希望獲取預測準確度盡可能高的預測型知識。選好算法后,運行挖掘算法,得到問題的模型。
模式解釋和評價
? CRM軟件模型建立階段發掘出的模式,經過用戶或機器的評價,可能存在冗余或無關的模式,需要將其剔除;也有可能模式不滿足用戶要求,則需要整個發掘過程退回到發掘階段之前,如重新選取數據、采用新的數據變換方法,設定新的數據挖掘參數值,甚至換一種挖掘算法。
知識表示
? 為了便于用戶理解,實用可視化技術蔣發掘的模式,可視化,或將結果轉換為用戶易懂的另一種形式表示,例如,將分類決策樹轉化為“if...then...”的規則。
文章來源:
http://ss773.com/nz/3833.html
版權申明:本文來自投稿,本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現文章或圖片等內容涉嫌抄襲侵權/違法違規, 請第一時間發送郵件至 [email protected] 舉報,一經查實,本站將立刻刪除!
八駿CRM系統是一款可以滿足醫療器械、企業服務、軟高科、制造業、貿易行業等領域的客戶關系管理系統及業務流程管理平臺,覆蓋PC端+APP,將多端數據打通并同步,并且基于客戶管理,實現售前、售中、售后全業務環節的人、財、物、事的管理,打造一站式業務管理平臺,并且對接釘釘、企業微信等,支持定制開發,可私有化部署。咨詢合作和了解系統可聯系客戶經理 15558191031(微信同號)。