1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁 > 文章中心 > 數據挖掘論文

數據挖掘論文

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數據挖掘論文范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

數據挖掘論文

數據挖掘論文范文第1篇

數據挖掘技術是延伸和擴展了傳統分析方法,可以發現傳統分析方法不能發現的內容和規律,并且它將人們從單調、枯燥的閱讀專利文獻的工作中解放出來,使用計算機代替了人類勞動,這樣不僅提高了效率,而且提升了準確度。因此,數據挖掘作為一個專利分析的強有力工具被引入到專利分析中來,并且得到快速的發展應用。專利數據挖掘流程應考慮的問題:一是用數據挖掘解決什么樣的問題;二是為進行數據挖掘所做的數據準備;三是數據挖掘的各種分析算法。故專利數據挖掘的一般過程通常按照以下步驟來完成:領會數據挖掘的目的,獲取分析所用的數據集合,探索、清理和預處理數據,選擇要使用的數據挖掘技術,使用算法解決問題,解釋算法的結果。而其一般流程可簡化為三個階段:數據準備數據挖掘結果解釋和評價。本文采用簡化的流程進行實證分析。

二、石家莊地區制藥企業專利數據挖掘

本文對石家莊地區制藥企業的專利數據進行挖掘分析,挖掘對象是華北制藥集團公司、石家莊制藥集團有限公司、石家莊神威藥業股份有限公司、石家莊四藥股份、河北以嶺藥業股份有限公司、石家莊市華曙制藥集團、河北醫科大學制藥廠、河北圣雪大成制藥有限責任公司等地址在石家莊且具有一定代表性的藥企,希望通過這些藥企數據能夠找到石家莊地區制藥領域的核心組成,并能為藥企更好地發展提供有力的信息支持。IPC號是目前權威的專利技術主題的標識編碼之一,基本包含了各行各業的專利信息,是一個龐大的專利信息體系。目前國內外很多分析方法及技術大部分是基于專利的IPC分類號來分析專利技術主題的,此分析方法有一定的參考價值和科學性,而且對于具有大量專利信息的分析具有很好的總結概括效果。本文以專利全部IPC號為分析對象,并且構建IPC號之間的關聯規則,在最大程度上揭示隱含的專利技術關聯性,從而為石家莊地區制藥企業專利技術的發展提供參考。

1.數據準備。數據來源的準確與否是數據分析與挖掘的基礎,是數據分析與挖掘的根本。本文所使用的石家莊地區制藥領域專利數據由萬方數據公司提供,以制藥企業地址為石家莊為檢索條件,搜索出了包括從1985—2014年間石家莊地區制藥領域專利644條,分別分布在A、B、C、D、E、F、G、H八個大部。對專利數據庫中的644條專利進行篩選,根據“分類號”字段限制,它涉及專利信息的分類,有些IPC所涉及的范圍與石家莊地區制藥領域沒有聯系或聯系很小,不宜保留。根據“申請人(專利權人)”字段的限制,剔除與石家莊地區制藥不相關或制藥企業地址不在石家莊地區的專利。最后篩選出590條最符合該領域特點的專利。由于IPC號在幾乎所有現存數據庫中均是以一個字段存儲一個專利的所有IPC分類號的,形如:A61K38/26、A61K9/08、A61K47/12、A61P3/10,且每個專利一般都有好幾個分類號,而每個企業又研究大量的專利,所以在進行專利分析之前,需要對專利IPC號進行數據整理。由于過于細致的IPC分類號并不利于專利主題的分析與揭示,所以本文中采用專利小類分析,就是取IPC號的前4位。并將申請人與其對應的多條IPC號進行拆分,拆分后的數據項有773條,即顯示每個申請人對應的一條IPC分類號。

2.數據挖掘。本文數據挖掘過程將采用Excel和SQLsever2005軟件,首先對所得到的數據導入SQLserver2005進行挖掘,利用SQLserver2005可以直接進行IPC號的關聯規則挖掘,然后對專利信息進行分析。

3.數據挖掘結果與分析。基于關聯規則制作依賴關系網絡圖,可以更加直觀地看到各個IPC號之間的關聯和依賴狀態。

(1)以A61K、C12N、C12P、C07D、C07C為中心的核心專利技術群。這些專利的IPC分類號是關鍵部分藥物組成的各種化合物即藥物主要成分的重要聚集組。A61K(醫用、牙科用等的配置品)是項集次數最多的,即支持度較高的,C12P(發酵或使用酶的方法合成目標化合物或組合物或從外消旋混合物中分離旋光異構體)、C12N(微生物或酶;其組合物)、C07D(雜環環合物,例如鄰氯芐星青霉素的合成)、C07C(無環和碳環化合物)通過專利相關知識我們已經知道這些都是藥物的合成成分,即土霉素、鏈霉素、青霉素等多種抗生素和維生素的主要成分組成,是制藥領域的核心。這也是和石家莊地區制藥企業的核心領域相符合的。另外這些專利主題的相互關聯、依賴說明了石家莊地區制藥企業在該領域具有很好的布局網絡,在研發數量上也占有一定優勢,所以說是石家莊地區制藥企業的主要研究領域。

(2)以B65G、C12M為中心的輔助設備專利技術群。藥品的生產離不開設備的支持,所以設備方面的專利也能體現制藥企業的技術水平。在圖1中也能體現出來,專利間有著很強的依賴性和關聯性,在核心專利周邊有B65G(運輸或貯存裝置,例如裝載或傾斜用輸送機、車間輸送機系統、氣動管道輸送機)、C12M(酶學或微生物學裝置),這些是制藥的輔助技術手段,與中心專利是相互聯系的,也是制藥過程中必不可少的,在這些方面的提高有利于制藥核心領域的發展。先進藥品的研制離不開先進制藥設備支持,所以設備水平的提高也是關鍵的。如圖3所示,石家莊地區制藥企業在這一方面的技術依賴網絡也已經形成,說明在此技術領域也已經擁有較強實力。但與中心主要專利相比,輔助設備專利技術還是需要不斷提高的。

三、總結

數據挖掘論文范文第2篇

[關鍵詞]數據挖掘數據挖掘方法

隨著信息技術迅速發展,數據庫的規模不斷擴大,產生了大量的數據。但大量的數據往往無法辨別隱藏在其中的能對決策提供支持的信息,而傳統的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數據分析技術處理大量數據,并從中抽取有價值的潛在知識,數據挖掘(DataMining)技術由此應運而生。

一、數據挖掘的定義

數據挖掘是指從數據集合中自動抽取隱藏在數據中的那些有用信息的非平凡過程,這些信息的表現形式為:規則、概念、規律及模式等。它可幫助決策者分析歷史數據及當前數據,并從中發現隱藏的關系和模式,進而預測未來可能發生的行為。數據挖掘的過程也叫知識發現的過程。

二、數據挖掘的方法

1.統計方法。傳統的統計學為數據挖掘提供了許多判別和回歸分析方法,常用的有貝葉斯推理、回歸分析、方差分析等技術。貝葉斯推理是在知道新的信息后修正數據集概率分布的基本工具,處理數據挖掘中的分類問題,回歸分析用來找到一個輸入變量和輸出變量關系的最佳模型,在回歸分析中有用來描述一個變量的變化趨勢和別的變量值的關系的線性回歸,還有用來為某些事件發生的概率建模為預測變量集的對數回歸、統計方法中的方差分析一般用于分析估計回歸直線的性能和自變量對最終回歸的影響,是許多挖掘應用中有力的工具之一。

2.關聯規則。關聯規則是一種簡單,實用的分析規則,它描述了一個事物中某些屬性同時出現的規律和模式,是數據挖掘中最成熟的主要技術之一。關聯規則在數據挖掘領域應用很廣泛適合于在大型數據集中發現數據之間的有意義關系,原因之一是它不受只選擇一個因變量的限制。大多數關聯規則挖掘算法能夠無遺漏發現隱藏在所挖掘數據中的所有關聯關系,但是,并不是所有通過關聯得到的屬性之間的關系都有實際應用價值,要對這些規則要進行有效的評價,篩選有意義的關聯規則。

3.聚類分析。聚類分析是根據所選樣本間關聯的標準將其劃分成幾個組,同組內的樣本具有較高的相似度,不同組的則相異,常用的技術有分裂算法,凝聚算法,劃分聚類和增量聚類。聚類方法適合于探討樣本間的內部關系,從而對樣本結構做出合理的評價,此外,聚類分析還用于對孤立點的檢測。并非由聚類分析算法得到的類對決策都有效,在運用某一個算法之前,一般要先對數據的聚類趨勢進行檢驗。

4.決策樹方法。決策樹學習是一種通過逼近離散值目標函數的方法,通過把實例從根結點排列到某個葉子結點來分類實例,葉子結點即為實例所屬的分類。樹上的每個結點說明了對實例的某個屬性的測試,該結點的每一個后繼分支對應于該屬性的一個可能值,分類實例的方法是從這棵樹的根結點開始,測試這個結點指定的屬性,然后按照給定實例的該屬性值對應的樹枝向下移動。決策樹方法是要應用于數據挖掘的分類方面。

5.神經網絡。神經網絡建立在自學習的數學模型基礎之上,能夠對大量復雜的數據進行分析,并可以完成對人腦或其他計算機來說極為復雜的模式抽取及趨勢分析,神經網絡既可以表現為有指導的學習也可以是無指導聚類,無論哪種,輸入到神經網絡中的值都是數值型的。人工神經元網絡模擬人腦神經元結構,建立三大類多種神經元網絡,具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學習、自組織和自適應能力的種種優點。

6.遺傳算法。遺傳算法是一種受生物進化啟發的學習方法,通過變異和重組當前己知的最好假設來生成后續的假設。每一步,通過使用目前適應性最高的假設的后代替代群體的某個部分,來更新當前群體的一組假設,來實現各個個體的適應性的提高。遺傳算法由三個基本過程組成:繁殖(選擇)是從一個舊種群(父代)選出生命力強的個體,產生新種群(后代)的過程;交叉〔重組)選擇兩個不同個體〔染色體)的部分(基因)進行交換,形成新個體的過程;變異(突變)是對某些個體的某些基因進行變異的過程。在數據挖掘中,可以被用作評估其他算法的適合度。

7.粗糙集。粗糙集能夠在缺少關于數據先驗知識的情況下,只以考察數據的分類能力為基礎,解決模糊或不確定數據的分析和處理問題。粗糙集用于從數據庫中發現分類規則的基本思想是將數據庫中的屬性分為條件屬性和結論屬性,對數據庫中的元組根據各個屬性不同的屬性值分成相應的子集,然后對條件屬性劃分的子集與結論屬性劃分的子集之間上下近似關系生成判定規則。所有相似對象的集合稱為初等集合,形成知識的基本成分。任何初等集合的并集稱為精確集,否則,一個集合就是粗糙的(不精確的)。每個粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補集元素的元素。粗糙集理論可以應用于數據挖掘中的分類、發現不準確數據或噪聲數據內在的結構聯系。

8.支持向量機。支持向量機(SVM)是在統計學習理論的基礎上發展出來的一種新的機器學習方法。它基于結構風險最小化原則上的,盡量提高學習機的泛化能力,具有良好的推廣性能和較好的分類精確性,能有效的解決過學習問題,現已成為訓練多層感知器、RBF神經網絡和多項式神經元網絡的替代性方法。另外,支持向量機算法是一個凸優化問題,局部最優解一定是全局最優解,這些特點都是包括神經元網絡在內的其他算法所不能及的。支持向量機可以應用于數據挖掘的分類、回歸、對未知事物的探索等方面。

事實上,任何一種挖掘工具往往是根據具體問題來選擇合適挖掘方法,很難說哪種方法好,那種方法劣,而是視具體問題而定。

三、結束語

目前,數據挖掘技術雖然得到了一定程度的應用,并取得了顯著成效,但仍存在著許多尚未解決的問題。隨著人們對數據挖掘技術的深人研究,數據挖掘技術必將在更加廣泛的領域得到應用,并取得更加顯著的效果。

數據挖掘論文范文第3篇

數據倉庫是管理智能循證醫學支持系統的基礎,搭建數據倉庫后,要充分地調取數據倉庫的有效資源,必須要有強大的工具對數據倉庫的資源進行規劃整理。OLAP(On-lineAnalyticalProcessing,在線分析處理或聯機分析處理)是一個應用廣泛的數據倉庫調用方法。它可以根據應用人員的指令,快速準確地對大量復雜的數據進行搜索查詢,并以直觀的容易理解的形式將搜索結果展示給醫院決策者,使他們能夠迅速全面地掌握醫院的運營現狀。

2采用可視化圖形操作分析技術

可視化分析技術能夠整合各式不同的數據來源或數據倉儲系統,利用MicrosoftSQLServerAnalysisServices構建多維結構數據庫(Cube),而后存取、分析商業數據,通過鼠標的拖、拉、點、選,操作各種維度與量值,迅速產生各式的分析圖表與統計結果。可視化的圖形操作能為用戶迅速提供決策報表與在線分析處理(OLAP)等重要分析功能。運用專業工具所提供的報表(Reports)、實時查詢(AD-HocQuery)、聯機分析處理(OLAP)等重要商業智能的強大分析功能,使醫院獲得最全面、迅速的數據洞悉能力。具體功能如下:

(1)表定制及報表的整合,在報表靈活性和報表開發易用性等方面具有突出的優勢,其報表是通過圖形界面下的鼠標拖拽操作來直觀的完成的,無須編寫任何腳本或者代碼,即可實現復雜格式的報表。

(2)優秀的BI前端圖形展示功能,支持目前流行的幾乎所有圖形展現方式;而且圖形之間可以任意組合應用,使支持的圖形展現方式以幾何級的方式增長。

數據挖掘論文范文第4篇

1.1結果優化中遺傳算法的應用遺傳算法由達爾文進化論與孟德爾遺傳變異論進行模擬后得到,該算法所采用的算法因子具有隨機性,故設備故障的出現往往不會受到常規故障規則的限制,但是遺傳算法在實際應用過程中,其對故障的整合分析,并不是盲目式的,而是針對機械設備狀態運行情況,以設備最優化為基本原則進行不斷完善計算進行的。若設備狀態監測和故障診斷當中,直接采用了與設備情況相應的參數進行適值計算,但又不需要對優化參數進行明確計算,在針對部分無法明確計算得到的設備參數時,即可采用遺傳算法對結果進行優化。遺傳算法的智能性與并行性較強,利用該方法,可以對設備故障當中還未得到有效解決的部分復雜問題進行妥善處理。目前,遺傳算法在設備運行函數的優化、設備模式的識別以及設備運行信號的整合處理等相關工作當中有著較為全面的應用,在將復雜的運行數據進行優化時,遺傳算法具有較為良好的性能。綜合其相關特點,在建立設備狀態監測和故障診斷的模型時,可采用該技術使得模型更為合理化,使得設備狀態監測與故障診斷的結果更為準確。以滾動軸承的狀態監測與故障診斷為例。在實際工作當中,運用各類運算符集,對滾動軸承的原始性特征向量進行測量后,采取最優的組合方式獲得新型向量,配合采用遺傳算法得到最終的滾動軸承參數,并利用分類法,對各項間距進行了調整,使得滾動軸承的診斷參數更為準確。此外,利用該方法,還有效區分了滾動軸承的不同工作狀態,測量結果較為全面,效果顯著。

1.2模糊集理論的應用要點該方法通過模糊集合與模糊推理兩種方法,其研究測試的對象是各類不確定性因素,屬于傳統集合理論的創新。模糊集理論在設備狀態監測和故障診斷中的應用,主要包含了兩個方面。一方面,是在相關數據概念的形成時,采用不準確和較為模糊的語言變量,根據人們習慣,對設備狀態的變化及變量變化狀態進行描述。具有較強的直觀性,且相關人員在接受該類概念時,也可以更方便的理解接受;另一方面,該方法通過提煉模糊性規則,在建模時模糊化,使得機械設備的控制、預測以及故障診斷等過程擁有更為廣闊的空間。

1.3基于實例分析的方案優化及調整該種方法擁有較為簡單的思路,在對設備未來運行情況進行預測時,系統會匹配與設備目前情況相似的實際案例,并從以往的解決方法中選出最佳的解決方案,再結合設備實際情況進行相應調整。此類方法的應用范圍較廣,且得到的計算結果也相對準確,但同時也具有一定缺陷,即無法全面整合以往設備數據及解決規律,缺乏充足的繼承性。該方法進行故障診斷的基本理念是,在選紅棗解決方法的過程中,利用歷史診斷方法成功案例為奠基,進行全面的推理工作,并采用類比和聯想法,較為全面的對故障進行診斷。

1.4多種數據挖掘法的聯合應用除上述幾種數據挖掘技術外,實際工作中還涵蓋了以傳統數據統計為基礎的統計分析方法、人工神經網絡元技術、等多種方法,考慮到每一種方法或多或少具有局限性,故為了有效提高各類方法的應用效果,可以將各類方法進行配合使用,代表性的算法組合類型如表1所示。

以遺傳算法和模糊集理論的配合采用為例。由于模糊算法,主要是利用了最大隸屬原理和閥值原理,故可以按照不同故障的發生原因以及故障征兆的相互聯系,在綜合考慮的基礎上對機械設備故障的可能原因進行全面分析。而該方法在運用的過程中,會對各類故障征兆進行約簡化從而得到較為普遍的規律,但是所得到的規律也可能存在不可靠問題。故在實際應用模糊集理論的同時,配合采用遺傳算法,通過對模糊集理論所得到的結論及規則進行全面優化,使得診斷的結果更為準確與高效。上述案例方法在渦輪機故障診斷過程中進行應用時,可先建立完善的渦輪機故障集,在此基礎上采用模糊集理論對渦輪機故障進行診斷,配合遺傳算法對渦輪機故障規律進行優化,使得最終故障診斷結果更為準確。除遺傳算法與模糊集理論課進行配合使用外,其他各類方法也可以根據設備實際情況進行搭配,使得最終診斷結果更為準確有效。

2結束語

數據挖掘論文范文第5篇

[論文摘要]在電子商務中,數據挖掘有助于發現業務發展的趨勢,幫助企業做出正確的決策。本文對目前電子商務中的Web數據挖掘方法進行了總結,并對電子商務中的Web數據對象進行了分類,對網絡數據挖掘的作用進行了分析,為今后電子商務中實用Web數據挖掘軟件的開發與應用提供了參考。

一、電子商務和數據挖掘簡介

電子商務是指個人或企業通過Internet網絡,采用數字化電子方式進行商務數據交換和開展商務業務活動。目前國內已有網上商情廣告、電子票據交換、網上訂購,網上銀行、網上支付結算等多種類型的電子商務形式。電子商務正以其成本低廉、方便、快捷、安全、可靠、不受時間和空間的限制等突出優點而逐步在全球流行。

數據挖掘(DataMining)是伴隨著數據倉庫技術的發展而逐步完善起來的。數據挖掘主要是為了幫助商業用戶處理大量存在的數據,發現其后隱含的規律性,同時將其模型化,來完成輔助決策的作用。它要求從大量的、不完全的、有噪聲的、模糊的和隨機的數據中,提取人們事先不知道的但又是潛在有用的信息和知識。數據挖掘的過程有時也叫知識發現的過程。

而電子商務中的數據挖掘即Web挖掘,是利用數據挖掘技術從www的資源(即Web文檔)和行為(即We服務)中自動發現并提取感興趣的、有用的模式和隱含的信息,它是一項綜合技術涉及到Internet技術學、人工智能、計算機語言、信息學、統計學等多個領域。

二、Web數據挖掘對象的分類

Web數據有3種類型:HTML標記的Web文檔數據,Web文檔內連接的結構數據和用戶訪問數據。按照對應的數據類型,Web挖掘可以分為3類:

1.Web內容挖掘:就是從Web文檔或其描述中篩選知識的過程。

2.Web結構挖掘:就是從Web的組織結構和鏈接關系中推導知識。它的目的是通過聚類和分析網頁的鏈接,發現網頁的結構和有用的模式,找出權威網頁。

3.Web使用記錄挖掘:就是指通過挖掘存儲在Web上的訪問日志,來發現用戶訪問Web頁面的模式及潛在客戶等信息的過程。

三、電子商務中數據挖掘的方法

針對電子商務中不同的挖掘目標可以采用不同的數據挖掘方法,數據挖掘的方法有很多,主要包括下面3大類:統計分析或數據分析,知識發現,基于預測模型的挖掘方法等。

1.統計分析。統計分析主要用于檢查數據中的數學規律,然后利用統計模型和數學模型來解釋這些規律。通常使用的方法有線性分析和非線性分析、連續回歸分析和邏輯回歸分析、單變量和多變量分析,以及時間序列分析等。統計分析方法有助于查找大量數據間的關系,例如,識別時間序列數據中的模式、異常數據等,幫助選擇適用于數據的恰當的統計模型,包括多維表、剖分、排序,同時應生成恰當的圖表提供給分析人員,統計功能是通過相應的統計工具來完成回歸分析、多變量分析等,數據管理用于查找詳細數據,瀏覽子集,刪除冗余等。

2.知識發現。知識發現源于人工智能和機器學習,它利用一種數據搜尋過程,去數據中抽取信息,這些信息表示了數據元素的關系和模式,能夠從中發現商業規則和商業事實。利用數據可視化工具和瀏覽工具有助于開發分析以前挖掘的數據,以進一步增強數據發掘能力。其他數據挖掘方法,如可視化系統可給出帶有多變量的圖形化分析數據,幫助商業分析人員進行知識發現。

3.預測模型的挖掘方法。預測模型的挖掘方法是將機器學習和人工智能應用于數據挖掘系統。預測模型基于這樣一個假設:消費者的消費行為具有一定的重復性和規律性,這使得商家可以通過分析收集存儲在數據庫中的交易信息,預測消費者的消費行為。按消費者所具有的特定的消費行為將其分類,商家就能將銷售工作集中于一部分消費者,即實現針對四、Web挖掘的作用

通過收集、加工和處理涉及消費者消費行為的大量信息。確定特定消費群體或個體的興趣、消費習慣、消費傾向和消費需求,進而推斷出相應消費群體或個體未來的消費行為,然后對所識別出來的消費群體進行特定內容的定向營銷,節省成本,提高效率,從而為企業帶來更多的利潤。

1.優化Web站點。Web設計者不再完全依靠專家的定性指導來設計網站,而是根據訪問者的信息來設計和修改網站結構和外觀。站點上頁面內容的安排和鏈接就如超級市場中物品的擺放一樣,把相關聯的物品擺放在一起有助于銷售。網站管理員也可以按照大多數訪問者的瀏覽模式對網站進行組織,按其所訪問內容來裁剪用戶與Web信息空間的交互,盡量為大多數訪問者的瀏覽提供方便。

2.設計個性化網站。強調信息個性化識別客戶的喜好,使客戶能以自己的方式來訪問網站。對某此用戶經常訪問的地方,有針對性地提供個性化的廣告條,以實現個性化的市場服務。

3.留住老顧客。通過Web挖掘,電子商務的經營者可以獲知訪問者的個人愛好,更加充分地了解客戶的需要。根據每一類(甚至是每一個)顧客的獨特需求提供定制化的產品,有利于提高客戶的滿意度,最終達到留住客戶的目的。

4.挖掘潛在客戶。通過分析和探究Web日志記錄中的規律,可以先對已經存在的訪問者進行分類。確定分類的關鍵屬性及相互間關系,然后根據其分類的共同屬性來識別電子商務潛在的客戶,提高對用戶服務的質量。

5.延長客戶駐留時間。在電子商務中,為了使客戶在網站上駐留更長的時間就應該了解客戶的瀏覽行為,知道客戶的興趣及需求所在,及時根據需求動態地向客戶做頁面推薦,調整Web頁面,提供特有的一些商品信息和廣告,以使客戶滿意。

6.降低運營成本。通過Web挖掘,公司可以分析顧客的將來行為,進行有針對性的電子商務營銷話動,可以根據關心某產品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率。可以得到可靠的市場反饋信息,降低公司的運營成本。

7.增強電子商務安全。Web的內容挖掘還包括挖掘存有客戶登記信息的后臺交易數據庫。客戶登記信息在電子商務話動中起著非常重要的作用,特別是在安全方面,或者在對客戶可訪問信息的限制方面。

8.提高企業競爭力。分析潛在的目標市場,優化電子商務網站的經營模式,根據客戶的歷史資料不僅可以預測需求趨勢,還可以評估需求傾向的改變,有助于提高企業的競爭力。

五、小結

本文介紹了在電子商務中可以被用來進行數據挖掘的數據源,以及可用于電子商務中的基于Web上的幾種數據挖掘技術。將數據挖掘技術應用于電子商務,對這些數據進行挖掘,可以找出這些有價值的“知識”,企業用戶可以根據這些“知識”把握客戶動態,追蹤市場變化,做出正確的針對性的決策,比如改進網站、向各類用戶推出個性化的頁面,或者向高流失客戶群提供優惠政策進行挽留等等。但是在電子商務中進行Web的數據挖掘時還有很多問題需要解決。例如,如何解決不同國家不同地區存儲Web數據的語義不一致性,如果提供更安全、快捷的服務方面還有很多工作要做。

參考文獻:

[1]郝先臣張德干尹國成趙海:用于電子商務中的數據挖掘技術研究.小型微型計算機系統[J].2007(7)786~787

[2]趙煥平等:WEB數據挖掘及其在電子商務中的應用.福建電腦[J].2008(1)167

[3]石巖:Web挖掘技術在電子商務中的應用.科技情報開發與經濟[J].2006(7)235~236

主站蜘蛛池模板: 德庆县| 吉首市| 西丰县| 酉阳| 邵阳县| 文登市| 青铜峡市| 昌乐县| 莫力| 句容市| 上思县| 迁安市| 泰顺县| 冷水江市| 长寿区| 福安市| 囊谦县| 临猗县| 丽江市| 汕头市| 甘肃省| 温宿县| 巴楚县| 荔浦县| 台北县| 青龙| 浦北县| 浙江省| 岳阳市| 五常市| 河曲县| 正安县| 祥云县| 东乡县| 汉中市| 大关县| 县级市| 盐池县| 金阳县| 华亭县| 旺苍县|