- 相關(guān)推薦
商業(yè)智能軟件在汽車銷售中的應(yīng)用
畢業(yè)論文
[摘要] 本文利用商業(yè)智能軟件IBM DB2 Intelligent Miner建立汽車市場營銷分析的數(shù)據(jù)倉庫模型,并利用決策樹分類技術(shù),對汽車銷售企業(yè)的調(diào)查問卷數(shù)據(jù)進行分析,挖掘出最近1年內(nèi)有購車意愿的客戶的特征。企業(yè)針對這些特征,采取相應(yīng)營銷策略,從而提高營銷的針對性和成功率。
[關(guān)鍵詞] 商業(yè)智能軟件 數(shù)據(jù)挖掘 決策樹
1、 引言
在激烈的市場競爭環(huán)境中,1個企業(yè)如果要生存和發(fā)展,就必需了解市場,了解客戶,樹立“以市場為導(dǎo)向,以客戶為中心”的經(jīng)營理念。汽車銷售企業(yè)作為服務(wù)業(yè)尤其如此,面對瞬息萬變的市場,多變的客戶,應(yīng)用信息技術(shù)為營銷服務(wù),建立客戶關(guān)系管理系統(tǒng)等不失為有效途徑。而數(shù)據(jù)挖掘技術(shù)在客戶分析方面有優(yōu)勢。在營銷過程中市場調(diào)查是10分重要的,市場調(diào)查將為營銷策略,廣告的投放提供依據(jù),面對市場調(diào)查取得的大量紛雜、無序的數(shù)據(jù),利用商業(yè)智能軟件的數(shù)據(jù)挖掘技術(shù)進行處理,將會起到良好的結(jié)果。
2、商業(yè)智能軟件
商業(yè)智能(BI,Business Intelligence),又稱商務(wù)智能,就是1種將數(shù)據(jù)轉(zhuǎn)變?yōu)樾畔、信息轉(zhuǎn)變成知識的工具,并且這種工具能夠在恰當(dāng)?shù)臅r候通過恰當(dāng)?shù)姆绞桨亚‘?dāng)?shù)男畔鬟f給恰當(dāng)?shù)娜。商業(yè)智能定義為下列軟件工具的集合。
1.簡單的查詢和報告工具。專門用來支持初級用戶的原始數(shù)據(jù)訪問,不包括適用于專業(yè)人士的成品報告生成工具。在這1層次,商業(yè)智能僅僅是把信息進行粗加工。
2.在線分析處理。提供多維數(shù)據(jù)管理環(huán)境,其典型的應(yīng)用是對商業(yè)問題的建模與商業(yè)數(shù)據(jù)分析。
3.經(jīng)理信息系統(tǒng)。這類系統(tǒng)的用戶希望能夠在不太費力的情況下,從系統(tǒng)中獲取大多數(shù)信息。
4.數(shù)據(jù)集市和數(shù)據(jù)倉庫產(chǎn)品。包括數(shù)據(jù)清洗、數(shù)據(jù)抽取、轉(zhuǎn)換、載入、數(shù)據(jù)管理和數(shù)據(jù)存取等方面的軟件。
5.數(shù)據(jù)挖掘(Data Mining)軟件。使用諸如決策樹、神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納等技術(shù),用來發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,做出基于數(shù)據(jù)的推斷。數(shù)據(jù)挖掘是通過仔細分析大量數(shù)據(jù)來揭示有意義的新的關(guān)系、模式和趨勢的過程。它使用模式認知技術(shù)、統(tǒng)計技術(shù)和數(shù)學(xué)技術(shù)。 數(shù)據(jù)挖掘的目的是為決策建模,即根據(jù)過去活動的分析預(yù)測將來的行為。比較常見的數(shù)據(jù)挖掘算法有:聚類分析、決策樹、神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納。1般比較好的數(shù)據(jù)挖掘工具都會支持這幾種算法。
3、決策樹與IBM DB2 Intelligent Miner
決策樹方法起源于概念學(xué)習(xí)系統(tǒng),然后發(fā)展了ID3 方法并達到高峰,最后又演化為能處理連續(xù)屬性的C4.5。
決策樹構(gòu)造的輸入是1組帶有類別標(biāo)記的數(shù)據(jù),構(gòu)造的結(jié)果是1棵2叉或多叉樹。2叉樹的內(nèi)部節(jié)點(非葉子節(jié)點)1般表示為1個邏輯判斷,如形式為(ai=vi)的邏輯判斷,其中ai是屬性,vi是該屬性的某個屬性值;樹的邊是邏輯判斷的分支結(jié)果。多叉樹的內(nèi)部節(jié)點是屬性,邊是該屬性的所有取值,有幾個屬性值,就有幾條邊。樹的葉子節(jié)點都是類別標(biāo)記。
構(gòu)造決策樹的方法是采用自上而下的遞歸構(gòu)造。以多叉樹為例,它的構(gòu)造思路是:如果訓(xùn)練數(shù)據(jù)集合中的所有數(shù)據(jù)是同類的,則將之作為葉子節(jié)點,節(jié)點內(nèi)容即是該類別標(biāo)記,否則,根據(jù)某種策略選擇1個屬性;按照屬性的各個取值,把數(shù)據(jù)集合劃分為若干子集合,使得每個子集上的所有數(shù)據(jù)在該屬性上具有同樣的屬性值;然后再依次遞歸處理各個子集。這種思路實際上就是“分而治之”(Divide-and-conquer)的道理。2叉樹的原理與此的差別僅在于要選擇1個好的邏輯判斷。
在生成的決策樹中可以建立1個規(guī)則基。1個規(guī)則基包含1組規(guī)則,每1條規(guī)則對應(yīng)決策樹的1條不同路徑,這條路徑代表它經(jīng)過節(jié)點所表示的條件的1條連接。
IBM的Intenlligent Miner是市場上最強大和最有可伸縮性的工具之1,正在競爭數(shù)據(jù)挖掘工具市場的領(lǐng)導(dǎo)地位,它提供了最廣泛的數(shù)據(jù)挖掘技術(shù)和算法,在數(shù)據(jù)規(guī)模和計算性能方面具有非常高的可伸縮性;Intellligent Miner支持分類、預(yù)測、關(guān)聯(lián)規(guī)則、聚類、順序模式偵測和時間序列分析的算法。Intenlligent Miner支持DB2關(guān)系數(shù)據(jù)庫管理系統(tǒng),并集成了大量復(fù)雜的數(shù)據(jù)操縱函數(shù)。
根據(jù)IDC的統(tǒng)計,Intelligent Miner目前是數(shù)據(jù)挖掘領(lǐng)域最先進的產(chǎn)品。大多數(shù)算法是由IBM研究所研發(fā)出的,是IBM的專有技術(shù),并只存在于Intelligent Miner中。決策樹使用的是CAU算法的2種變種,用以產(chǎn)生1個分類模型并且能夠處理離散和連續(xù)數(shù)據(jù)。
4、決策樹技術(shù)在汽車銷售中的應(yīng)用
下面將就某汽車銷售公司,在汽車展上的調(diào)查問卷進行分析。潛在客戶的數(shù)據(jù)主要有年齡、性別、職業(yè)、收入、教育程度、是否結(jié)婚,是否有房等,調(diào)查客戶是否會在1年內(nèi)買車。數(shù)據(jù)表格式如下:
數(shù)據(jù)清洗試圖填補訓(xùn)練集中的空缺值、識別孤立點、消除噪聲、糾正數(shù)據(jù)中的不1致。對于空缺值的處理,通常有忽略元組、人工填寫空缺值、使用全局常量填充、使用屬性平均值填充、使用與給定元組同1類的樣本平均值填充、使用最可能的值填充等方法。
調(diào)查問卷中,有部分沒有填寫的選項,如年齡屬性,對于這1部分記錄采用的是使用屬性平均值填充的方法。
在進行數(shù)據(jù)挖掘工作之前,需要進行前期的數(shù)據(jù)整理工作,比如根據(jù)直觀經(jīng)驗去除數(shù)據(jù)中的冗余信息或不相關(guān)信息,對于上面的數(shù)據(jù)集中的屬性,像序號等,可以在正式開始數(shù)據(jù)挖掘前去除,因為客戶是否近期內(nèi)買車是我們最關(guān)心的信息,我們把屬性“是否1年內(nèi)買車”即buy作為類標(biāo)簽屬性。
2.生成決策樹,產(chǎn)生規(guī)則。整理后的數(shù)據(jù)導(dǎo)入到DB2關(guān)系數(shù)據(jù)庫表中,使用IBM的Inten1igent Miner提供的數(shù)據(jù)挖掘工具生成決策樹,并剪枝后如下圖。
在得到?jīng)Q策樹之后,可以由其中提取分類規(guī)則,在該例中,可以提取的規(guī)則如下:If Salary =2750~6500 and age=31.5~40.5then buy=y。
也就是說,在剪去1些噪聲枝節(jié)之后,在決策樹的每1條支路上,都可以形成1條分類規(guī)則?梢圆捎眠@些分類規(guī)則,對潛在的客戶數(shù)據(jù)進行分類,由此得出哪些客戶最近有購車的意愿,然后可以主動地向客戶推銷汽車,并且給予1定的優(yōu)惠政策,由被動營銷轉(zhuǎn)變?yōu)橹鲃訝I銷。
3.決策樹結(jié)果分析理解。需要說明的是這203份問卷是在車展中獲取的,來參加車展接受問卷調(diào)查的自然多數(shù)是有買車想法的,因此31.2%愿意買車,這個比例在普通人群中是達不到的。下面我們從產(chǎn)生的決策樹規(guī)則分析1下是否在1年內(nèi)買車與客戶的因素之間的關(guān)系。
(1)收入直接決定了1個人的購買力。salary即月薪在低于2550元的客戶中,汽車是奢侈品,在近期1年內(nèi)沒有購車的意愿;月薪在高于6500元的客戶中,1年內(nèi)也沒有購車的意愿,可以想象高收入人群大多已經(jīng)有車了。
(2)年齡也是導(dǎo)致買車的1個因素。在接受調(diào)查的人群中都在22歲~65歲之間。年輕人中愿意買車的較多,年齡小于31.5歲的人,可能是由于婚姻與購房所困,1年內(nèi)沒有購車的意愿;年齡在31.5歲~40.5歲之間(占82.3%),1般來說這1部分高收入人群不受房子與婚姻狀況所困擾,孩子大多在上中小學(xué),而目前大多數(shù)是獨生子女,社會治安又不太好,在經(jīng)濟條件許可的情況,會考慮買車來接送孩子。因此有近期買車的打算。
(3)愿意買車的多為男性。在低收入的女性中沒有考慮購車問題,但男性如果收入還可以的情況下有近期買車的可能性。
(4)從目前這些數(shù)據(jù)來看,受教育情況、婚否、工作性質(zhì)與是否愿意近期買車影響也不大。
客戶的購買行為還要從多方面進行考慮,我們僅從這幾方面挖掘出外部環(huán)境與客戶的購買行為之間的關(guān)系。在計劃購車的人群中,購車的價位,車的排氣量、車的顏色等也可以進行挖掘;在不打算購車的人群中,不買的原因,也值得分析。
5、結(jié)論
采用決策樹分類算法,通過對調(diào)查數(shù)據(jù)挖掘,得到1系列的分類規(guī)則,然后利用此分類規(guī)則,對潛在客戶進行分析,采取主動營銷,可以降低營銷成本,從而可以提高營銷的成功率。隨著多方面大量數(shù)據(jù)的獲得,商業(yè)智能的數(shù)據(jù)挖掘工具可以挖掘出更有參考價值、易于理解,并具有很高的分類準(zhǔn)確度的規(guī)則為生產(chǎn)實踐服務(wù)。決策樹數(shù)據(jù)挖掘技術(shù)在汽車銷售中也有著廣闊的應(yīng)用前景,值得我們進1步的研究。
參考文獻:
[1]鄭曉紅:商業(yè)智能提升管理信息化[J].商場現(xiàn)代化,2005,(12)
[2]羅海蛟劉顯:數(shù)據(jù)挖掘中分類算法的研究及其應(yīng)用[J].微機發(fā)展,2003,6
[3]白菲孟超英:數(shù)據(jù)挖掘技術(shù)在高校人事信息建設(shè)中的應(yīng)用[J].教育信息化,2005,(09)
[4]譚旭王麗珍卓明:利用決策樹挖掘分類規(guī)則的算法研究[J].云南大學(xué)學(xué)報,2002,6,415~419
[5]潘珩:汽車營銷決策支持系統(tǒng)數(shù)據(jù)倉庫的設(shè)計與實現(xiàn)[J]. 石河子大學(xué)學(xué)報(自然科學(xué)版),2005,(05)
【商業(yè)智能軟件在汽車銷售中的應(yīng)用】相關(guān)文章:
淺析商業(yè)智能在稅收管理中的應(yīng)用03-24
LonWorks及其在智能小區(qū)中的應(yīng)用03-21
紅外遙控在汽車中的應(yīng)用03-19
綜合智能控制技術(shù)在電網(wǎng)規(guī)劃中的應(yīng)用03-26
探析代理記賬中商品軟件的應(yīng)用03-17
現(xiàn)代控制技術(shù)在中藥智能配藥系統(tǒng)中的應(yīng)用03-18
iFIX軟件在計算機中的應(yīng)用03-18