- 相關(guān)推薦
移動通信網(wǎng)絡(luò)數(shù)據(jù)采集方法分析論文
摘要:移動互聯(lián)網(wǎng)是移動通信與互聯(lián)網(wǎng)兩個概念結(jié)合的產(chǎn)物。目前移動通信運營商3G、4G技術(shù)的發(fā)展以及Wifi覆蓋范圍的擴大也使得網(wǎng)速越來越快,用戶體服務(wù)需求體驗越來越迫切;想用戶之所想,急用戶之所急的商業(yè)競爭地位思維是需要大量用戶數(shù)據(jù)支撐并分析的前提。因此對用戶數(shù)據(jù)合理采集并不斷發(fā)掘分析,才能滿足移動互聯(lián)網(wǎng)用戶日益增長的智能化需求。
關(guān)鍵詞:移動通信;WAP網(wǎng)關(guān);用戶數(shù)據(jù)
1概述
目前移動通信網(wǎng)絡(luò)飛速發(fā)展,GSM、TD—SCDMA、CDMA2000以及WCDMA各制式無線網(wǎng)絡(luò)基礎(chǔ)設(shè)施升級換代頻繁、核心網(wǎng)3G無線網(wǎng)絡(luò)與核心網(wǎng)絡(luò)與2G網(wǎng)絡(luò)互相兼容兼容性,各地運營商根據(jù)實際需求考慮使用4G、3G與2G三大獨立的無線、接入、核心網(wǎng)絡(luò)并存的局面。在全網(wǎng)同步引入HSDPA和HSUPA技術(shù)的同時,對2G核心網(wǎng)中對原有GPRS/EDGE網(wǎng)絡(luò)升級改造。利用2G網(wǎng)絡(luò)頻率范圍在890—960MHz的穿透性強的優(yōu)勢,不僅減輕3G、4G基站的運維負擔(dān),還可以彌補4G網(wǎng)絡(luò)的覆蓋盲區(qū)。所以在移動通信用戶數(shù)據(jù)采集時不能不考慮現(xiàn)存2G網(wǎng)絡(luò)的豐富數(shù)據(jù)參考價值。隨著ISO和安卓系統(tǒng)的智能手機的大眾化,曾經(jīng)的GPRS技術(shù)里數(shù)據(jù)經(jīng)過WAP網(wǎng)關(guān)的處理逐漸弱化,用戶終端可接入移動網(wǎng)絡(luò)經(jīng)過GGSN網(wǎng)關(guān)連接互聯(lián)網(wǎng)并訪問其內(nèi)容,2G網(wǎng)絡(luò)GPRS數(shù)據(jù)業(yè)務(wù)和EDGE技術(shù)與WAP網(wǎng)關(guān)相連。2G時代,WAP無線協(xié)議互聯(lián)網(wǎng)無直接訪問功能,所以添加WAP網(wǎng)關(guān)是用戶上網(wǎng)。智能手機之前的Symbian系統(tǒng)處理能力不及PC主機,無論是網(wǎng)速還是現(xiàn)實視頻、音頻、互動性媒體、發(fā)布主題等等都與寬帶互聯(lián)網(wǎng)甚至光纖入戶的PC家用主機電腦無法匹敵,在2。5G時代,GSM通信系統(tǒng)中的配套設(shè)備模塊中的WAP網(wǎng)關(guān)只能根據(jù)MS手機終端的應(yīng)別能力進行通信網(wǎng)與互聯(lián)網(wǎng)的交[1]。
2移動通信網(wǎng)絡(luò)數(shù)據(jù)
移動互聯(lián)網(wǎng)在2G/3G時代,核心網(wǎng)是兩個獨立的域,控制語音相關(guān)的叫電路域(CS域:CircuitSwitch),控制數(shù)據(jù)業(yè)務(wù)相關(guān)的叫分組域(PS域:PacketSwitch)。相應(yīng)的,與語音相關(guān)的控制都放在了電路域,比如上面的語音呼叫建立、返回振鈴、判斷并執(zhí)行呼叫轉(zhuǎn)移,業(yè)務(wù)短信等等。與數(shù)據(jù)相關(guān)的控制則放在了分組域,比如上面的與因特網(wǎng)服務(wù)器(通信網(wǎng)與因特網(wǎng)是兩張網(wǎng))建立數(shù)據(jù)連接、區(qū)分當前流量是微信還是微博等等。自2G時代以來WAP網(wǎng)關(guān)是承載移動數(shù)據(jù)業(yè)務(wù)的網(wǎng)元。
2。1用戶數(shù)據(jù)
移動通信的空間自由度與互聯(lián)網(wǎng)的內(nèi)容形式豐富結(jié)合處移動互聯(lián)網(wǎng)的新品種。目前移動通信運營商3G、4G技術(shù)的發(fā)展以及Wifi覆蓋范圍的擴大也使得網(wǎng)速越來越快,用戶體服務(wù)需求驗越來越迫切;用戶數(shù)據(jù)分為兩種:一種是用戶注冊信息將自己的身份識別與手機號碼相關(guān)聯(lián),在信息層面上存入數(shù)據(jù)庫,咋數(shù)據(jù)層面上存入HLR中為通信系統(tǒng)的呼叫、尋址、和計費分配信道等工作提供服務(wù);另一種是指通過無線基站近乎于log日志的形式,使用戶主觀意愿被動或不知情的前提下在系統(tǒng)存儲設(shè)備上記錄用戶位置更新,小區(qū)切換,小區(qū)重選等為用戶提供的移動通信服務(wù)功能。這類數(shù)據(jù)的產(chǎn)生不由用戶的主觀意愿為選擇,是為了完成一次通信系統(tǒng)用戶漫游的一個必要手段和環(huán)節(jié),但是在數(shù)據(jù)分析挖掘研究者看來,是有著非常意義的數(shù)據(jù)內(nèi)容,通過數(shù)據(jù)的數(shù)據(jù)清洗:去重、去噪聲、去錯誤、插值等異常處理;數(shù)據(jù)集成:統(tǒng)一單位、去掉冗余、選擇感興趣屬性列;數(shù)據(jù)變換:數(shù)值歸一化、離散化處理;數(shù)據(jù)脫敏:去隱私化,截斷與加密;數(shù)據(jù)演繹:特征構(gòu)造,根據(jù)原有的一個或多個特征創(chuàng)建出新的特征并填充。獲得群體用戶的地理位置特征,在不同時段的移動基站下的人流密度,繪制出人口出行交通時段的密度可視化圖等等,通過對用戶數(shù)據(jù)不斷發(fā)掘分析,才能滿足移動互聯(lián)網(wǎng)用戶日益增長的智能化需求。
2。2數(shù)據(jù)分析
在3。5G的LTE網(wǎng)絡(luò)體系架構(gòu)中,WAP/Web網(wǎng)關(guān)處在PGW后與外網(wǎng)互通,功能等同于PDSN,其余接口并沒有什么功能變化。經(jīng)過BTS(基站)、傳輸設(shè)備、BSCRNC等至PDSN(分組數(shù)據(jù)支持節(jié)點),在2G網(wǎng)絡(luò)中發(fā)至WAP網(wǎng)關(guān)的數(shù)據(jù)分流發(fā)至智能設(shè)備;由設(shè)備開啟用戶TCP連接,解析主機的URL用戶請求、判斷、處理,經(jīng)過鑒權(quán)處理合法用戶,允許通過防火墻轉(zhuǎn)達請求接至互聯(lián)網(wǎng)提供鏈路連接分配IP地址提供服務(wù),如果是欠費或非法用戶拒絕原服務(wù)請求。從移動互聯(lián)網(wǎng)的智能手機應(yīng)用端的使用業(yè)務(wù)流量角度來分析,用戶通過終端經(jīng)過移動互聯(lián)網(wǎng)接入Internet網(wǎng)絡(luò)不同的APP有不同的流量特征,例如連接應(yīng)用程序:電子郵件、即時通訊、GPS導(dǎo)航、遠程訪問;商業(yè)應(yīng)用程序:移動銀行服務(wù)、股市跟蹤與交易、文件處理及日程規(guī)劃;日常生活類應(yīng)用程序:電子商務(wù)、賬單支付、健康監(jiān)測、數(shù)字閱讀與社交;娛樂應(yīng)用程序:新聞、游戲、多媒體播放器、照片及視頻編輯器。
3研究方法
3。1數(shù)據(jù)流收集器
部署于SGSN和GGSN之間,并且不僅僅移動電話產(chǎn)生的流量會被記錄,上網(wǎng)卡所產(chǎn)生的流量也會被記錄。流量記錄中包含了時間、手機號、服務(wù)器IP、數(shù)據(jù)傳輸大小、數(shù)據(jù)類型等信息。本課題根據(jù)這些信息建立了流量權(quán)值圖(簡稱流量圖)。其中,手機號和服務(wù)器IP分別對應(yīng)流量圖中的不同節(jié)點,手機號向服務(wù)器IP的數(shù)據(jù)傳輸代表了流量圖的邊,從服務(wù)器—IP到手機號是流量圖中對應(yīng)邊的方向,數(shù)據(jù)傳輸大小代表了流量圖中邊的權(quán)值。通過上述對應(yīng)方法,為不同類型的流量數(shù)據(jù)建立了各自的流量圖。并在流量圖的基礎(chǔ)上,對網(wǎng)絡(luò)流量傳輸數(shù)據(jù)進行了分析。
3。2技術(shù)路線
SGSN與無線分組控制器之間同過Gb口連接,實現(xiàn)移動數(shù)據(jù)的管理;與歸屬位置寄存器通過Gr口連接,實現(xiàn)對用戶數(shù)據(jù)庫的訪問控制;與GGSN通過Gn口連接,進行IP數(shù)據(jù)包的傳輸以及協(xié)議變換。本文通過部署Gb接口(SGSN與BSS之間)的PC端截取數(shù)據(jù)流之后,用網(wǎng)絡(luò)爬蟲軟件對數(shù)據(jù)進行初步的收集。Gb接口是傳遞轉(zhuǎn)達SGSN和BSC之問的信令和用戶數(shù)據(jù)的功能。用戶通過移動終端將請求發(fā)給BTS,再通過基站子系統(tǒng)連接傳輸網(wǎng)絡(luò),Gb接口是終端入網(wǎng)的必經(jīng)接口。本文是從Gb接口攔截移動互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù),并對數(shù)據(jù)盡情分類,聚類等數(shù)據(jù)挖掘方面的研究[2]。原始數(shù)據(jù)由Gb接口得到,進行深層次的分析,不僅能夠?qū)崟r地了解當前的網(wǎng)絡(luò)質(zhì)量,還能發(fā)現(xiàn)移動用戶的網(wǎng)絡(luò)行為。以SGSN作為研究對象,GPRS是GPRS服務(wù)節(jié)點(ServiceGPRSSupportNode)是移動通信核心網(wǎng)的重要組成部分,也是分組交換的核心部分。研宄流經(jīng)具體SGSN的網(wǎng)絡(luò)業(yè)務(wù)流量、接入用戶數(shù)以及訪問記錄數(shù)的情況,以此來表征網(wǎng)絡(luò)中具體節(jié)點的業(yè)務(wù)情況[3]。
4結(jié)語
當前的三代移動通信系統(tǒng)(2G3G4G)并存的移動互聯(lián)網(wǎng)環(huán)境中,移動互聯(lián)網(wǎng)流量中雖然WAP流量不能構(gòu)成主流的移動用戶流量的主要組成部分,原有的WAP內(nèi)容正逐漸被WEB內(nèi)容所代替。本文所研究在移動互聯(lián)網(wǎng)環(huán)境下,關(guān)于個人用戶數(shù)據(jù)隱私保護的數(shù)據(jù)挖掘相關(guān)問題。采取從基礎(chǔ)的移動互聯(lián)網(wǎng)機制下的顯示存在的“混搭”網(wǎng)絡(luò)為數(shù)據(jù)研究出發(fā)點,深入分析地研究不同代移動通信系統(tǒng)所組成的網(wǎng)絡(luò)中產(chǎn)生的互聯(lián)網(wǎng)用戶數(shù)據(jù)。針對每個個人為基本單位內(nèi)容,采用“理論建!椒ㄕ撟C→實驗認證”的研究方法。隨著移動數(shù)據(jù)接入的蓬勃發(fā)展,WAP網(wǎng)關(guān)面臨著各種問題。但是作為數(shù)據(jù)分析方,需要的是廣而全的數(shù)據(jù),數(shù)據(jù)挖掘用戶行為不是僅僅需要少數(shù)服從多數(shù)的統(tǒng)計,無論是Symbian系統(tǒng)的MS移動終端使用GPRS技術(shù)通過WAP網(wǎng)關(guān)訪問WML語言編寫的網(wǎng)站,還是早已去電路域依靠軟交換全網(wǎng)IP化實現(xiàn)核心網(wǎng)部分的網(wǎng)關(guān)轉(zhuǎn)接傳遞,每一個bit流量都代表這一個用戶一個群體的價值與意義。所以現(xiàn)網(wǎng)并存的三代移動通信系統(tǒng)的數(shù)據(jù)全面采集的多樣性,才能展現(xiàn)其內(nèi)在隱藏的特征,才是正確的得到數(shù)據(jù)揭示真理的第一步。
參考文獻
[1]王璐。移動互聯(lián)網(wǎng)用戶行為分析[D]。重慶:重慶郵電大學(xué),2013:86。
[2]趙其朋。WAP網(wǎng)關(guān)應(yīng)對移動互聯(lián)網(wǎng)大流量的改造及演進[J]。廣州:移動通信,2014:16。
[3]李威。移動互聯(lián)網(wǎng)用戶行為分析研究[D]。北京:北京郵電大學(xué)2012:82。
【移動通信網(wǎng)絡(luò)數(shù)據(jù)采集方法分析論文】相關(guān)文章:
移動通信網(wǎng)絡(luò)優(yōu)化大數(shù)據(jù)分析論文09-22
通信網(wǎng)絡(luò)監(jiān)控大數(shù)據(jù)分析論文10-03
大數(shù)據(jù)技術(shù)在移動通信網(wǎng)絡(luò)優(yōu)化的運用論文06-09
移動通信網(wǎng)絡(luò)協(xié)作通信分析10-14
數(shù)據(jù)通信網(wǎng)絡(luò)維護與網(wǎng)絡(luò)安全分析論文10-29
無線網(wǎng)移動通信數(shù)據(jù)傳輸性能分析論文10-23
數(shù)據(jù)挖掘技術(shù)在移動通信網(wǎng)絡(luò)的應(yīng)用07-05
一種新的移動通信網(wǎng)絡(luò)路測數(shù)據(jù)的可靠性分析方法10-24