多層線性模型在經(jīng)濟(jì)管理研究探討
[摘 要] 目前國(guó)內(nèi)對(duì)多層線性的應(yīng)用研究多集中在教育、心理學(xué)領(lǐng)域。本文分析了多層線性的核心思想及其在經(jīng)濟(jì)管理研究中應(yīng)用的可行性,總結(jié)HLM在我國(guó)的應(yīng)用。
[關(guān)鍵詞] 多層線性模型(HLM) 經(jīng)濟(jì)管理研究 回歸分析
一、前言
社會(huì)科學(xué)的發(fā)展在很大程度上依賴于研究方法,尤其是統(tǒng)計(jì)方法的進(jìn)步。結(jié)構(gòu)方程模型和多層線性模型作為新一代多元統(tǒng)計(jì)分析技術(shù)已經(jīng)迅速發(fā)展起來,并在社會(huì)科學(xué)領(lǐng)域得到了廣泛的應(yīng)用。多層線性模型的出現(xiàn)主要解決了兩大類問題:第一類是數(shù)據(jù)嵌套問題。在研究中有時(shí)會(huì)遇到帶有層次結(jié)構(gòu)的數(shù)據(jù),令研究人員很難界定分析單位。例如在組織和管理研究中,研究者欲調(diào)查工廠的特征對(duì)工人生產(chǎn)效率的影響。在這種背景下,工人和工廠是分屬于兩個(gè)層面的數(shù)據(jù),作為個(gè)體的工人隸屬于工廠,對(duì)這兩層的數(shù)據(jù)都需進(jìn)行測(cè)量。這種情況下,依然采用普通的回歸分析方法就只能采用兩種方法,將高層變量分解到低層,例如將工廠層指標(biāo)變量分解到員工層面,并在員工層進(jìn)行分析,這樣會(huì)造成在關(guān)注個(gè)體效應(yīng)時(shí)往往忽視組效應(yīng)或環(huán)境效應(yīng),使得在個(gè)體層上得到的變量間的相關(guān)系數(shù)錯(cuò)誤,Ⅰ類錯(cuò)誤被放大。這是由于違反了獨(dú)立觀察的基本假設(shè),得到的標(biāo)準(zhǔn)誤較小,導(dǎo)致T檢驗(yàn)失效。另一種方法是集中數(shù)據(jù)僅在高層進(jìn)行研究。例如將工人層數(shù)據(jù)聚合在一起,在工廠層進(jìn)行分析。這樣做就會(huì)丟失大量重要的個(gè)體層面上的數(shù)據(jù)信息。
另一類是為縱向研究或重復(fù)測(cè)量研究引入了新的方法。例如在對(duì)不同地區(qū)城市近幾年房產(chǎn)價(jià)格的追蹤研究中,研究者可以在近幾年間對(duì)待考察地區(qū)進(jìn)行多次統(tǒng)計(jì),不同年份的統(tǒng)計(jì)數(shù)據(jù)形成了數(shù)據(jù)結(jié)構(gòu)的第一層,而城市之間的個(gè)體差異就形成了第二層。
隨后,可以在第二層中探索不同城市房產(chǎn)價(jià)格增長(zhǎng)方面的差異。
如為何某些城市房?jī)r(jià)的增長(zhǎng)比其他城市快,是哪些因素起了主導(dǎo)作用?還可以進(jìn)一步判斷發(fā)展趨勢(shì)或結(jié)果上的差異是否由個(gè)體變量造成。 目前國(guó)內(nèi)對(duì)多層線性的應(yīng)用研究多集中在教育、心理學(xué)領(lǐng)域,在經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用研究國(guó)內(nèi)還甚少。
二、多層線性模型的核心思想
多層線性模型主要用來處理具有層次結(jié)構(gòu)特點(diǎn)的數(shù)據(jù)。它能夠考慮不同層次的隨機(jī)誤差和變量信息,提供正確的標(biāo)準(zhǔn)誤差估計(jì);得到更有效的區(qū)間估計(jì)與更精確的假設(shè)檢驗(yàn),以及回歸方程中截距和斜率之間的相關(guān)關(guān)系;可以分析重復(fù)測(cè)量的數(shù)據(jù),探討以往關(guān)于同一問題的不同研究結(jié)論是否具有一致性。
我們?cè)谶\(yùn)用傳統(tǒng)的線性回歸模型分析和解決問題時(shí),必須保證所需的數(shù)據(jù)符合四個(gè)基本假設(shè):變量間存在直線關(guān)系,變量總體上服從正態(tài)分布,方差齊性,個(gè)體間隨機(jī)誤差相互獨(dú)立。只有在這些條件下,傳統(tǒng)的回歸系數(shù)的估計(jì)才是有效估計(jì),檢驗(yàn)才是精確檢驗(yàn)。但當(dāng)數(shù)據(jù)帶有層次特征時(shí),不再滿足基本假設(shè)的后兩條,即方差齊性,個(gè)體間隨機(jī)誤差相互獨(dú)立。例如,不同工廠的工人可以假設(shè)相互獨(dú)立,但是同一工廠的工人由于受相同工廠變量的影響,很難保證相互獨(dú)立。此時(shí)隨機(jī)誤差有兩部分構(gòu)成,一部分是工人個(gè)體間差異,另一部分是工廠之間的差異。由此可見傳統(tǒng)的回歸分析方法不再適用。為了滿足四條基本假設(shè),必須將帶有層次特征的數(shù)據(jù)分開在每一層上分析討論。分層以后,第一水平個(gè)體間的測(cè)量誤差相互獨(dú)立,第二水平工廠帶來的'誤差在不同工廠之間相互獨(dú)立。這也就是多層線性模型的核心思想。通過在不同數(shù)據(jù)層次上分別設(shè)立模型,高層變量通過對(duì)低層方程的截距和變量施加影響,從而達(dá)到相互聯(lián)系的目的。從這個(gè)意義上講,也有人將其稱為“回歸的回歸”,但它與普通的“回歸的回歸”在參數(shù)估計(jì)和驗(yàn)證方法上有很大的區(qū)別。多層線性模型使用的參數(shù)估計(jì)方法主要有迭代廣義最小二乘法(IGLS)、限制性的廣義最小二乘估計(jì)(RIGLS)和馬爾科夫鏈蒙特卡羅法。除此之外還有期望最小二乘法(EGLS),廣義估計(jì)方程法(GEE),經(jīng)驗(yàn)貝葉斯估計(jì)等(MCMC)。這些方法在正態(tài)性假設(shè)成立,樣本容量較大時(shí),得到參數(shù)的一致有效的估計(jì)。而大多數(shù)線性分析依靠的是普通最小二乘估計(jì)。
三、多層線性模型在國(guó)內(nèi)外經(jīng)濟(jì)管理研究中的應(yīng)用
Cohen運(yùn)用多層線性模型(HLM)在美國(guó)勞動(dòng)力市場(chǎng)進(jìn)行勞動(dòng)報(bào)酬研究。Cohen在對(duì)“種族,階級(jí)和勞動(dòng)力市場(chǎng)”的研究中,關(guān)注到了美國(guó)大都市的白人工人階級(jí)和種族構(gòu)成的問題。他的研究,否認(rèn)了那種認(rèn)為種族歧視在當(dāng)代的美國(guó)越來越淡化的主流理論,并指出了在黑人聚集區(qū),不論是黑種男性還是女性工人的勞動(dòng)報(bào)酬都比白人明顯要少。并且對(duì)于收入不平等來說,種族影響要遠(yuǎn)遠(yuǎn)大于階級(jí)影響。此外,Cohen與Huffman關(guān)于美國(guó)勞動(dòng)力市場(chǎng)的兩個(gè)研究報(bào)告,分別針對(duì)婦女勞動(dòng)報(bào)酬的貶值和勞動(dòng)報(bào)酬體現(xiàn)出的種族歧視,利用HLM方法進(jìn)行了非常認(rèn)真和客觀的分析。 國(guó)內(nèi)對(duì)于HLM的研究和應(yīng)用還剛剛起步。從收集的現(xiàn)有資料看,實(shí)證研究多集中在教育、心理學(xué)領(lǐng)域。這與教育、心理學(xué)研究領(lǐng)域內(nèi)的數(shù)據(jù)有顯著的層次特性有相關(guān)。國(guó)內(nèi)應(yīng)用HLM在經(jīng)濟(jì)管理領(lǐng)域內(nèi)進(jìn)行實(shí)證分析的研究成果較少,筆者只查閱到一篇論文《高等學(xué)校工資增長(zhǎng)趨勢(shì)研究》。文中利用HLM的兩層發(fā)展模型分析了1997年~2002年某高校教職工工資增長(zhǎng)的個(gè)體差異及影響教職工工資多少和增長(zhǎng)速度的因素。
四、HLM 應(yīng)用的總結(jié)
(1)多層次線性模型雖然整體上是一種新的方法,但同時(shí)也是原有統(tǒng)計(jì)方法的迭加,所包含的常規(guī)統(tǒng)計(jì)方法的原理并沒有被推翻。模型的二層或者更高層依然要做回歸,HLM是多層回歸,采用迭代的方式,應(yīng)用條件更苛刻,所需數(shù)據(jù)量很大!斗謱泳性模型》的作者Bryk和Raudenbush發(fā)現(xiàn),“160個(gè)學(xué)校且每個(gè)學(xué)校約60個(gè)學(xué)生,??數(shù)據(jù)僅可以支持3個(gè)隨機(jī)系數(shù)再加上1個(gè)隨機(jī)截距的估計(jì)”。當(dāng)每個(gè)學(xué)校的學(xué)生數(shù)增加時(shí),自變量也還可以增加。如果利用HLM進(jìn)行縱向追蹤研究,至少需要三次以上的數(shù)據(jù)。數(shù)據(jù)過少無法做出不同觀測(cè)對(duì)象的發(fā)展曲線,而這恰恰是核心部分。
觀測(cè)的次數(shù)越多,多層線性分析的結(jié)果就越可靠。國(guó)內(nèi)研究數(shù)據(jù)的獲取較為困難,大部分學(xué)者的研究主要依賴統(tǒng)計(jì)年鑒上獲得的數(shù)據(jù)?傻玫降臄(shù)據(jù)種類很少,同時(shí)數(shù)據(jù)的準(zhǔn)確性和及時(shí)性較低。
因此,目前國(guó)內(nèi)利用HLM 進(jìn)行實(shí)證研究的較少。
(2)HLM 軟件沒有中文版,對(duì)軟件的使用說明國(guó)內(nèi)甚少。因此,對(duì)于軟件的使用,國(guó)內(nèi)學(xué)者一直處于摸索階段。比如說老版本的HLM(<6.0)不能讀取新版本spss(>11.0)生成的.sav 數(shù)據(jù)格式。而只能降低SPSS版本或者升級(jí)HLM 版本到6.0以上。這些使用中遇到的問題只能慢慢摸索,這也對(duì)國(guó)內(nèi)學(xué)者研究多層線性的應(yīng)用研究產(chǎn)生了阻礙。
參考文獻(xiàn):
[1]蔡永紅 姜勤德:統(tǒng)計(jì)在社會(huì)科學(xué)領(lǐng)域應(yīng)用的新進(jìn)展及反思[J].統(tǒng)計(jì)研究,2006(2)
[2]Philip N. Cohen and Matt L.Huffman. Individuals, Jobs,and LaborMarkets: The Devaluation of Women's Work (Research Report). 2002
[3]李小松等譯:多水平分析模型[M].四川科學(xué)技術(shù)出版社,2000
[4]張雷等:多層線性模型應(yīng)用[M].教育科學(xué)出版社,2003
[5]蓋笑松 張向葵:多層線性模型在縱向研究中的運(yùn)用[J].心理科學(xué)2005,28(2)
[6]劉紅云 孟慶茂:教師背景變量對(duì)教師教學(xué)效果影響的多層線性分析[J].心理發(fā)展與教育.2002(4)
[7]葛建軍:社會(huì)科學(xué)研究中得分層數(shù)據(jù)問題[J].內(nèi)蒙古社會(huì)科學(xué),2004(5)
[8]DorisR. Enewisl,ete..TheGenderGapinMath:ItsPossibleOrininsinNeinhborhood
[9] Effects[J].AmericanSociolonicalReview,Vol.59,No.6,Dec.,1994
【多層線性模型在經(jīng)濟(jì)管理研究探討】相關(guān)文章:
2.探討統(tǒng)計(jì)信息在企業(yè)經(jīng)濟(jì)管理中的應(yīng)用
4.醫(yī)院經(jīng)濟(jì)管理創(chuàng)新探討
6.淺談我國(guó)傳統(tǒng)藝術(shù)線性特征研究論文