上傳人:地**
編號:1194605
2024-09-20
9頁
96KB
1、(一)立項依據與研究內容 1.項目的立項依據多層(水平)統計模型(multilevel statistical models)是二十世紀80年代中后期發展起來的一門多元統計分析新技術,其是針對經典統計技術(方差分析或普通線性回歸等)在處理具有多層結構的數據時所存在的局限、以及可能產生的對分析結果的曲解而提出的。多層統計模型通過對不同層次的變量分層計算( 誤差按層次分解為: 由第一層個體間差異帶來的, 和由第二層組織間差異帶來的, 并假設第一層個體間的測量誤差相互獨立, 第二層組織帶來的誤差在不同組織之間相互獨立)解決了具有層結構數據中個體水平和社會組織水平的變量對個體行為的不同影響。具有層結構2、的數據在組織研究、經濟研究以及管理研究等領域廣泛存在。如,探討企業績效的影響因素, 常常考慮的企業的經營規模、產權結構、公司治理機制、以及企業所屬行業的產值、信息化程度、市場化程度等,這些變量分別來自兩個不同的層, 即企業(個體)業第一層和產業(社會組織)第二層。多層統計模型已成為當前國際上統計學研究中一個新興而重要的領域,已廣泛應用于教育、心理、文化、經濟、管理等領域1。(1)國內外研究現狀及發展動態分析具有層次結構特征數據(hierarchically structured data)的統計理論的發展能漸趨成熟,應歸功于多位統計學家的貢獻。其中,Lindley及Smith(1972)2、S3、mith(1973)3在研究線性模式的貝氏估計(Bayesian estimation of linear models)時即對于具有復雜誤差結構的巢狀數據的分析有著濃厚的興趣,但受限于當時估計的瓶頸而無法突破。其后Dempster,Laird,及Rubin(1977)所推倒的EM估計法,則對于HLM之估計技術提供了決定性的突破4。之后,Aitkin(1981)對教學風格的資料引入了層結構重新分析應該是實質性地解決層次結構數據理論的開始5。隨著研究的深入,多層模型在估計方法與檢驗、模型的形式以及應用方面形成各自的體系。1)模型的估計方法與檢驗。Laird (1982)給出了多層模型中隨機效應的4、判定方法6;Strenio(1983)給出了多層統計模型的Bayes 估計或叫收縮估計法(shrinkage estimator)方法7;Goldstein(1986)給出了運用迭代廣義最小二乘法算法的極大似然估計(maximum likelihood, REM)多層模型的參數8;李曉松(1999)探討了兩個水平層次結構的數據擬合方差成份模型與線性回歸模型的關系21;石磊(2008)研究了多水平模型下基于均值漂移模型的異常點探測問題22;Sinha(2009)用自助法進行參數估計,通過模擬研究得到小區域估計的穩定性16;Kauermann(2009)利用懲罰似然估計法(penalty quas5、i-likelihood,PQL)討論了樣條基隨著樣本規模改變時懲罰樣條光滑的漸進特性17;Nie等(2009)比較了極大似然估計、限制極大似然估計(restricted maximum likelihood, REML)以及貝葉斯方法在多正太變量下的方差參數的估計18。2)模型的形式。Raudenbush (1991)建立了多因變量的多層模型9;Goldstein(1991)建立了離散變量的多層模型10;Consul(1992)建立了多層Poisson回歸模型(Multilevel Poission Regression Model) 11;Raudenbush (1993)建立了交叉分類的6、多層模型12;Muthen1994)建立了多層結構方程模型13; Agresti(2000)建立了多層Logistic回歸模型(Multilevel Logistic Regression Model)、多層多項Logit模型(Multilevel Multinomial Logit Model)14;Carpenter(2003)針對二層樣本較少情況,建立了自助法的多層模型(bootstrap multilevel modeling)15;劉殿國(2009)建立適合處理二層連續型小樣本數據的累加方法的多層統計模型23;Goldstein(2011)對多因變量與交叉分類數據多層模型進行詳細的討7、論1;Ibrahim等(2011)用極大懲罰似然估計方法討論一般混合效果模型中的固定與隨機效果的選擇19;Di1等(2011)建立了具有狄利克雷混合分布的多層潛變量模型20。3)模型的應用。國外已將多層統計模型廣泛應用社會學、教育學、人口學、心理學、經濟學以及管理學等社會科學中1。國內的應用由楊菊華(2006)把多層模型應用到社會學研究24;郭志剛(2007)把多層模型應用到人口科學研究25;劉澤云(2007)把多層模型應用到教育研究中等領域26;逐漸擴展到經濟管理中,如,伊志宏等(2008)運用多層統計模型研究了地方經濟發展與企業資本結構選擇27;劉殿國等(2009)運用累加方法的多層統計模8、型研究了香蕉組織的績效 28;楊鑫等(2010) 基于中國上市公司,運用三層線性模型研究了戰略群組對企業績效的影響29;王天夫等(2010)利用多層線性模型研究了行業對個人收入的影響30;王克林(2011)應用多層統計模型以宏觀層面的地區人均可支配收入和是否為發達地區虛擬變量作為二層變量解釋家庭消費跨地區的差異31;顧乃華(2011)運用多層線性模型探討中國以省級政府為“第一行動集團”的中間擴散性型制度變遷,對中國城市化和服務業互動發展產生的影響32;游達明等(2011)基于多層線性模型的就業影響因素研究33;石磊等(2011)應用兩水平發展模型研究西部民族地區農戶家庭的物質資本、人力資本以及9、就業結構調整對其家庭人均收入及其增長的影響34。需要指出,多層統計模型對一層與高層數據樣本規模都有一定的要求,但對一層有一定樣本規模,高層數據樣本規模較小的情況,利用自助多層統計模型可以得到解決;而對所有一層數據都較少的情況,多層模型難以解決。累加方法的多層統計模型能夠處理連續型的所有一層數據都是小樣本的情況,但不能處理交叉分類數據。因此,多層統計模型和已建立的累加方法的多層統計模型不能處理所有一層數據都是小樣本的交叉分類數據、離散型因變量數據以及具有三層結構數據。而實際上,中國香蕉產業組織的誕生只是近幾年的事,而且同類型組織同期也不多,因此每種組織無論是截面數據還是時間數據都較少,即香蕉組織10、的發展是小樣本數據。香蕉組織的發展中也存在著香蕉組織的規模與香蕉種植地區的交叉分類,每個組織都有是否已經貸款以及參加技術培訓的次數、貸款比例等離散變量數據,香蕉組織每年的投入產出、香蕉組織自身的組織形式、香蕉組織所屬的省域構成三層結構。交叉分類的組織中產量、產值的預測、一般組織中的影響技術培訓的次數、貸款比例的因素、各省的經濟環境如何影響香蕉組織的發展等問題都需要解決。因此,研究交叉分類數據、離散型因變量數據以及具有三層結構數據的小樣本多層統計模型不僅具有理論意義,而且具有較強的實際意義。本項目中涉及到的定義,交叉分類累加方法的多層統計模型是指交叉分類累加方法所有一層數據都是小樣本的多層統計模11、型。合并方法的多層統計模型分為合并連續型因變量多層統計模型和合并離散型因變量多層統計模型。合并連續型因變量多層統計模型是指合并方法連續型因變量所有一層數據都是小樣本的多層統計模型。合并離散型因變量多層統計模型是指合并方法離散型因變量所有一層數據都是小樣本的多層統計模型。(2)研究意義1)理論意義擬建立的交叉分類累加方法與合并方法的多層統計模型理論將解決多層統計模型和已建立的累加多層統計模型不能處理所有一層數據都是小樣本的交叉分類數據、離散型變量數據、具有三層結構數據以及灰色系統模型理論只能處理單層數據的問題。因此,交叉分類累加方法與合并方法的多層統計模型理論是多層統計模型理論、累加方法的多層統12、計模型以及灰色系統模型理論的新發展。應用交叉分類累加方法與合并方法的多層統計模型理論對中國香蕉產業組織的研究,將得到香蕉產業組織的計量理論。而香蕉產業組織是農業組織的一部分,對于香蕉產業組織系統化的數量評價方法將較容易地推廣到農業組織上去。從而將有利于建立一個新的學科農業組織計量學。2)實踐意義應用交叉分類累加方法與合并方法的多層統計模型理論對中國香蕉產業組織的研究,將得到系統化的香蕉產業組織體系以及各要素間的數量評價。根據實證結果的中國香蕉產業組織發展的合理化建議,將成為中國香蕉產業組織發展的有利依據。另外,香蕉產業組織研究的數量化評價結果,對農業組織研究將有一定的啟示作用。而農業組織化問題13、是解決三農問題必須面對的核心問題之一,因此,該項目的研究將有利于三農問題向著更精細化地解決方向發展。(3)主要參考文獻目錄1 Goldstein H. Multilevel Statistical Model (4rd.)M.Sydney: Edward Arnold ,2011:179-187.2 Lindley D V, Smith A F M. Bays estimation for the linear modelJ.Journal of the Royal Statistical Society(Series B),1972,34:1-41.3 Smith A F M. A gene14、ral Bayesian linear model J. Journal of the Royal Statistical Society (Series B)1973,35:61-75.4 Dempster, Laird, Rubin. Maximum likelihood from incomplete data via the EM algorithmJ.Journal of the Royal Statistical Society(Series B),1977,39:1-8.5 Aitkin M, Anderson D and Hinde J. Statistical modelli15、ng of data on teaching stylesJ. Journal of the Royal Statistical Society(Series A),1981,144,148-161.6 Laird N M & Ware H. Random-effects models for longtitudinal dataJ. Biometrics, 1982, 38:963-974.7 Strenio J L F, Weisberg H I & Bryk A S Empirical Bayes estimation of individual growth curve paramet16、er and their relation ship to covariatesJ.Biometrics, 1983,39:71-86.8 Goldstein H. Multilevel mixed linear model analysis using iterative generalised least squaresJ.Biometrika, 1986,73, 43-56.9 Raudenbush S W, Rowan B & Kang S J.A multilevel multivariate model for studying school climate with estima17、tion via the EM algorithm and application to U.S. high school dataJ. Journal of Educational Statistics,1991,16(4),295-330.10 Goldstein H. Nonlinear multilevel models with an application to discrete response dataJ.Biometrika, 1991,78, 45-51.11 Consul P C & F Famoye. Generalized Poisson regression mod18、elJ.Communications in Statistics: Theory and Methods,1992,21:89-109.12 Raudenbush S W. A crossed random effects model for unbalanced data with applications in cross sectional and longitudinal researchJ.Journal of Educational Statistics, 1993,18,321-349.13 Muthen B. multilevel covariance structure an19、alysisJ.Sociological Methods & Research,1994,22:376-389.14 Agresti A J G, Booth J P Hobert & B Caffo. Random-efffects modeling of categorical response dataJ. Sociological Methodology,2000,30:27-80.15 Carpenter J M., H Goldstein & J Rasbash A novel bootstrap procedure for assessing the relationship b20、etween class size and achievementJ. Applied Statistics,2003,52: 431-443.16 Sinha S K , Rao J N K. Robust small area estimationJ. Canadian Journal of Statistics. 2009, 37:381-399.17 Kauermann G, Krivobokova T, Fahrmeir L. Some asymptotic results on generalized penalized spline smoothingJ. Journal of 21、the Royal Statistical Society:(Series B),2009,71:487-503.18 Nie L, Chu H, Feng S. Estimating variance parameters from multivariate normal variables subject to limit of detection: MLE, REML, or Bayesian approaches? J. Statistics in Medicine,2009,28:2605-2616.19 Ibrahim J G, Zhu H, Garcia R .Fixed and22、 Random Effects Selection in Mixed Effects ModelsJ. Biometrics,2011,67:495-503.20 Chong-Zhi Di1, and Karen Bandeen-RocheMultilevel Latent Class Models with Dirichlet Mixing DistributionJ. Biometrics,2011,67:86-96.21 李曉松,倪宗瓚.兩水平方差成分模型與線性回歸模型關系的探討J.中國衛生統計,1999,(2):14-1622 Shi L and C hen G .Case delet23、ion diagnostics in multilevel models J.Journal of Multivariate Analysis,2008, 99(9): 1860-1877.23 劉殿國,徐兵.多變量整體模式累加多層統計模型的建立及其在組織績效上的應用研究J.數理統計與管理,2009,(5):869-878.24 楊菊華.多層模型在社會科學領域的應用J.中國人口科學,2006,(3):44-51.25 郭志剛.對2000 年人口普查出生性別比的分層模型分析J.人口研究,2007,(3):20-31.26 劉澤云. 農村兒童為何失學?基于多層模型的經驗研究J.北京師范大學學報(社24、會科學版),2007,(2):73-80.27 伊志宏曹,曹淮揚,劉輕舟.地方經濟發展與企業資本結構選擇來自上市公司的經驗J.經濟管理,2008,(13):75-79.28 劉殿國,陳守東.冪整體模式累加多層統計模型的建立及應用J.統計與決策, 2009,(5):25-2729 楊鑫,金占明.戰略群組的存在性及其對企業績效的影響基于中國上市公司的研究J.中國軟科學,2010,(7):112-124.30 王天夫,崔曉雄.行業是如何影響收入的基于多層線性模型的分析J.中國社會科學,2010,(5):165-180.31 王克林,劉建平. 多階模型在地區消費差異研究中的應用J.統計研究,2011,25、(1):84-90.32 顧乃華.城市化與服務業發展:基于省市制度互動視角的研究J. 世界經濟,2011,(1):126-142.33 游達明,楊曉輝,楊立等。基于多層線性模型的就業影響因素研究J.統計與決策,2011,(3):41-44.34 石磊,向其鳳,張炯.物質資本、人力資本、就業結構與西部民族地區農戶收人增長J.數理統計與管理,2011,(6):1030-1038.2.項目的研究內容、研究目標,以及擬解決的關鍵科學問題。(此部分為重點闡述內容)(1)項目的研究內容本項目研究交叉分類累加方法與合并方法的多層統計模型理論,并應用之到中國香蕉產業組織的發展中。首先,對具有層結構的小樣本數據26、的表示形式進行轉化研究;其次,針對不同的轉化形式建立相應的小樣本多層統計模型;最后,將交叉分類累加方法與合并方法的多層統計模型理論應用于中國香蕉產業組織發展中。具體的研究內容如下:1)數據表示形式的轉化。利用數據累加與合并的方法對于具有層結構小樣本數據的表示形式進行轉化。運用累加方法對具有二層結構交叉分類以及具有三層結構連續型的小樣本數據的表示形式進行轉化;探索多層小樣本數據的合并規則,選擇適當的合并規則合并數據,構建數據合并后的表示形式。2)交叉分類累加方法的多層模型理論研究。對于采用累加方法轉化的交叉分類二層結構的連續型數據,按累加多層統計模型的方法建立交叉分類數據的累加多層統計模型的表示27、形式和相應的假設;運用模擬研究方法比較模型的限制性最大似然法(REML)、經驗貝葉斯估計法或收縮估計法、自助法多層模型估計結果的AIC、BIC、MAPE值,確定合適的估計方法;研究估計結果怎樣預測、評價原始數據(累加前的數據);將累加方法的二層模型推廣到累加方法的三層模型。3)合并連續型因變量多層模型理論研究。對于合并后的具有二層結構的連續型數據,建立連續型因變量二層模型的表示形式和相應的假設;運用模擬研究方法比較模型的限制性最大似然法(REML)、經驗貝葉斯估計法或收縮估計法、自助法多層模型估計結果的AIC、BIC、MAPE值,確定合適的估計方法;研究估計結果怎樣預測、評價原始數據(合并前的28、數據);將合并連續型因變量二層模型推廣到合并連續型因變量三層模型。4)合并離散型因變量多層模型理論研究。對于合并后的具有二層結構的離散型數據,建立合并多層Logistic回歸模型、合并多層累積Logistic回歸模型、合并多層多項Logit模型、合并多層泊松回歸模型的形式與假設;運用模擬研究方法比較模型的懲罰性準似然估計PQL)、限制性/殘差虛擬似然法(REPL)、限制性最大似然法(REML)、最大似然法(ML)估計結果的AIC、BIC、MAPE值,確定合適的估計方法;研究估計結果怎樣預測、評價原始數據(合并前的數據);將合并離散型因變量二層模型推廣到合并離散型因變量三層模型。5)交叉分類累加29、方法的多層模型在中國香蕉產業組織發展中的應用研究。運用隨機抽樣調查方法確定欲調查的香蕉產業組織,收集每個確定的香蕉產業組織從其誕生起各年的相應數據。以中國香蕉產業組織績效(用畝產值或產量等)作為一層因變量;以種植人員特征(人員數量、種植年限與文化程度等)、物質投入(生產過程中的各項物資消耗總和)、貸款、土地成本(收獲面積)、風險因素等作為一層預選自變量;以規模(種植面積)、組織形式(“蕉農+蕉農”、“香蕉專業戶+蕉農”、“公司+蕉農” 等多種組織模式)、有無專職管理人員、結構變量(香蕉收入占總收入比重、貸款占總投入的比重)等作為預選二層變量;以所屬市縣相對量(農業財政投入投資占總投入的比重、農30、業科技投入、農產品出口)等作為預選三層變量。運用累加方法的三層統計模型,綜合考慮模型擬合、假設檢驗以及模型比較等結果,確定合適的二、三層變量,對組織績效進行預測并對其他變量對績效的影響進行探討;運用交叉分類累加方法的二層模型探討交叉分類數據的績效的預測以及其他變量對績效的影響;依據實證分析的結果提出有力于績效提高、組織體系的建設等建議。6)合并方法的多層模型在香蕉產業組織發展中的應用研究。對連續型因變量用5)中變量,運用合并方法的多層模型,確定合適的二、三層變量,探討績效的預測、其他變量對績效的影響、不同組織的異質性以及高層變量對異質性的解釋程度。對離散因變量,一層自變量和高層變量用5)中的變31、量。對每個組織貸款(是、否)等二分類變量做因變量的影響因素分析用合并多層Logistic回歸模型研究;對施肥技術(1.感觀、2.經驗、3.測土)等順序變量做因變量的影響因素分析用合并數據多層累積Logistic回歸模型研究;對技術選擇等多分類變量做因變量的影響因素分析用合并數據多層多項Logit模型研究;對參加技術培訓的次數、貸款比例等計數(比例)的變量做因變量的影響因素分析用合并數據多層泊松(poission)回歸模型研究。確定合適的二、三層變量,探討其他變量對離散因變量的影響、不同組織的異質性以及高層變量對異質性的解釋程度。依據實證分析的結果提出有力于績效提高、技術的優化選擇、技術培訓、組32、織體系的建設等建議。(2)研究目標1)給出適合多層小樣本數據表示形式轉化的方法;2)建立累加方法的三層統計模型理論以及交叉分類累加方法的二層統計模型理論;3)建立合并連續型因變量多層統計模型理論;4)建立合并離散型因變量多層統計模型理論;5)用累加方法的多層模型實證分析中國香蕉產業組織績效;提出中國香蕉產業組織高效發展的建議。6)用合并方法的多層統計模型實證分析中國香蕉產業組織發展;提出有力于績效提高、技術的優化選擇、技術培訓、組織體系的建設等建議。(3)擬解決的關鍵科學問題1) 數據表示形式的轉化方法。通過累加方法尋找小樣本數據的規律性;通過恰當的規則合并數據,就相當于適當地擴大了樣本規模。33、有了規律就可以用少量的數據解決實際問題;有了規模就可以用多層統計模型解決問題。因此數據的轉化非常關鍵。2) 合適估計方法的選擇。對大樣本數據使用各種估計方法,估計結果基本相同;而小樣本估計的精確程度隨著估計方法的不同而不同。因此估計方法的選擇非常關鍵。3)估計結果怎樣預測、評價以及分析原始數據。由于估計的結果是對經過累加與合并轉化后的數據做出的,因此怎樣用估計的結果解決原始數據也是一個關鍵問題。4)合適二、三層變量的選擇方法。在香蕉產業組織的實際應用中,選擇合適的二、三層變量才能夠得到合乎實際的實證結果。而合適變量的選擇需要綜合考慮數據的可得性、模型擬合、假設檢驗以及模型比較等結果。因而,依據34、怎樣的邏輯整理各種方法是一個關鍵問題。3.擬采取的研究方案及可行性分析(1)研究方法本項目綜合使用如下方法:1)運用累加方法和合并方法轉化數據的表示形式;2)運用累加方法的多層統計模型的建模方法建立交叉分類累加二層統計模型模型以及一般數據的累加三層計模型;3)運用多層統計模型方法建立合并離散型因變量與合并連續型因變量多層統計模型;4)運用模擬研究方法確定合適的參數估計與檢驗方法;5)運用隨機抽樣調查法收集中國香蕉產業組織發展的有關數據;6)運用實證分析方法研究中國香蕉產業組織發展。運用交叉分類累加方法的二層統計模型模型、累加方法的三層計模型、合并連續型因變量多層統計模型、合并離散型因變量多層統35、計模型研究中國香蕉產業組織的發展;7)運用規范分析法對中國香蕉產業組織發展提出合理化建議。(2)技術路線 在綜述國內外相關文獻基礎上,提煉出建立交叉分類累加方法與合并方法的多層統計模型理論是一個值得研究的問題。首先,利用數據累加與合并方法轉化多層數據的表示形式。其次,分別建立交叉分類累加方法的多層統計模型以及合并方法的多層統計模型理論:研究系列模型(多層Logistic回歸模型、多層泊松回歸模型等)的表示形式;在限制性最大似然法(REML)、收縮估計法、懲罰性似然估計(PQL)等方法中通過模擬研究選擇合適的參數估計方;研究估計的結果怎樣預測、評價原始數據。最后,應用交叉分類累加方法與合并方法的36、多層統計模型研究中國香蕉產業組織發展。圖1 技術路線圖(3)關鍵技術1) 多層統計模型的分析技術。本研究主要應用HLM、MLwin軟件以及SAS的多層統計模塊做參數估計、統計檢驗、模型比較等。如果分析技術存在問題,就難以得到合乎實際的評價。2) 模擬研究的分析技術。確定合適的估計方法,是能否得到準確參數估計與檢驗的關鍵。模擬研究通過模擬將樣本的規模擴大,如此可以體現轉化后數據的本質規律,進而有利于合適的估計方法。3)應用中合適二、三層變量選擇過程的分析技術。合適變量的選擇需要綜合考慮數據的可得性、模型擬合、假設檢驗以及模型比較等結果。因而,依據怎樣的流程處理各種結果是一個關鍵技術。4.本項目的37、特色與創新之處。(1)特色1)挖掘數據表示形式的轉化模式:通過恰當的規則合并數據,就相當于適當地擴大了樣本規模。2)理論研究與實際應用有機地結合在一起。建立交叉分類累加方法與合并方法的小樣本多層統計模型理論有理論發展的要求,更重要的是要解決中國香蕉產業組織發展的實際問題。(2)創新點1)嘗試建立的交叉分類累加方法的二層統計模型以及累加方法的三層統計模型是對累加方法的多層統計模型和灰色系統模型的發展。累加方法的多層統計模型不能處理小樣本的交叉分類數據、非連續變量數據以及三層數據;而灰色系統模型只能處理單層的連續型小樣本數據。因此,交叉分累加方法的二層統計模型以及累加方法的三層統計模型是對累加方法38、的多層統計模型和灰色系統模型的發展。2)嘗試建立合并連續型因變量與合并離散型因變量多層統計模型理論是對多層統計模型的發展。多層統計模型對一層與高層數據樣本規模都有一定的要求。自助多層統計模型能解決一層有一定樣本規模,高層數據樣本規模較小的情形;而對所有一層數據都較少的情況,多層模型難以解決。建立系列合并連續型因變量與合并離散型因變量多層統計模型能解決所有一層數據都較少的情形,因此,建立系列合并方法的小樣本多層統計模型理論是對多層統計模型的發展。3)將建立香蕉產業組織的計量理論。應用交叉分類累加方法與合并方法的多層統計模型研究中國香蕉產業組織的發展,將得到系統化的香蕉產業組織體系以及各要素間的數量評價,從而將建立香蕉產業組織的計量理論。5.年度研究計劃及預期研究結果。(包括擬組織的重要學術交流活動、國際合作與交流計劃等)(1)研究計劃年度研究計劃及預期研究結果見表1(2)學術交流活動參加國內外與多層統計和農業產業組織相關研究會議,召開本項目研究的研討會。
地產商業
上傳時間:2022-04-25
101份