中國工業企業數據庫的使用現狀和潛在問題
中國工業企業數據庫的使用現狀和潛在問題聶輝華江艇楊汝岱內容提要在經驗研究中,企業級的微觀數據正受到越來越多的重視。中國工業企業數據庫成為國內外學者研究中國企業行為和績效的主要數據庫之一。
但是該數據庫存在樣本匹配混亂、變量大小異常、測度誤差明顯和變量定義模糊等嚴重問題,忽視這些問題可能會導致研究結論錯誤。本文介紹了該數據庫的基本情況和使用現狀,指出了該數據庫存在的缺陷,并根據現有研究提出了改進建議。
一引言數據是經驗研究的細胞,因此數據質量的好壞直接決定了經驗研究的活力。最近十多年來,國際經濟學界越來越重視使用微觀面板數據longitudinal micro-level da ta的研究。相對于宏觀數據或行業數據,微觀的企業數據或個體數據的優勢是非常明顯的:第一,微觀面板數據包含了更多信息,例如企業的所有制、規模和出口等狀態,這些信息對于企業行為的研究必不可少;第二,微觀面板數據同時包含了時間維度和個體維度,有助于解決計量經濟學中的個體異質性問題,更容易保證估計的一致性;第期第年濟經界世聶輝華:中國人民大學經濟學院中國人民大學企業與組織研究中心100872 263.net;江艇:中國人民大學經濟學院中國人民大學企業與組織研究中心電子信箱:econjiang gmail.com;楊汝岱:湘潭大學消費研究院電子信箱:rudaiyang gmail.com.
作者感謝何帆對本文提出的建議,感謝屠順杰提供的助研工作,同時感謝兩位匿名審稿人指出的有益建議。
本文的研究得到姚洋主持的國家社科基金重大項目我國中長期經濟增長與結構變動趨勢研究09&zd020以及聶輝華、楊汝岱分別主持的教育部新世紀優秀人才項目的資助,特此感謝。當然文責自負。
三,微觀面板數據增加了觀測值個數,使估計更有效率。對于產業組織理論、企業理論、公司金融、國際貿易、收入分配和勞動供給等研究領域來說,經驗研究的數據主要就是微觀數據。
伴隨微觀計量經濟學的引入和國內外微觀數據庫的開放,中國經濟學者越來越重視微觀數據的開發和使用,產生了很多基于微觀數據的研究成果。一些中國數據庫甚至被全世界各國學者使用,這一方面表明中國問題越來越受到國際經濟學界的重視,另一方面也表明中國數據的質量得到了越來越多的認可。特別是相當多的國內外學他們的研刊上。作為一個由中國國家統計局收集的數據庫,它的優點是樣本大、指標多、時間長。但是,它畢竟不是一個由學術機構發布的數據庫,因此在很多方面還不太符合學術研究的嚴格要求,其缺陷包括樣本匹配混亂、指標存在缺失、指標大小異常、測度誤差明顯和變量定義模糊等問題。如果研究者沒有察覺到這些數據存在的缺陷,并且沒有采取有效的方法緩解或消除這些缺陷,那么就會對經驗研究的結果產生負面影響,甚至會得出錯誤的結論。而錯誤的結論對于理論和經驗研究來說,不僅浪費了學者們時間和精力,還可能產生誤導作用。鑒于此,我們認為有必要詳細、嚴謹地討論中國工業企業數據庫的基本情況、使用現狀,指出其存在的問題,并盡可能提供解決問題的建議。我們希望,本文的分析不僅有助于潛在使用者了解該數據庫的研究現狀和未來方向,還能有助于他們更準確地使用該數據庫,從而推進相關領域的研究發展。當然,作為該數據庫的使用者之一,我們并不能保證我們全面地熟悉了該數據庫,并且我們對問題的分析不可避免地包含了一定的研究傾向。
二數據庫基本信息我們首先簡單地描述該數據庫的基本情況。中國工業企業數據庫由國家統計局建立,它的數據主要來自于樣本企業提交給當地統計局的季報和年報匯總。該數據庫的全稱為全部國有及規模以上非國有工業企業數據庫,其樣本范圍為全部國有工業企業以及規模以上非國有工業企業,其統計單位為企業法人。這里的工業統計期第年濟經界世聶輝華江艇楊汝岱口徑包括國民經濟行業分類中的采掘業、制造業以及電力、燃氣及水的生產和供應業三個門類,主要是制造業占90以上。這里的規模以上要求企業每年的主營業務收入即銷售額在500萬元及以上,2011年該標準改為2000萬元及以上。基于上述統計口徑的數據庫自1998年開始采集,多數學者使用的工業企業數據庫涉及的年份在1999~2007年之間。由于該數據庫的主要成分為制造業企業,在統計口徑上與其他國家的產業分類比較一致,而且一些變量例如資本、研發投入和出口交貨值更容易度量,因此使用者通常析出該數據庫中的制造業企業。制造業的統計口徑包括從農副食品加工業、食品制造業到工藝品及其他制造業、廢棄資源和廢舊材料回收加工業等30個大類二位數行業,對應于國民經濟行業分類與代碼gb/ t4754-2002中的代碼13~43不含38.為了保持企業樣本的完整性,同時與現有研究具有可比性,我們以1999~2007年全部國有及規模以上非國有工業企業作為我們分析該數據庫的主要樣本。
1999~2007年中國工業企業數據庫包括了200多萬個觀測值,每年的樣本企業數量從1999年的大約16萬家逐年遞增到2007年的大約33萬家。
在9年樣本期內,包括上市公司,總共有大約55萬家企業出現。顯然,這是一個巨大的非平衡面板數據。由于企業關閉、改制、重組等各種原因,只有46 000萬多家企業約占樣本企業總數的8連續出現在整個樣本期內。該數據庫樣本占據了中國工業企業的絕大部分比例。根據具有可比性的2004年第一次全國經濟普查年報,當年工業企業銷售額為 442.81億元。而中國工業企業數據庫當年全部樣本企業的銷售額為195 600億元,約占全國的89.5.
目前,除了經濟普查數據庫之外,中國工業企業數據庫是可獲得的最大的企業級數據庫。表1描述了1999~2007年企業總數和國有、集體、民營、外資企業含港、澳、臺企業的份額變化。可以看出,國有和集體企業的比例在顯著減少,從1999年的2 /3下降到2007年的不足1 /10,而民營企業的比例從不足20迅速增加到超過70.該表從一個側面反映了中國市場經濟結構的劇烈變動。
事實上,工業企業數據庫是最全面的企業數據庫。該數據庫包括企業的兩類信息:一類是企業的基本情況,另一類是企業的財務數據。企業的基本情況包括:法人代碼、企業名稱、法人代表、聯系電話、郵政編碼、具體地址、所屬行業、注冊類型所有制、隸屬關系、開業年份和職工人數等指標。企業的財務數據則包括:流動資產、應期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題學者們使用的該數據庫可能有幾個不同的來源,但是內容相差很小。
經濟普查的工業企業銷售額來自國家統計局網站《第一次全國經濟普查主要數據公報第二號》,工業企業數據庫中的工業企業銷售額來自作者計算。
收賬款、長期投資、固定資產、累計折舊、無形資產、流動負債、長期負債、實收資本、主營業務收入、主營業務成本、營業費用、管理費用、財務費用、營業利潤、利稅總額、廣告費、研究開發費、工資總額、福利費總額、增值稅、工業中間投入、工業總產值和出口交貨值等指標。全部指標大約為130個。特別的,2004年為第一次全國經濟普查年,因此在數據庫中當年的企業指標還包括了不同學歷研究生、本科、大專、中專、高中、初中及以下、不同職稱技術職稱和技師等的男職工和女職工的相應數量。此外,還包括了企業是否加入工會以及加入工會的人數等其他年份所沒有的信息。
中國工業企業的類型、數目和比例年份國有集體民營外資總數數據來源:作者根據數據庫計算得出。
毋庸置疑,工業企業數據庫的優勢非常明顯。第一,它的樣本量非常大,涵蓋了全國所有的國有工業企業和規模以上的非國有工業企業。9年的觀測值總數超過200萬個。2006年之后,每年的樣本企業數目超過30萬個。除了普查數據庫,還沒有哪個企業數據庫在樣本量上能與之匹敵。從統計學或計量經濟學的角度講,大樣本的優勢在于降低估計的近似偏誤,提高估計的效率。第二,它的指標非常多,包括了企業的基本情況和企業的財務數據,比較全面地反映了企業的市場進入、投資、借貸、廣告、研發、出口等行為和企業的短期與長期經營績效,并且企業加總數據反映出企業所處行業或地區的市場結構。從產業組織理論的角度講,一旦可以獲得市場結構、企業行為和績效的數據,學者們幾乎就可以進行任意主題的研究。公司金融、企業理論、國際貿易和產業集聚等相關領域的研究者們也可以對該數據庫各取所需,包括進行跨專業研究。如果將該數據庫和其他數據庫合并,那么學者們將會發現更加豐富的研究視角。
指標越多,在構建計量方程時解釋變量和控制變量就越多,這樣可以減少遺漏變量問期第年濟經界世聶輝華江艇楊汝岱題。第三,它的時間序列比較長。工業企業數據庫最早的建立年份是1998年,目前已經更新到了2008年,前后跨期11年。這使得研究者采用動態面板方法具有可行性,從而有助于反映歷史因素的作用,以及從動態的角度研究企業和產業的演化過程。
相對而言,目前流行的其他幾個企業數據庫,例如萬得金融數據庫、色諾芬經濟金融數據庫、國泰安上市公司數據庫,樣本企業都是上市公司,它們的指標更全面、準確,提供指標的頻率也更高。比如,這些上市公司數據庫通常包括了主要股東持股情況、董事會成員和高管的個人特征以及職位變動,從而可以研究公司治理結構。另外,上市公司數據庫不僅包含工業類上市公司,還包含了金融類和服務類上市公司,這也是工業企業數據庫所缺乏的。此外,一些特定的調查項目也催生了企業數據庫。例如,2006年世界銀行和國家統計局對中國12個省的1200多家企業進行了調查,內容涉及企業社會責任、內部管理、質量管理、勞動管理、環境管理、市場競爭以及技術改造等方面。從1991~2006年,中央統戰部和全國工商聯陸續對全國民營企業的經營情況進行了抽樣調查,內容涉及企業基本情況、管理體制、企業家背景以及勞資關系等方面。
三數據庫使用現狀由于工業企業數據庫的獨特優勢,近幾年來每年都有大量的海內外經濟學者使用該數據庫撰寫和發表論文,主題涵蓋產業組織理論、企業理論、公司金融、轉型經濟學、國際貿易、勞動經濟學和區域經濟學等學科。下面,我們簡要介紹工業企業數據庫在上述經濟學分支中的使用現狀。一方面,我們希望這有助于感興趣的研究人員了解人們在不同領域已經用該數據庫做了什么,還可以做什么;另一方面,我們希望這有助于感興趣的讀者了解現有研究者是如何做這些研究的。當然,囿于篇幅和精力,我們不可能囊括所有使用該數據庫的文獻,而是將目光聚焦于國內外的主要學術期刊或者流傳較廣的英文文章。
一生產率在所有使用該數據庫的相關研究文獻中,企業生產率是最受關注的主題之一。因為生產率是最重要的效率度量,正如克魯格曼krugman,1997所言:生產率不是一切,但是長期來看生產率近似于一切。而且,對于計算企業生產率而言,工業企業數據庫提供了加總數據所沒有的獨特優勢。利用工業企業數據庫中提供的銷售額或經期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題關于其他的企業數據庫,感興趣的讀者可以訪問香港中文大學中國研究服務中心的網站。
濟增加值表示y、固定資產表示k和職工人數表示l,采取相應的價格指數進行平減,可以計算出每個企業的勞動生產率和全要素生產率total factors productivity,簡稱tfp.鑒于勞動生產率不能反映資本的效率,因此多數文獻以tfp作為生產率的度量。又因為制造業口徑與國際產業分類更具可比性,所以現有文獻在計算tfp時幾乎都以制造業企業為樣本。一些學者采取了傳統的索洛殘差法solow residual計算tfp,例如謝千里等2008與hsieh和klenow2009;一些學者采取了主流的op方法olley和pakes,1996,例如張杰等2009、余淼杰2010、聶輝華和賈瑞雪2011、楊汝岱和熊瑞祥2011以及brandt等2012;一些學者采取了lp方法levinsohn和petrin,2003,例如周黎安等2007;一些學者采取了隨機邊界方法sfa,例如劉小玄和李雙杰2008.
二國際貿易與生產率研究密切相關的是國際貿易,更具體地說是考察企業出口與生產率的關系。根據著名的企業異質性假說melitz,2003,生產率高的企業會傾向于選擇出口,即生產率和出口正相關。利用工業企業數據庫,一些學者檢驗了這一假說對于中國企業是否成立。張杰等2009利用1999~2003年的制造業企業數據發現,出口有利于企業提高tfp,即存在出口的學習效應。而李春頂2010利用中國1998~2007年的樣本發現,出口企業的平均tfp或勞動生產率低于內銷企業,他認為這是生產率悖論。此外,趙偉等2011發現勞動生產率與出口選擇負相關,但tfp有時與出口選擇正相關。這似乎表明,利用該數據庫的文獻研究還沒有明確地支持企業異質性假說,但lu2010對此提供了一個理論解釋。還有一些學者利用工業企業數據庫做了相關的研究。例如,余淼杰2010發現,貿易自由化降低關稅會提高出口企業的tfp;包群等2011發現,制造業企業出口后對其員工收入的改善并不明顯;楊汝岱和鄭辛迎2011發現行業的垂直專業化程度對企業員工工資有差異化影響。
三外商直接投資中國加入wto已經超過10年了,外商直接投資fdi究竟在中國的經濟發展中扮演了什么樣的角色?亓朋等2008利用1998~2001年的制造業企業數據,考察了外資企業對內資企業tfp的溢出效應,發現在行業內溢出效應不顯著,行業間和地區間均存在正的溢出效應。羅雨澤等2008使用2000和2002年的制造業企業數據,發現外商投資企業對本行業和本地區的內資企業有顯著的正溢出效應。有趣的是,路江期第年濟經界世聶輝華江艇楊汝岱聶輝華和賈瑞雪2011比較了幾種計算tfp方法的優劣。
涌2008利用1998~2005年的制造業企業數據,發現外資企業對內資企業的溢出效應隨地理距離而遞減,在本市內溢出效應為正,在全國范圍內為負,并且對國有企業為負,對民營企業為正。du等2012發現,外資企業對內資企業的溢出效應主要通過前向或后向產業關聯實現,橫向產業關聯沒有產生顯著的溢出效應;而且,來自港澳臺的外資企業和來自外國的外資企業對內資企業的影響也不相同。xu和sheng2012也得到了類似的發現。sheng等2011還發現,fdi通過后向產業關聯提高了內資企業的出口價值,通過同行業的示范效應提高了內資企業的出口傾向。chen等2011發現,外資企業具有明顯的工資溢價,并且對內資企業的工資有抑制作用,從而加劇了企業之間的工資不平等現象。
四研發技術創新是企業生產率的重要源泉之一,因此企業的研究開發r&d行為也備受關注。關于r&d的文獻主要分為兩類:第一類是研究r&d或者企業創新的決定因素,主要是檢驗熊彼特假說;第二類是研究企業的r&d對績效的影響。聶輝華等2008利用2001~2005年的制造業企業數據,分析后發現企業的研發密度度量創新與規模、市場競爭之間均呈倒u型關系,而且盡管國有企業的研發密度比民營企業更高,但是研發效率更低。hu等2009發現fdi和企業改制對于促進企業研發密度有正面作用。陳林和朱衛2011使用2005~2006年的工業企業數據,根據國有經濟比重區分行政進入壁壘高的行業和行政進入壁壘低的行業,發現在前一類行業中創新與市場結構之間呈倒u型關系,熊彼特假說成立;但是在后一類行業中結論相反。chesbrough和liang2007以制造業中的半導體行業為例,發現市場導向會影響企業r&d的投資回報,即全球市場導向的企業比國內市場導向的企業能夠獲得更高的r&d回報。戴覓和余淼杰2012發現,出口前的r&d投資能夠促進企業在出口后生產率的提高。
五民營化中國國有企業改革的主要成效之一,就是大量的國有企業進行了轉制,即從百分之百的國有企業變成了國有控股企業或者民營企業。這一點明顯地反映在國有工業企業的實收資本成分變化上。tong2009利用1998~2003年的工業企業數據,發現市場競爭的加劇、fdi集中度的上升以及預算約束的硬化是國企民營化的主要動因,而且績效相對好的國企更有可能民營化。bai等2009研究了國企民營化的影響,發現民營化增加了銷售額和勞動生產率,而這主要是通過減少管理費用來實現的。
dougherty等2007發現,民營化通過提高企業的贏利能力和生產的地區專業化水平期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題提高了企業的生產率。lu等2010發現,集體企業的私有化導致了銷售成本的上升,但是也降低了管理費用。
六公司金融中國工業企業數據庫包含了豐富的財務指標,因此很多學者也用它來研究企業的投資、融資和避稅行為。cai和liu2009提出了一個有趣的問題:競爭是否會加劇公司規避所得稅?他們識別避稅程度的方式是,比較企業報告的利潤和根據會計規則計算的利潤之間的差額。使用2000~2005年的工業企業數據,他們發現競爭會加劇企業的避稅行為。cull等2009認為,中國的銀行貸款loan和商業信用trade credit之間存在一種替代關系,業績差的國有企業會通過商業信用將銀行貸款再配置給企業客戶,而業績好的民營企業比業績差的民營企業更有可能擴展商業信用。余明桂和潘紅波2010利用2004~2007年的工業企業數據發現,企業特別是私有企業會將授予客戶的商業信用作為產品市場競爭的手段,這驗證了商業信用的競爭假說。guari glia等2011發現,民營企業的內部融資現金流/總資產是企業增長的重要約束條件,而國有企業則不受此類約束。
七產業集聚利用企業層面的數據,我們可以得到行業或地區層面的加總數據,可以反映中國工業的產業集聚現象。使用1998~2005年的制造業企業數據,lu和tao2009考察了中國制造業集聚用eg指數衡量的決定因素,發現地方保護主義國有企業的雇傭比例是阻礙產業地區集聚的主要因素。另外一些學者考察了產業集聚對企業的影響。li等2011發現產業集聚對企業規模有顯著的正面影響。lin等2011發現,產業集聚和企業生產率之間存在一種倒u型關系。yang和he2011發現貿易通過信息和分工影響到出口企業的地理集聚。
八宏觀政策的微觀影響利用工業企業數據庫,學者們還可以研究宏觀政策對企業微觀行為和績效的影響,并且以經驗研究的方式為宏觀政策分析提供微觀基礎。聶輝華等2009利用面板雙重差分did模型,發現2004年實行的增值稅轉型政策顯著地促進了企業的固定資產投資和勞動生產率,但是也減少了企業的雇傭人數。袁淵和左翔2011用did方法研究了2003~2005年浙江省擴權強縣政策對企業增長的影響,發現這一政策確實提高了縣域企業的銷售額增長率和資產增長率。彭方平和連玉君2010利用2000~2007年的工業企業數據,發現短期內提高利息的宏觀政策會導致企業的生產成本提高,從而導致通貨膨脹,即貨幣成本。song等2011推斷,金融歧視政策導致期第年濟經界世聶輝華江艇楊汝岱高效率企業的儲蓄率上升和快速的增長,并進而導致巨額的外匯儲備和貿易順差,然后用1998~2007年的工業企業數據對此進行了驗證。
九其他與工業企業數據庫有關的其他經驗研究主要聚焦于就業問題。方明月等2010利用1999~2005年的工業企業數據,采取系統廣義矩估計gmm方法比較了不同所有制企業的產出的微觀就業彈性,發現國有企業的就業彈性低于民營企業的就業彈性。張光南等2010利用1998~2006年工業企業數據加總得到各省的基礎設施、產出和就業數據,計算了基礎設施對產出和就業的彈性。dong和xu2009討論中國公共部門和私人部門之間的勞動力流動對中國經濟增長的貢獻。
四數據庫潛在問題中國工業企業數據庫為微觀計量經濟學研究貢獻了不可或缺的素材,但是這個數據庫并非完美無缺,而是問題重重。作為使用者,我們發現了工業企業數據庫存在樣本錯配、指標缺失、指標異常、樣本選擇和測度誤差等諸多問題。如果忽視這些問題,經驗研究的結果可能不穩健,甚至可能是錯誤的。現有文獻部分地發現了這些問題,并且提供了部分解決方法。下面,我們在現有文獻的基礎上,結合我們的使用經驗,將工業企業數據庫的潛在問題進行歸納,并且盡可能地提供解決問題的方法建議。
一樣本匹配問題對于一個多年企業數據來說,整理數據的第一步就是構建一個以企業id和年份為兩維的面板數據。這通常不是一個問題,但是對于中國工業企業數據庫卻是一個非常棘手的問題。因為在該數據庫中,難以找到一個識別每個樣本企業的唯一特征來進行編碼。通常的做法是,根據企業代碼、企業名稱、法人代表姓名、地址、郵編、電話、行業代碼、主要產品名稱、開業時間等基本信息來識別不同的樣本點是否來自同一家企業。但是因為這些基本信息在申報時沒有統一格式,在缺乏有效的智能模糊匹配手段的情況下,精確匹配的可操作性不強。其中,企業代碼和企業名稱的準確性相對較高,可以作為我們進行匹配所依據的主要信息,比如brandt等2012就是先根據相同的企業代碼識別同一家企業,然后再根據相同的企業名稱進行識別,最后再參考其他基本信息。這種序貫識別法假定企業代碼的準確性最高,企業名稱準確性其次。也就是說共享同一企業代碼的樣本點必然被識別為同一企業,但同一企業的各樣本點可能擁有不同的企業代碼。在本數據庫中,不但存在同一企業更改企業代碼的情況例如在期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題發生改制或重組之后,更重要的是,還存在不同的企業共享企業代碼的情況也許是統計失誤。企業名稱這一變量也存在類似問題。很多企業在改制、重組或者擴張時更改了企業名稱。例如,中國有不少企業先是名為xx廠,然后改名為xx有限責任公司,接著又稱為xx股份有限公司。有時企業名稱中的地理位置也略有差異,例如從xx市機電廠變成xx機電廠。如果按照企業名稱進行精確匹配會錯誤地識別出過多的企業。
我們建議的做法是:將企業按企業代碼和企業名稱分別進行兩次分組,然后考察同一名稱組下的企業是否分屬不同的代碼組。若是,則將這些不同代碼組內的所有企業都歸為一組對每一名稱組都依此進行操作,不斷重新歸組,可以稱之為交叉匹配;若新組內沒有年份重復的觀測值,則將這一組樣本點識別為同一家企業;若新組內存在年份重復的觀測值,則進入下一步人工識別。在人工識別階段可能存在多種情況,需要根據數據特征和基本信息進行綜合判斷。例如,同一組內的樣本點可能屬于同一家企業,只是其中某些年份有兩個觀測值,這兩個觀測值只需要保留一個,另一個完全重復或關鍵變量均缺失。同一組內的樣本點也可能屬于不同企業,但其中可能存在企業代碼登記錯誤的情況,此時需要參照企業名稱、法人代表姓名、地址、行業代碼、銷售額或注冊資本等關鍵變量的數量級等信息進行分類,確定哪些樣本屬于同一家企業。我們發現,使用交叉匹配方法后,大約有10的觀測值大約20萬個屬于名稱相同但法人代碼不同或者相反的情況。顯然,如果忽視匹配問題會嚴重地影響樣本的真實性和準確性。
除了企業匹配存在一些障礙,產業匹配也有一些問題。使用者必須注意到,2002年前后統計局使用了兩種產業分類標準:2002年及其之前的年份為gb/t 4754-1994,2002年之后為gb/t 4754-2002.兩種行業分類標準在兩位數行業上沒有差異,在三位數行業上有一些差異,在四位數行業上有較大差異。楊汝岱和鄭辛迎2011與楊汝岱和熊瑞祥2011將1994gb四位數行業分類對應到2002gb三位數行業分類,這是一種可供參考的做法。
二指標缺失問題工業企業數據庫每年的統計對象和口徑都有所不同,導致一些重要指標在若干年份缺失。首先,有些工業企業數據庫直接將2004年的經濟普查數據與其他年份混編在一起,而沒有和其他年份進行匹配。這導致2004年的數據缺少工業總產值、工業增期第年濟經界世聶輝華江艇楊汝岱最近,很多研究將工業企業數據庫和海關數據庫結合起來。對于此類研究的某些主題,還需要將國民經濟行業分類與海關hs產品分類對應起來,具體分析可以參考楊汝岱2008.
加值、出口交貨值和研究開發費等重要指標。與此同時,和2004年相比,其他年份又缺少關于工會、男女職工的學歷和技術職稱等指標。因此,使用者在分析數據之前,應該先查看2004年數據和其他年份數據之間的指標差異。
其次,2003年前后的指標也有一些不同。例如,2001年之前的數據不包括研發費用。有些數據庫中1999~2003年的工業企業數據沒有工業增加值,也沒有應收賬款,但是有應收賬款凈額。根據會計準則,應收賬款凈額=應收賬款總額-壞賬準備期末余額,因此兩者不能簡單地比較。在缺失工業增加值的年份,使用者可以根據會計準則估算工業增加值:工業增加值=工業總產值-工業中間投入增值稅。在沒有工業總產值的年份例如2004年,估算公式為:工業增加值=產品銷售額-期初存貨期末存貨-工業中間投入增值稅。劉小玄和李雙杰2008就采取了這種估算方法。
我們用第一個公式估算了2005~2007年的工業增加值,發現平均而言估算值略小于報告值。當使用者用工業增加值來計算生產率時,應注意到這種差別。
報告的和估算的工業增加值比較千元報告值計算值觀測值個數說明:報告值和估算值皆為均值,且計算時未剔除異常觀測值。
需要特別指出的是,盡管工業企業數據庫提供了企業的出口交貨值,但據此只能判斷企業是否出口,而無法區分出口類型是加工貿易還是一般貿易。對于勞動密集型的加工貿易企業而言,其勞動生產率和全要素生產率很可能低于一般貿易的出口企業。另外,加工貿易是發展中國家的特殊現象。如果不區分兩類出口企業,簡單地將全部出口企業的效率與內銷企業的效率相比,那么得到出口企業的平均效率低于內銷企業也就不足為奇了。
事實上,dai等2011將工業企業數據與海關數據匹配,在剔除了加工貿易企業之后,發現生產率悖論并不存在。
三指標異常問題盡管工業企業數據庫包含了130多個指標,但是有相當多的指標存在異常值。異常值的存在使得很多觀測值無效,因此在進行計量回歸前必須予以剔除。我們注意期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題在這個意義上,我們認為工業企業數據庫本身可能不適于檢驗國際貿易的企業異質性假說。
一些學者對工業企業數據庫和海關數據庫進行了匹配,但由于原始數據結構和方法各異,匹配效果差別甚大。yu2011根據郵編和電話等信息匹配了海關庫30的出口企業,而tang2011匹配了工業庫70的出口企業。yang和he2011以企業名稱、郵編、電話等信息為基礎,采用關鍵詞數據庫搜尋匹配方法,匹配了海關庫60的出口份額。
到,cai和liu2009使用了比較全面的剔除方式,因此被較多的研究者所借鑒。第一步,他們剔除了關鍵指標例如,總資產、職工人數、工業總產值、固定資產凈值和銷售額缺失的觀測值;第二步,他們剔除了不滿足規模以上標準的觀測值,即固定資產凈值低于1000萬元,或者銷售額低于1000萬元,或者職工人數少于30人的觀測值;第三步,他們剔除了一些明顯不符合會計原則的觀測值,包括總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊的觀測值;第四步,他們剔除了關鍵指標的極端值前后各0.5.
以1999~2007年為例,我們分析了指標異常問題。首先,在總共2048 833個觀測值中,我們剔除了銷售額、職工人數、總資產或固定資產凈值缺失的觀測值5900多個,約占全部觀測值的0.3.其次,我們根據謝千里等2008的做法,剔除了職工人數少于8人的觀測值28 000多個這些企業缺乏可靠的會計系統,約占總數的1.
再次,我們剔除了總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊的觀測值200多個。最后,我們剔除了銷售額低于500萬元的觀測值176 500多個,約占總數的9.經過上述四個步驟,我們總共剔除了大約20萬個觀測值,約占總數的10.盡管進行了上述剔除,但是我們仍然發現有不少觀測值屬于異常值。例如,如果按照bai等2009的標準,利潤率低于0.1或者高于99的觀測值均為異常值,那么這部分異常值還有大約43萬個,約占總數的23.或者我們使用一種比較寬松的標準,會發現實收資本小于或等于0的異常觀測值有11 000多個,約占總數的6.因此,即便做了上述剔除,使用者仍然需要剔除計量方程的關鍵變量或參數所對應的異常值。我們將未做任何剔除的主要指標的異常情況總結為表3.
主要指標的異常情況剔除標準異常值個數觀測值總數異常值比例銷售額、職工人數、總資產或固定資產凈值缺失職工人數少于8總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊銷售額低于500萬元利潤率低于0.1或者高于99實收資本小于或等于0期第年濟經界世聶輝華江艇楊汝岱他們使用的規模以上的標準不同于官方標準銷售額在500萬元以上。
四測度誤差問題國家統計局在收集工業企業數據時,不是一次性交給企業一份報表,而是讓企業通過年報和定期上報的方式將數據報告給統計局,然后統計局再進行匯總。事實上,企業上報系統至少包括四套表格:綜合年報表、綜合定報表、基層年報表和基層定報表。這意味著,由于統計時間或者統計口徑不同,即使對同一個指標,企業在不同時間上報的數值也可能不一樣。另外,很多規模不大的企業仍然缺乏可靠的會計系統,或者為了避稅而瞞報,甚至錯報有關指標,這些都會導致測度誤差問題。
以研發費為例。在2001~2007年不含普查年份2004年,在總共140多萬個觀測值中,研發費顯示為0的觀測值有120多萬個,占總數的89.研發費報告為0的有3種情況:1企業沒有研發支出,因此研發費確實為0;2企業不清楚,任意地報告0;3企業沒填寫此項,統計人員直接賦值0.如果是第1、2種情況,那么這更可能發生在中小企業身上。于是,我們剔除了銷售額低于3億元的中小企業,又剔除了出口企業,發現在剩下的28 000多個觀測值中,研發費顯示為0的仍然有20 000多個,比例超過70.這里提醒研究者注意兩點:第一,如果絕大多數中小企業沒有研發費,并且這是真實的情況,那么在分析企業研發支出或創新的決定因素時,最好使用tobit截斷模型例如聶輝華等,2008,因為這比最小二乘法ols回歸更可能得到一致估計;第二,如果我們無法區分第2、3種情況,那么研發費這一指標的準確性和真實性就值得懷疑,此時用工業企業數據庫來分析研發的決定因素或者研發績效可能是不恰當的。
存在明顯測度誤差的其他指標主要是利潤和增加值。由于企業報告的利潤和增加值與企業的稅負正相關,因此企業在監管不力的前提下可能會低報或誤報這兩個指標。事實上,cai和liu2009根據會計準則估算了企業的利潤=工業總產值-中間投入-財務費用-工資-當期折舊-增值稅,然后發現在2000~2005年間,估算利潤率均值為0.1431,而企業報告的利潤率均值為0.0515,后者比前者少了2 /3以上。
此外,根據我們前面對2005~2007年間工業增加值的估算,可以發現估算的工業增加值要略小于報告的工業增加值。
另一個不屬于經典測度誤差但是與此有關的問題是虛假指標問題。在1999~2007年間,根據注冊類型,有大約1 /5的觀測值大約40萬個屬于外資企業包括港澳臺商投資企業和外商投資企業。這一比例之高超乎我們的直覺,因為眾所周知的事實是,外資企業可以享受各種稅收優惠。進一步分析發現,這些樣本企業雖然登記為外資企業,但是在其實收資本份額中,有6的港澳臺資本或外商資本金額為0,其期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題中有一半左右的登記注冊號明確標明了外資身份例如注明企合津總字第xx號。這有兩種可能,一是這些企業以前是外資企業,但是變更了實收資本之后沒有及時變更登記注冊類型;二是這些企業錯誤地填報了注冊類型。剩下的94的外資企業,我們無法確認其真實身份,也難以排除其中的假外企。
五樣本選擇問題在樣本選擇方面,工業企業數據庫的一個突出問題是,包括了全部的國有工業企業,但是只包括了規模以上的非國有工業企業。因此,當使用者要對比國有企業和非國有企業的行為及績效時,最好將規模以下的國有企業樣本剔除。而當使用者在研究產業集聚問題時,可能會低估非國有企業的集聚程度lu和tao,2009.但規模以上的樣本并非都是隨機的。在1999~2007年間的總共200多萬個觀測值中,只有大約8的企業每年都存在,有大約22的企業在最后三年都存在。一個企業某年不在樣本中,可能是因為當年銷售額小于500萬元,也可能是因為破產、重組或者更改名稱等原因,還有可能是被漏報。在這種情況下,我們難以嚴格地界定企業的進入和退出,因此研究者在用這個數據庫分析企業動態學時必須力爭解決或減緩這個問題。
另外,該數據庫中包含了企業所在地的詳細信息,使用者可以識別出企業是否處于經濟特區或經濟開發區。因為經濟特區或經濟開發區的企業具有自身的特點,這種區分有助于減少企業在比較生產率、產業集聚、利潤率以及融資成本等方面的樣本選擇問題。還有一個比較棘手的問題是,統計局對企業的統計口徑是法人企業,而不是企業集團或工廠。因此,有很多屬于同一個企業集團的企業會被認定為不同的企業,而多個工廠的差別則會被掩蓋在企業內部。
六變量定義問題分析中國的企業不可能忽略企業的所有制問題。我們注意到,現有文獻在識別企業的所有制時通常采取兩種方式:注冊類型或實收資本。這兩種識別企業所有制的方法其實是有差別的。前者表示企業在工商局登記注冊時的類型,后者能夠表示企業當時的真實控股類型。我們不妨將注冊類型為國有、國有聯營、國有與集體聯營、國有獨資公司這幾類企業定義為i類國有企業,同時根據實收資本將國有資本比例超過50的企業定義為ii類國有企業。在1999~2007年工業企業數據庫中,在剔除了實收資本為異常值的觀測值之后,i類國企有245 376個觀測值,ii類國企有252 629個觀測值,后者比前者多3左右,兩者重合的觀測值大約占i類國企的84,這意味著至少有15的國有企業雖然注冊類型是國有企業,但是已經不是真正的國有業企了。由于控股比例更能及時地反映企業的所有制類型,因此我們建議使用者最好期第年濟經界世聶輝華江艇楊汝岱使用實收資本比例來定義企業所有制。
外資企業的識別也存在類似的問題。根據中國的法律,外資企業的投資比例原則上不低于25.盡管有大約1 /5的觀測值的注冊類型顯示為外資企業,但是其中有10觀測值的港澳臺商投資或外商投資比例低于25.一些研究者以外商的實收資本比例是否超過25作為識別外資企業的方法路江涌,2008.
除了所有制類型,一個難以準確定義的變量就是資本。理論上,資本是固定資產存貨和投資流量的加總。多數文獻的做法是,將資本定義為固定資產原價或者固定資產凈值,然后采取永續盤存法來計算投資i it-1,其中i表示投資,k率的選取通常是5、10或15.此外,還應該采取不同的價格指數對產值、資本、投資和中間投入等變量進行平減。我們必須提醒使用者的是,不同的資本定義方法、折舊率以及價格平減指數會得到不同的結果。brandt等2012提供了比較詳細的說明和操作程序。
陳林、朱衛2011:《創新、市場結構與行政進入壁壘―――基于中國工業企業數據的熊彼特假說實證檢驗》,戴覓、余淼杰2012:《企業出口前研發投入、出口及生產率進步》,北京大學工作論文。
李春頂2010:《中國出口企業是否存在生產率悖論:基于中國制造業企業數據的檢驗》,《世界經濟》第7期。
劉小玄、李雙杰2008:《制造業企業相對效率的度量和比較及其外生決定因素2000―2004》,《經濟學羅雨澤、朱善利、陳玉宇、羅來軍2008:《外商直接投資的空間外溢效應:對中國區域企業生產率影響的經聶輝華、譚松濤、王宇鋒2008:《創新、企業規模和市場競爭―――基于中國企業層面面板數據的證據》,《世聶輝華、方明月、李濤2009:《增值稅轉型對企業行為和績效的影響―――以東北地區為例》,《管理世界》第期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題每個企業報告了總的實收資本以及國有、集體、法人、私人、港澳臺和外商等6種成分的實收資本數額,因此企業的其他所有制類型也可以通過實收資本比例來識別。
亓朋、許和連、艾洪山2008:《外商直接投資企業對內資企業的溢出效應:對中國制造業企業的實證研究》,楊汝岱、熊瑞祥2011:《干中學與中國工業企業出口生產率》,湘潭大學工作論文。
楊汝岱、鄭辛迎2011:《垂直專業化對員工工資的差異化影響》,湘潭大學工作論文。
張光南、李小瑛、陳廣漢2010:《中國基礎設施的就業、產出和投資效應―――基于1998-2006年省際工業企張杰、李勇、劉志彪2009:《出口促進中國企業生產率提高嗎?―――來自中國本土制造業企業的經驗證據:趙偉、趙金亮、韓媛媛2011:《異質性、沉沒成本與中國企業出口決定:來自中國微觀企業的經驗證據》,《世期第年濟經界世聶輝華江艇楊汝岱截稿:2012年3月責任編輯:王徽期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題
但是該數據庫存在樣本匹配混亂、變量大小異常、測度誤差明顯和變量定義模糊等嚴重問題,忽視這些問題可能會導致研究結論錯誤。本文介紹了該數據庫的基本情況和使用現狀,指出了該數據庫存在的缺陷,并根據現有研究提出了改進建議。
一引言數據是經驗研究的細胞,因此數據質量的好壞直接決定了經驗研究的活力。最近十多年來,國際經濟學界越來越重視使用微觀面板數據longitudinal micro-level da ta的研究。相對于宏觀數據或行業數據,微觀的企業數據或個體數據的優勢是非常明顯的:第一,微觀面板數據包含了更多信息,例如企業的所有制、規模和出口等狀態,這些信息對于企業行為的研究必不可少;第二,微觀面板數據同時包含了時間維度和個體維度,有助于解決計量經濟學中的個體異質性問題,更容易保證估計的一致性;第期第年濟經界世聶輝華:中國人民大學經濟學院中國人民大學企業與組織研究中心100872 263.net;江艇:中國人民大學經濟學院中國人民大學企業與組織研究中心電子信箱:econjiang gmail.com;楊汝岱:湘潭大學消費研究院電子信箱:rudaiyang gmail.com.
作者感謝何帆對本文提出的建議,感謝屠順杰提供的助研工作,同時感謝兩位匿名審稿人指出的有益建議。
本文的研究得到姚洋主持的國家社科基金重大項目我國中長期經濟增長與結構變動趨勢研究09&zd020以及聶輝華、楊汝岱分別主持的教育部新世紀優秀人才項目的資助,特此感謝。當然文責自負。
三,微觀面板數據增加了觀測值個數,使估計更有效率。對于產業組織理論、企業理論、公司金融、國際貿易、收入分配和勞動供給等研究領域來說,經驗研究的數據主要就是微觀數據。
伴隨微觀計量經濟學的引入和國內外微觀數據庫的開放,中國經濟學者越來越重視微觀數據的開發和使用,產生了很多基于微觀數據的研究成果。一些中國數據庫甚至被全世界各國學者使用,這一方面表明中國問題越來越受到國際經濟學界的重視,另一方面也表明中國數據的質量得到了越來越多的認可。特別是相當多的國內外學他們的研刊上。作為一個由中國國家統計局收集的數據庫,它的優點是樣本大、指標多、時間長。但是,它畢竟不是一個由學術機構發布的數據庫,因此在很多方面還不太符合學術研究的嚴格要求,其缺陷包括樣本匹配混亂、指標存在缺失、指標大小異常、測度誤差明顯和變量定義模糊等問題。如果研究者沒有察覺到這些數據存在的缺陷,并且沒有采取有效的方法緩解或消除這些缺陷,那么就會對經驗研究的結果產生負面影響,甚至會得出錯誤的結論。而錯誤的結論對于理論和經驗研究來說,不僅浪費了學者們時間和精力,還可能產生誤導作用。鑒于此,我們認為有必要詳細、嚴謹地討論中國工業企業數據庫的基本情況、使用現狀,指出其存在的問題,并盡可能提供解決問題的建議。我們希望,本文的分析不僅有助于潛在使用者了解該數據庫的研究現狀和未來方向,還能有助于他們更準確地使用該數據庫,從而推進相關領域的研究發展。當然,作為該數據庫的使用者之一,我們并不能保證我們全面地熟悉了該數據庫,并且我們對問題的分析不可避免地包含了一定的研究傾向。
二數據庫基本信息我們首先簡單地描述該數據庫的基本情況。中國工業企業數據庫由國家統計局建立,它的數據主要來自于樣本企業提交給當地統計局的季報和年報匯總。該數據庫的全稱為全部國有及規模以上非國有工業企業數據庫,其樣本范圍為全部國有工業企業以及規模以上非國有工業企業,其統計單位為企業法人。這里的工業統計期第年濟經界世聶輝華江艇楊汝岱口徑包括國民經濟行業分類中的采掘業、制造業以及電力、燃氣及水的生產和供應業三個門類,主要是制造業占90以上。這里的規模以上要求企業每年的主營業務收入即銷售額在500萬元及以上,2011年該標準改為2000萬元及以上。基于上述統計口徑的數據庫自1998年開始采集,多數學者使用的工業企業數據庫涉及的年份在1999~2007年之間。由于該數據庫的主要成分為制造業企業,在統計口徑上與其他國家的產業分類比較一致,而且一些變量例如資本、研發投入和出口交貨值更容易度量,因此使用者通常析出該數據庫中的制造業企業。制造業的統計口徑包括從農副食品加工業、食品制造業到工藝品及其他制造業、廢棄資源和廢舊材料回收加工業等30個大類二位數行業,對應于國民經濟行業分類與代碼gb/ t4754-2002中的代碼13~43不含38.為了保持企業樣本的完整性,同時與現有研究具有可比性,我們以1999~2007年全部國有及規模以上非國有工業企業作為我們分析該數據庫的主要樣本。
1999~2007年中國工業企業數據庫包括了200多萬個觀測值,每年的樣本企業數量從1999年的大約16萬家逐年遞增到2007年的大約33萬家。
在9年樣本期內,包括上市公司,總共有大約55萬家企業出現。顯然,這是一個巨大的非平衡面板數據。由于企業關閉、改制、重組等各種原因,只有46 000萬多家企業約占樣本企業總數的8連續出現在整個樣本期內。該數據庫樣本占據了中國工業企業的絕大部分比例。根據具有可比性的2004年第一次全國經濟普查年報,當年工業企業銷售額為 442.81億元。而中國工業企業數據庫當年全部樣本企業的銷售額為195 600億元,約占全國的89.5.
目前,除了經濟普查數據庫之外,中國工業企業數據庫是可獲得的最大的企業級數據庫。表1描述了1999~2007年企業總數和國有、集體、民營、外資企業含港、澳、臺企業的份額變化。可以看出,國有和集體企業的比例在顯著減少,從1999年的2 /3下降到2007年的不足1 /10,而民營企業的比例從不足20迅速增加到超過70.該表從一個側面反映了中國市場經濟結構的劇烈變動。
事實上,工業企業數據庫是最全面的企業數據庫。該數據庫包括企業的兩類信息:一類是企業的基本情況,另一類是企業的財務數據。企業的基本情況包括:法人代碼、企業名稱、法人代表、聯系電話、郵政編碼、具體地址、所屬行業、注冊類型所有制、隸屬關系、開業年份和職工人數等指標。企業的財務數據則包括:流動資產、應期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題學者們使用的該數據庫可能有幾個不同的來源,但是內容相差很小。
經濟普查的工業企業銷售額來自國家統計局網站《第一次全國經濟普查主要數據公報第二號》,工業企業數據庫中的工業企業銷售額來自作者計算。
收賬款、長期投資、固定資產、累計折舊、無形資產、流動負債、長期負債、實收資本、主營業務收入、主營業務成本、營業費用、管理費用、財務費用、營業利潤、利稅總額、廣告費、研究開發費、工資總額、福利費總額、增值稅、工業中間投入、工業總產值和出口交貨值等指標。全部指標大約為130個。特別的,2004年為第一次全國經濟普查年,因此在數據庫中當年的企業指標還包括了不同學歷研究生、本科、大專、中專、高中、初中及以下、不同職稱技術職稱和技師等的男職工和女職工的相應數量。此外,還包括了企業是否加入工會以及加入工會的人數等其他年份所沒有的信息。
中國工業企業的類型、數目和比例年份國有集體民營外資總數數據來源:作者根據數據庫計算得出。
毋庸置疑,工業企業數據庫的優勢非常明顯。第一,它的樣本量非常大,涵蓋了全國所有的國有工業企業和規模以上的非國有工業企業。9年的觀測值總數超過200萬個。2006年之后,每年的樣本企業數目超過30萬個。除了普查數據庫,還沒有哪個企業數據庫在樣本量上能與之匹敵。從統計學或計量經濟學的角度講,大樣本的優勢在于降低估計的近似偏誤,提高估計的效率。第二,它的指標非常多,包括了企業的基本情況和企業的財務數據,比較全面地反映了企業的市場進入、投資、借貸、廣告、研發、出口等行為和企業的短期與長期經營績效,并且企業加總數據反映出企業所處行業或地區的市場結構。從產業組織理論的角度講,一旦可以獲得市場結構、企業行為和績效的數據,學者們幾乎就可以進行任意主題的研究。公司金融、企業理論、國際貿易和產業集聚等相關領域的研究者們也可以對該數據庫各取所需,包括進行跨專業研究。如果將該數據庫和其他數據庫合并,那么學者們將會發現更加豐富的研究視角。
指標越多,在構建計量方程時解釋變量和控制變量就越多,這樣可以減少遺漏變量問期第年濟經界世聶輝華江艇楊汝岱題。第三,它的時間序列比較長。工業企業數據庫最早的建立年份是1998年,目前已經更新到了2008年,前后跨期11年。這使得研究者采用動態面板方法具有可行性,從而有助于反映歷史因素的作用,以及從動態的角度研究企業和產業的演化過程。
相對而言,目前流行的其他幾個企業數據庫,例如萬得金融數據庫、色諾芬經濟金融數據庫、國泰安上市公司數據庫,樣本企業都是上市公司,它們的指標更全面、準確,提供指標的頻率也更高。比如,這些上市公司數據庫通常包括了主要股東持股情況、董事會成員和高管的個人特征以及職位變動,從而可以研究公司治理結構。另外,上市公司數據庫不僅包含工業類上市公司,還包含了金融類和服務類上市公司,這也是工業企業數據庫所缺乏的。此外,一些特定的調查項目也催生了企業數據庫。例如,2006年世界銀行和國家統計局對中國12個省的1200多家企業進行了調查,內容涉及企業社會責任、內部管理、質量管理、勞動管理、環境管理、市場競爭以及技術改造等方面。從1991~2006年,中央統戰部和全國工商聯陸續對全國民營企業的經營情況進行了抽樣調查,內容涉及企業基本情況、管理體制、企業家背景以及勞資關系等方面。
三數據庫使用現狀由于工業企業數據庫的獨特優勢,近幾年來每年都有大量的海內外經濟學者使用該數據庫撰寫和發表論文,主題涵蓋產業組織理論、企業理論、公司金融、轉型經濟學、國際貿易、勞動經濟學和區域經濟學等學科。下面,我們簡要介紹工業企業數據庫在上述經濟學分支中的使用現狀。一方面,我們希望這有助于感興趣的研究人員了解人們在不同領域已經用該數據庫做了什么,還可以做什么;另一方面,我們希望這有助于感興趣的讀者了解現有研究者是如何做這些研究的。當然,囿于篇幅和精力,我們不可能囊括所有使用該數據庫的文獻,而是將目光聚焦于國內外的主要學術期刊或者流傳較廣的英文文章。
一生產率在所有使用該數據庫的相關研究文獻中,企業生產率是最受關注的主題之一。因為生產率是最重要的效率度量,正如克魯格曼krugman,1997所言:生產率不是一切,但是長期來看生產率近似于一切。而且,對于計算企業生產率而言,工業企業數據庫提供了加總數據所沒有的獨特優勢。利用工業企業數據庫中提供的銷售額或經期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題關于其他的企業數據庫,感興趣的讀者可以訪問香港中文大學中國研究服務中心的網站。
濟增加值表示y、固定資產表示k和職工人數表示l,采取相應的價格指數進行平減,可以計算出每個企業的勞動生產率和全要素生產率total factors productivity,簡稱tfp.鑒于勞動生產率不能反映資本的效率,因此多數文獻以tfp作為生產率的度量。又因為制造業口徑與國際產業分類更具可比性,所以現有文獻在計算tfp時幾乎都以制造業企業為樣本。一些學者采取了傳統的索洛殘差法solow residual計算tfp,例如謝千里等2008與hsieh和klenow2009;一些學者采取了主流的op方法olley和pakes,1996,例如張杰等2009、余淼杰2010、聶輝華和賈瑞雪2011、楊汝岱和熊瑞祥2011以及brandt等2012;一些學者采取了lp方法levinsohn和petrin,2003,例如周黎安等2007;一些學者采取了隨機邊界方法sfa,例如劉小玄和李雙杰2008.
二國際貿易與生產率研究密切相關的是國際貿易,更具體地說是考察企業出口與生產率的關系。根據著名的企業異質性假說melitz,2003,生產率高的企業會傾向于選擇出口,即生產率和出口正相關。利用工業企業數據庫,一些學者檢驗了這一假說對于中國企業是否成立。張杰等2009利用1999~2003年的制造業企業數據發現,出口有利于企業提高tfp,即存在出口的學習效應。而李春頂2010利用中國1998~2007年的樣本發現,出口企業的平均tfp或勞動生產率低于內銷企業,他認為這是生產率悖論。此外,趙偉等2011發現勞動生產率與出口選擇負相關,但tfp有時與出口選擇正相關。這似乎表明,利用該數據庫的文獻研究還沒有明確地支持企業異質性假說,但lu2010對此提供了一個理論解釋。還有一些學者利用工業企業數據庫做了相關的研究。例如,余淼杰2010發現,貿易自由化降低關稅會提高出口企業的tfp;包群等2011發現,制造業企業出口后對其員工收入的改善并不明顯;楊汝岱和鄭辛迎2011發現行業的垂直專業化程度對企業員工工資有差異化影響。
三外商直接投資中國加入wto已經超過10年了,外商直接投資fdi究竟在中國的經濟發展中扮演了什么樣的角色?亓朋等2008利用1998~2001年的制造業企業數據,考察了外資企業對內資企業tfp的溢出效應,發現在行業內溢出效應不顯著,行業間和地區間均存在正的溢出效應。羅雨澤等2008使用2000和2002年的制造業企業數據,發現外商投資企業對本行業和本地區的內資企業有顯著的正溢出效應。有趣的是,路江期第年濟經界世聶輝華江艇楊汝岱聶輝華和賈瑞雪2011比較了幾種計算tfp方法的優劣。
涌2008利用1998~2005年的制造業企業數據,發現外資企業對內資企業的溢出效應隨地理距離而遞減,在本市內溢出效應為正,在全國范圍內為負,并且對國有企業為負,對民營企業為正。du等2012發現,外資企業對內資企業的溢出效應主要通過前向或后向產業關聯實現,橫向產業關聯沒有產生顯著的溢出效應;而且,來自港澳臺的外資企業和來自外國的外資企業對內資企業的影響也不相同。xu和sheng2012也得到了類似的發現。sheng等2011還發現,fdi通過后向產業關聯提高了內資企業的出口價值,通過同行業的示范效應提高了內資企業的出口傾向。chen等2011發現,外資企業具有明顯的工資溢價,并且對內資企業的工資有抑制作用,從而加劇了企業之間的工資不平等現象。
四研發技術創新是企業生產率的重要源泉之一,因此企業的研究開發r&d行為也備受關注。關于r&d的文獻主要分為兩類:第一類是研究r&d或者企業創新的決定因素,主要是檢驗熊彼特假說;第二類是研究企業的r&d對績效的影響。聶輝華等2008利用2001~2005年的制造業企業數據,分析后發現企業的研發密度度量創新與規模、市場競爭之間均呈倒u型關系,而且盡管國有企業的研發密度比民營企業更高,但是研發效率更低。hu等2009發現fdi和企業改制對于促進企業研發密度有正面作用。陳林和朱衛2011使用2005~2006年的工業企業數據,根據國有經濟比重區分行政進入壁壘高的行業和行政進入壁壘低的行業,發現在前一類行業中創新與市場結構之間呈倒u型關系,熊彼特假說成立;但是在后一類行業中結論相反。chesbrough和liang2007以制造業中的半導體行業為例,發現市場導向會影響企業r&d的投資回報,即全球市場導向的企業比國內市場導向的企業能夠獲得更高的r&d回報。戴覓和余淼杰2012發現,出口前的r&d投資能夠促進企業在出口后生產率的提高。
五民營化中國國有企業改革的主要成效之一,就是大量的國有企業進行了轉制,即從百分之百的國有企業變成了國有控股企業或者民營企業。這一點明顯地反映在國有工業企業的實收資本成分變化上。tong2009利用1998~2003年的工業企業數據,發現市場競爭的加劇、fdi集中度的上升以及預算約束的硬化是國企民營化的主要動因,而且績效相對好的國企更有可能民營化。bai等2009研究了國企民營化的影響,發現民營化增加了銷售額和勞動生產率,而這主要是通過減少管理費用來實現的。
dougherty等2007發現,民營化通過提高企業的贏利能力和生產的地區專業化水平期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題提高了企業的生產率。lu等2010發現,集體企業的私有化導致了銷售成本的上升,但是也降低了管理費用。
六公司金融中國工業企業數據庫包含了豐富的財務指標,因此很多學者也用它來研究企業的投資、融資和避稅行為。cai和liu2009提出了一個有趣的問題:競爭是否會加劇公司規避所得稅?他們識別避稅程度的方式是,比較企業報告的利潤和根據會計規則計算的利潤之間的差額。使用2000~2005年的工業企業數據,他們發現競爭會加劇企業的避稅行為。cull等2009認為,中國的銀行貸款loan和商業信用trade credit之間存在一種替代關系,業績差的國有企業會通過商業信用將銀行貸款再配置給企業客戶,而業績好的民營企業比業績差的民營企業更有可能擴展商業信用。余明桂和潘紅波2010利用2004~2007年的工業企業數據發現,企業特別是私有企業會將授予客戶的商業信用作為產品市場競爭的手段,這驗證了商業信用的競爭假說。guari glia等2011發現,民營企業的內部融資現金流/總資產是企業增長的重要約束條件,而國有企業則不受此類約束。
七產業集聚利用企業層面的數據,我們可以得到行業或地區層面的加總數據,可以反映中國工業的產業集聚現象。使用1998~2005年的制造業企業數據,lu和tao2009考察了中國制造業集聚用eg指數衡量的決定因素,發現地方保護主義國有企業的雇傭比例是阻礙產業地區集聚的主要因素。另外一些學者考察了產業集聚對企業的影響。li等2011發現產業集聚對企業規模有顯著的正面影響。lin等2011發現,產業集聚和企業生產率之間存在一種倒u型關系。yang和he2011發現貿易通過信息和分工影響到出口企業的地理集聚。
八宏觀政策的微觀影響利用工業企業數據庫,學者們還可以研究宏觀政策對企業微觀行為和績效的影響,并且以經驗研究的方式為宏觀政策分析提供微觀基礎。聶輝華等2009利用面板雙重差分did模型,發現2004年實行的增值稅轉型政策顯著地促進了企業的固定資產投資和勞動生產率,但是也減少了企業的雇傭人數。袁淵和左翔2011用did方法研究了2003~2005年浙江省擴權強縣政策對企業增長的影響,發現這一政策確實提高了縣域企業的銷售額增長率和資產增長率。彭方平和連玉君2010利用2000~2007年的工業企業數據,發現短期內提高利息的宏觀政策會導致企業的生產成本提高,從而導致通貨膨脹,即貨幣成本。song等2011推斷,金融歧視政策導致期第年濟經界世聶輝華江艇楊汝岱高效率企業的儲蓄率上升和快速的增長,并進而導致巨額的外匯儲備和貿易順差,然后用1998~2007年的工業企業數據對此進行了驗證。
九其他與工業企業數據庫有關的其他經驗研究主要聚焦于就業問題。方明月等2010利用1999~2005年的工業企業數據,采取系統廣義矩估計gmm方法比較了不同所有制企業的產出的微觀就業彈性,發現國有企業的就業彈性低于民營企業的就業彈性。張光南等2010利用1998~2006年工業企業數據加總得到各省的基礎設施、產出和就業數據,計算了基礎設施對產出和就業的彈性。dong和xu2009討論中國公共部門和私人部門之間的勞動力流動對中國經濟增長的貢獻。
四數據庫潛在問題中國工業企業數據庫為微觀計量經濟學研究貢獻了不可或缺的素材,但是這個數據庫并非完美無缺,而是問題重重。作為使用者,我們發現了工業企業數據庫存在樣本錯配、指標缺失、指標異常、樣本選擇和測度誤差等諸多問題。如果忽視這些問題,經驗研究的結果可能不穩健,甚至可能是錯誤的。現有文獻部分地發現了這些問題,并且提供了部分解決方法。下面,我們在現有文獻的基礎上,結合我們的使用經驗,將工業企業數據庫的潛在問題進行歸納,并且盡可能地提供解決問題的方法建議。
一樣本匹配問題對于一個多年企業數據來說,整理數據的第一步就是構建一個以企業id和年份為兩維的面板數據。這通常不是一個問題,但是對于中國工業企業數據庫卻是一個非常棘手的問題。因為在該數據庫中,難以找到一個識別每個樣本企業的唯一特征來進行編碼。通常的做法是,根據企業代碼、企業名稱、法人代表姓名、地址、郵編、電話、行業代碼、主要產品名稱、開業時間等基本信息來識別不同的樣本點是否來自同一家企業。但是因為這些基本信息在申報時沒有統一格式,在缺乏有效的智能模糊匹配手段的情況下,精確匹配的可操作性不強。其中,企業代碼和企業名稱的準確性相對較高,可以作為我們進行匹配所依據的主要信息,比如brandt等2012就是先根據相同的企業代碼識別同一家企業,然后再根據相同的企業名稱進行識別,最后再參考其他基本信息。這種序貫識別法假定企業代碼的準確性最高,企業名稱準確性其次。也就是說共享同一企業代碼的樣本點必然被識別為同一企業,但同一企業的各樣本點可能擁有不同的企業代碼。在本數據庫中,不但存在同一企業更改企業代碼的情況例如在期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題發生改制或重組之后,更重要的是,還存在不同的企業共享企業代碼的情況也許是統計失誤。企業名稱這一變量也存在類似問題。很多企業在改制、重組或者擴張時更改了企業名稱。例如,中國有不少企業先是名為xx廠,然后改名為xx有限責任公司,接著又稱為xx股份有限公司。有時企業名稱中的地理位置也略有差異,例如從xx市機電廠變成xx機電廠。如果按照企業名稱進行精確匹配會錯誤地識別出過多的企業。
我們建議的做法是:將企業按企業代碼和企業名稱分別進行兩次分組,然后考察同一名稱組下的企業是否分屬不同的代碼組。若是,則將這些不同代碼組內的所有企業都歸為一組對每一名稱組都依此進行操作,不斷重新歸組,可以稱之為交叉匹配;若新組內沒有年份重復的觀測值,則將這一組樣本點識別為同一家企業;若新組內存在年份重復的觀測值,則進入下一步人工識別。在人工識別階段可能存在多種情況,需要根據數據特征和基本信息進行綜合判斷。例如,同一組內的樣本點可能屬于同一家企業,只是其中某些年份有兩個觀測值,這兩個觀測值只需要保留一個,另一個完全重復或關鍵變量均缺失。同一組內的樣本點也可能屬于不同企業,但其中可能存在企業代碼登記錯誤的情況,此時需要參照企業名稱、法人代表姓名、地址、行業代碼、銷售額或注冊資本等關鍵變量的數量級等信息進行分類,確定哪些樣本屬于同一家企業。我們發現,使用交叉匹配方法后,大約有10的觀測值大約20萬個屬于名稱相同但法人代碼不同或者相反的情況。顯然,如果忽視匹配問題會嚴重地影響樣本的真實性和準確性。
除了企業匹配存在一些障礙,產業匹配也有一些問題。使用者必須注意到,2002年前后統計局使用了兩種產業分類標準:2002年及其之前的年份為gb/t 4754-1994,2002年之后為gb/t 4754-2002.兩種行業分類標準在兩位數行業上沒有差異,在三位數行業上有一些差異,在四位數行業上有較大差異。楊汝岱和鄭辛迎2011與楊汝岱和熊瑞祥2011將1994gb四位數行業分類對應到2002gb三位數行業分類,這是一種可供參考的做法。
二指標缺失問題工業企業數據庫每年的統計對象和口徑都有所不同,導致一些重要指標在若干年份缺失。首先,有些工業企業數據庫直接將2004年的經濟普查數據與其他年份混編在一起,而沒有和其他年份進行匹配。這導致2004年的數據缺少工業總產值、工業增期第年濟經界世聶輝華江艇楊汝岱最近,很多研究將工業企業數據庫和海關數據庫結合起來。對于此類研究的某些主題,還需要將國民經濟行業分類與海關hs產品分類對應起來,具體分析可以參考楊汝岱2008.
加值、出口交貨值和研究開發費等重要指標。與此同時,和2004年相比,其他年份又缺少關于工會、男女職工的學歷和技術職稱等指標。因此,使用者在分析數據之前,應該先查看2004年數據和其他年份數據之間的指標差異。
其次,2003年前后的指標也有一些不同。例如,2001年之前的數據不包括研發費用。有些數據庫中1999~2003年的工業企業數據沒有工業增加值,也沒有應收賬款,但是有應收賬款凈額。根據會計準則,應收賬款凈額=應收賬款總額-壞賬準備期末余額,因此兩者不能簡單地比較。在缺失工業增加值的年份,使用者可以根據會計準則估算工業增加值:工業增加值=工業總產值-工業中間投入增值稅。在沒有工業總產值的年份例如2004年,估算公式為:工業增加值=產品銷售額-期初存貨期末存貨-工業中間投入增值稅。劉小玄和李雙杰2008就采取了這種估算方法。
我們用第一個公式估算了2005~2007年的工業增加值,發現平均而言估算值略小于報告值。當使用者用工業增加值來計算生產率時,應注意到這種差別。
報告的和估算的工業增加值比較千元報告值計算值觀測值個數說明:報告值和估算值皆為均值,且計算時未剔除異常觀測值。
需要特別指出的是,盡管工業企業數據庫提供了企業的出口交貨值,但據此只能判斷企業是否出口,而無法區分出口類型是加工貿易還是一般貿易。對于勞動密集型的加工貿易企業而言,其勞動生產率和全要素生產率很可能低于一般貿易的出口企業。另外,加工貿易是發展中國家的特殊現象。如果不區分兩類出口企業,簡單地將全部出口企業的效率與內銷企業的效率相比,那么得到出口企業的平均效率低于內銷企業也就不足為奇了。
事實上,dai等2011將工業企業數據與海關數據匹配,在剔除了加工貿易企業之后,發現生產率悖論并不存在。
三指標異常問題盡管工業企業數據庫包含了130多個指標,但是有相當多的指標存在異常值。異常值的存在使得很多觀測值無效,因此在進行計量回歸前必須予以剔除。我們注意期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題在這個意義上,我們認為工業企業數據庫本身可能不適于檢驗國際貿易的企業異質性假說。
一些學者對工業企業數據庫和海關數據庫進行了匹配,但由于原始數據結構和方法各異,匹配效果差別甚大。yu2011根據郵編和電話等信息匹配了海關庫30的出口企業,而tang2011匹配了工業庫70的出口企業。yang和he2011以企業名稱、郵編、電話等信息為基礎,采用關鍵詞數據庫搜尋匹配方法,匹配了海關庫60的出口份額。
到,cai和liu2009使用了比較全面的剔除方式,因此被較多的研究者所借鑒。第一步,他們剔除了關鍵指標例如,總資產、職工人數、工業總產值、固定資產凈值和銷售額缺失的觀測值;第二步,他們剔除了不滿足規模以上標準的觀測值,即固定資產凈值低于1000萬元,或者銷售額低于1000萬元,或者職工人數少于30人的觀測值;第三步,他們剔除了一些明顯不符合會計原則的觀測值,包括總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊的觀測值;第四步,他們剔除了關鍵指標的極端值前后各0.5.
以1999~2007年為例,我們分析了指標異常問題。首先,在總共2048 833個觀測值中,我們剔除了銷售額、職工人數、總資產或固定資產凈值缺失的觀測值5900多個,約占全部觀測值的0.3.其次,我們根據謝千里等2008的做法,剔除了職工人數少于8人的觀測值28 000多個這些企業缺乏可靠的會計系統,約占總數的1.
再次,我們剔除了總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊的觀測值200多個。最后,我們剔除了銷售額低于500萬元的觀測值176 500多個,約占總數的9.經過上述四個步驟,我們總共剔除了大約20萬個觀測值,約占總數的10.盡管進行了上述剔除,但是我們仍然發現有不少觀測值屬于異常值。例如,如果按照bai等2009的標準,利潤率低于0.1或者高于99的觀測值均為異常值,那么這部分異常值還有大約43萬個,約占總數的23.或者我們使用一種比較寬松的標準,會發現實收資本小于或等于0的異常觀測值有11 000多個,約占總數的6.因此,即便做了上述剔除,使用者仍然需要剔除計量方程的關鍵變量或參數所對應的異常值。我們將未做任何剔除的主要指標的異常情況總結為表3.
主要指標的異常情況剔除標準異常值個數觀測值總數異常值比例銷售額、職工人數、總資產或固定資產凈值缺失職工人數少于8總資產小于流動資產,總資產小于固定資產凈值,或者累計折舊小于當期折舊銷售額低于500萬元利潤率低于0.1或者高于99實收資本小于或等于0期第年濟經界世聶輝華江艇楊汝岱他們使用的規模以上的標準不同于官方標準銷售額在500萬元以上。
四測度誤差問題國家統計局在收集工業企業數據時,不是一次性交給企業一份報表,而是讓企業通過年報和定期上報的方式將數據報告給統計局,然后統計局再進行匯總。事實上,企業上報系統至少包括四套表格:綜合年報表、綜合定報表、基層年報表和基層定報表。這意味著,由于統計時間或者統計口徑不同,即使對同一個指標,企業在不同時間上報的數值也可能不一樣。另外,很多規模不大的企業仍然缺乏可靠的會計系統,或者為了避稅而瞞報,甚至錯報有關指標,這些都會導致測度誤差問題。
以研發費為例。在2001~2007年不含普查年份2004年,在總共140多萬個觀測值中,研發費顯示為0的觀測值有120多萬個,占總數的89.研發費報告為0的有3種情況:1企業沒有研發支出,因此研發費確實為0;2企業不清楚,任意地報告0;3企業沒填寫此項,統計人員直接賦值0.如果是第1、2種情況,那么這更可能發生在中小企業身上。于是,我們剔除了銷售額低于3億元的中小企業,又剔除了出口企業,發現在剩下的28 000多個觀測值中,研發費顯示為0的仍然有20 000多個,比例超過70.這里提醒研究者注意兩點:第一,如果絕大多數中小企業沒有研發費,并且這是真實的情況,那么在分析企業研發支出或創新的決定因素時,最好使用tobit截斷模型例如聶輝華等,2008,因為這比最小二乘法ols回歸更可能得到一致估計;第二,如果我們無法區分第2、3種情況,那么研發費這一指標的準確性和真實性就值得懷疑,此時用工業企業數據庫來分析研發的決定因素或者研發績效可能是不恰當的。
存在明顯測度誤差的其他指標主要是利潤和增加值。由于企業報告的利潤和增加值與企業的稅負正相關,因此企業在監管不力的前提下可能會低報或誤報這兩個指標。事實上,cai和liu2009根據會計準則估算了企業的利潤=工業總產值-中間投入-財務費用-工資-當期折舊-增值稅,然后發現在2000~2005年間,估算利潤率均值為0.1431,而企業報告的利潤率均值為0.0515,后者比前者少了2 /3以上。
此外,根據我們前面對2005~2007年間工業增加值的估算,可以發現估算的工業增加值要略小于報告的工業增加值。
另一個不屬于經典測度誤差但是與此有關的問題是虛假指標問題。在1999~2007年間,根據注冊類型,有大約1 /5的觀測值大約40萬個屬于外資企業包括港澳臺商投資企業和外商投資企業。這一比例之高超乎我們的直覺,因為眾所周知的事實是,外資企業可以享受各種稅收優惠。進一步分析發現,這些樣本企業雖然登記為外資企業,但是在其實收資本份額中,有6的港澳臺資本或外商資本金額為0,其期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題中有一半左右的登記注冊號明確標明了外資身份例如注明企合津總字第xx號。這有兩種可能,一是這些企業以前是外資企業,但是變更了實收資本之后沒有及時變更登記注冊類型;二是這些企業錯誤地填報了注冊類型。剩下的94的外資企業,我們無法確認其真實身份,也難以排除其中的假外企。
五樣本選擇問題在樣本選擇方面,工業企業數據庫的一個突出問題是,包括了全部的國有工業企業,但是只包括了規模以上的非國有工業企業。因此,當使用者要對比國有企業和非國有企業的行為及績效時,最好將規模以下的國有企業樣本剔除。而當使用者在研究產業集聚問題時,可能會低估非國有企業的集聚程度lu和tao,2009.但規模以上的樣本并非都是隨機的。在1999~2007年間的總共200多萬個觀測值中,只有大約8的企業每年都存在,有大約22的企業在最后三年都存在。一個企業某年不在樣本中,可能是因為當年銷售額小于500萬元,也可能是因為破產、重組或者更改名稱等原因,還有可能是被漏報。在這種情況下,我們難以嚴格地界定企業的進入和退出,因此研究者在用這個數據庫分析企業動態學時必須力爭解決或減緩這個問題。
另外,該數據庫中包含了企業所在地的詳細信息,使用者可以識別出企業是否處于經濟特區或經濟開發區。因為經濟特區或經濟開發區的企業具有自身的特點,這種區分有助于減少企業在比較生產率、產業集聚、利潤率以及融資成本等方面的樣本選擇問題。還有一個比較棘手的問題是,統計局對企業的統計口徑是法人企業,而不是企業集團或工廠。因此,有很多屬于同一個企業集團的企業會被認定為不同的企業,而多個工廠的差別則會被掩蓋在企業內部。
六變量定義問題分析中國的企業不可能忽略企業的所有制問題。我們注意到,現有文獻在識別企業的所有制時通常采取兩種方式:注冊類型或實收資本。這兩種識別企業所有制的方法其實是有差別的。前者表示企業在工商局登記注冊時的類型,后者能夠表示企業當時的真實控股類型。我們不妨將注冊類型為國有、國有聯營、國有與集體聯營、國有獨資公司這幾類企業定義為i類國有企業,同時根據實收資本將國有資本比例超過50的企業定義為ii類國有企業。在1999~2007年工業企業數據庫中,在剔除了實收資本為異常值的觀測值之后,i類國企有245 376個觀測值,ii類國企有252 629個觀測值,后者比前者多3左右,兩者重合的觀測值大約占i類國企的84,這意味著至少有15的國有企業雖然注冊類型是國有企業,但是已經不是真正的國有業企了。由于控股比例更能及時地反映企業的所有制類型,因此我們建議使用者最好期第年濟經界世聶輝華江艇楊汝岱使用實收資本比例來定義企業所有制。
外資企業的識別也存在類似的問題。根據中國的法律,外資企業的投資比例原則上不低于25.盡管有大約1 /5的觀測值的注冊類型顯示為外資企業,但是其中有10觀測值的港澳臺商投資或外商投資比例低于25.一些研究者以外商的實收資本比例是否超過25作為識別外資企業的方法路江涌,2008.
除了所有制類型,一個難以準確定義的變量就是資本。理論上,資本是固定資產存貨和投資流量的加總。多數文獻的做法是,將資本定義為固定資產原價或者固定資產凈值,然后采取永續盤存法來計算投資i it-1,其中i表示投資,k率的選取通常是5、10或15.此外,還應該采取不同的價格指數對產值、資本、投資和中間投入等變量進行平減。我們必須提醒使用者的是,不同的資本定義方法、折舊率以及價格平減指數會得到不同的結果。brandt等2012提供了比較詳細的說明和操作程序。
陳林、朱衛2011:《創新、市場結構與行政進入壁壘―――基于中國工業企業數據的熊彼特假說實證檢驗》,戴覓、余淼杰2012:《企業出口前研發投入、出口及生產率進步》,北京大學工作論文。
李春頂2010:《中國出口企業是否存在生產率悖論:基于中國制造業企業數據的檢驗》,《世界經濟》第7期。
劉小玄、李雙杰2008:《制造業企業相對效率的度量和比較及其外生決定因素2000―2004》,《經濟學羅雨澤、朱善利、陳玉宇、羅來軍2008:《外商直接投資的空間外溢效應:對中國區域企業生產率影響的經聶輝華、譚松濤、王宇鋒2008:《創新、企業規模和市場競爭―――基于中國企業層面面板數據的證據》,《世聶輝華、方明月、李濤2009:《增值稅轉型對企業行為和績效的影響―――以東北地區為例》,《管理世界》第期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題每個企業報告了總的實收資本以及國有、集體、法人、私人、港澳臺和外商等6種成分的實收資本數額,因此企業的其他所有制類型也可以通過實收資本比例來識別。
亓朋、許和連、艾洪山2008:《外商直接投資企業對內資企業的溢出效應:對中國制造業企業的實證研究》,楊汝岱、熊瑞祥2011:《干中學與中國工業企業出口生產率》,湘潭大學工作論文。
楊汝岱、鄭辛迎2011:《垂直專業化對員工工資的差異化影響》,湘潭大學工作論文。
張光南、李小瑛、陳廣漢2010:《中國基礎設施的就業、產出和投資效應―――基于1998-2006年省際工業企張杰、李勇、劉志彪2009:《出口促進中國企業生產率提高嗎?―――來自中國本土制造業企業的經驗證據:趙偉、趙金亮、韓媛媛2011:《異質性、沉沒成本與中國企業出口決定:來自中國微觀企業的經驗證據》,《世期第年濟經界世聶輝華江艇楊汝岱截稿:2012年3月責任編輯:王徽期第年濟經界世中國工業企業數據庫的使用現狀和潛在問題
本文標簽:中國工業企業數據庫的使用現狀和潛在問題
* 由于無法獲得聯系方式等原因,本網使用的文字及圖片的作品報酬未能及時支付,在此深表歉意,請《中國工業企業數據庫的使用現狀和潛在問題》相關權利人與機電之家網取得聯系。