资本市场错误定价对公司投资行为的影响研究
上QQ阅读APP看书,第一时间看更新

第一节 中国上市公司的行业分类标准及样本选择

RKV模型分解托宾Q方法和测度可操控性利润都需要对上市公司按行业特征进行分类回归,上市公司的行业分类必然会影响对错误定价的测度,从而对实证研究结果产生重大的影响。目前,世界上比较通用的几种行业划分标准主要有联合国国际标准行业分类、北美行业分类标准和摩根斯丹利全球行业分类等。国内和国外不同数据库根据北美标准行业分类SIC对企业行业分类的结果是有明显差异的,国内不同数据库对中国上市公司的行业分类有很多种标准。中国证券业监督管理委员会以国家统计局《国民经济行业分类与代码》为主要依据,借鉴联合国国际标准行业分类和北美行业分类,于2001年4月4日颁布了《上市公司行业分类指引》(以下简称《指引》)。相关研究表明,《指引》的总体分类效果比其他行业分类标准适合中国产业结构的现状。因此,本书采用中国证监会2001年4月颁布的《指引》作为行业分类标准。

《指引》将上市公司划分为3级分类,包括13个门类、91个大类和288个中类。资本市场作为国民经济的缩影,处于工业化初期后半阶段的中国经济中,制造业在中国上市公司中占主导地位。因此,中国证监会在制造业的门类和大类之间增设了9个辅助性分类。考虑到行业门类的划分过于宽泛例如,对于同属于制造业门类的金属非金属(C6)和医药、生物制品制造业(C8)两个行业大类,二者在面临市场结构、产品特性方面显然有很大的差异,继而影响其行业错误定价的差异。如果以行业门类为基准进行划分,这两个行业大类同属一个行业(门类)。,因此我们对制造业进行了行业大分类。由于对企业进行去规模化处理,需要用到年初的总资产数据,而证监会行业分类从2001年才开始,因此我们把2002年至2010年的沪深两市所有上市公司作为初选样本。我们进一步对这些公司执行如下筛选程序:(1)按照一般文献的做法,剔除ST和PT类上市公司。(2)剔除离年度会计报表报告日上市时间不足1年的公司。剔除这些公司的原因是,本书需要用到上年财务指标以计算公司操纵性应计利润,而新上市公司由于上市融资,公司规模和股本结构发生较大变化,而这会引起操纵性应计利润计算的误差。(3)剔除金融保险行业的上市公司。由于金融保险行业公司运营不同于其他行业,而且投资与其他行业相比具有独特性,因此我们剔除金融保险行业公司样本。(4)剔除缺少营业收入、营业利润、经营活动现金流量、购买固定资产、长期资产和无形资产支付的现金和固定资产增加数等财务数据的公司上述样本选择过程参考了张国清、夏立军和方轶强(2006)的方法。。(5)剔除运营行业特征不明显的综合类行业,以及样本数据太少的传播文化产业和社会服务业,经过上述程序,我们把中国上市公司分类到12个行业,各行业各年度的样本公司和年度观察值见表3-1。另外,由于2003年财政部印发了《企业会计准则——资产负债表日后事项》的通知,固定资产增加数在财务报表附注详细披露。如果要计算2002年可操控性应计利润,就需要用到2001年的数据。因此,我们的样本区间为2003—2010年。本书研究中使用的公司财务指标、股票价格、行业分类、上市时间等数据均来自于CSMAR中国股票市场研究和中国上市公司财务报表数据库,数据处理使用Stata 12.0统计软件进行。

表3-1 研究样本的年度及行业分布

注:(1)行业按照证监会2001年颁布的分类标准,对制造业按照二级明细划分为小类,剔除运营不同于其他行业的金融保险业、行业特征不明显的综合类行业,以及样本数据太少的传播文化产业和社会服务业。(2)考虑到行业门类的划分过于宽泛,因此我们对制造业进行了行业大类划分。

表3-1揭示了如下信息:第一,电煤水、批发零售业和农林牧行业在不同样本年份的观测值数目变化较小;第二,其他行业在不同样本年份的观测值数目均有所变化,但是不同行业变化的程度却有相当大的差异,这种差异应当主要与国家的产业支持政策有关。例如,房地产行业观测值从2003年的107到2010年的141,尤其是从2006年开始,房地产企业数量大量增加,这主要是由于房地产热引发大量房地产企业上市或借壳上市。根据2008年科技部、财政部、国家税务总局联合制订的《国家重点支持的高新技术领域》,高新技术企业主要分布在生物与新医药技术、航空航天技术、电子信息技术、高技术服务业、新能源及节能技术、新材料技术、资源与环境技术和高新技术改造传统产业,这些产业主要分布在信息技术(行业代码G)和制造业大类行业中的机器设备仪表(C7)、电子(C5)和医药生物制品(C8)子类行业中。因此,高新技术企业上市公司数量变化比较大,如信息行业则从91增加到203,机械设备行业从158增加到290。观测值随着年份的推移不断增加,在进行实证分析时,要小心自由度或观测信息的损失。