论遗传基于遗传算法制造业上市公司财务困境预测实证
摘要:本文基于MATLAB软件运用遗传算法对最小二乘支持向量机进行参数估计,并在利用SPSS软件对相关财务指标进行正态分布测试和平均值检验以及非参数检验的基础上,建立财务危机预测模型。通过实证研究证明用遗传算法估计参数所建立的最小二乘向量机财务危机预测模型具有较高的预测准确率。
关键词:制造业上市公司 遗传算法 财务危机预警 实证研究
一、引言
企业财务活动体现了企业再生产过程中的资金运动,反映了企业同各个方面的经济关系。随着我国市场经济体制改革的深化和资本市场的快速发展,经济领域中的复杂性、不确定性日益凸显,尤其是2008年全球金融危机的发生,再次告诫管理者,及时、准确地预测企业的财务危机并加以提早化解危机,才能维持企业经营以至于宏观经济的稳定与健康。为了能够及时准确地对公司未来财务情况进行预测,国内外专家学者进行了一系列的模型设计与应用的尝试。早期建立的模型主要是传统统计类统计模型,主要代表是Fitzpatrick、Beer(2006)的一元判别分析模型;Altman的多元判别分析模型;Ohlson的Logit回归模型;Theodossiou的累积求和模型。然而这些传统统计类预警模型一般都没有突破线形判别方法的局限性,且无动态学习和调整功能。
近年来由于计算机技术的发展,出现了一些新兴的人工智能型财务预警模型,代表有Frydman(2007)等用决策树进行了财务危机预警模型研究,Odom、Coats & Fant、Charalambous etc.人工神经网络模型;Franeis EH将粗集理论应用于财务危机预警模型;Vapnik(2005)等首先提出支持向量机(Support Vector Machine,SVM)技术。
我国理论界对财务危机预警模型的研究起步比较晚,始于吴世农和黄世忠的Fisher 判别分析财务危机预警模型。此后,对财务危机预警模型的研究逐渐兴起,各种传统统计模型以及智能模型也逐步被引进关于财务危机模型的研究当中。杨淑娥、黄礼借助人工神经网络,对120 家上市公司的截面财务指标作为建模样本,进行了财务危机预警模型的研究;张华伦、孙毅提出了一种基于粗集——模糊神经网络的模型,并给出相应的算法;李贺、冯天谨(2005)运用SVM 模型,对我国烟酒行业50 家上市公司连续 3年的财务数据进行了实证研究。
研究表明:遗传算法具有较高的预测准确率,最小二乘支持向量机能将非线性的模型很好地转化为一维线性求极值的问题,实现了二维以及多维规划问题的简便实现途径。本文即基于遗传算法,结合最小二乘向量机,运用MATLAB语言,实现对我国制造业上市公司的财务危机预警。
利用LS-SVM模型进行降维转化为如下的优化问题:
最终求出的f(x)的只能取+1或-1。对本文来说,当 f(x)=+1时,其预测对应的是ST公司,当f(x)=-1时,对应健康公司。
(1)对于柯尔莫哥洛夫-斯米诺夫单样本正态分布检验。Shapiro-Wilk中Sig.值≥0.05为不符合正态分布检验的指标。因此,排除营业收入含量、资产负债率、固定资产比率等指标。(2)对符合正态分布的指标进行T检验。进行T检验目的就是验证ST公司与配对健康公司算数平均值是否相等。其中方差方程的 Levene 检验中Sig>0.05,均值方程的 t 检验中Sig.(双侧)<0.05的指标才符合均值相等。
关键词:制造业上市公司 遗传算法 财务危机预警 实证研究
一、引言
企业财务活动体现了企业再生产过程中的资金运动,反映了企业同各个方面的经济关系。随着我国市场经济体制改革的深化和资本市场的快速发展,经济领域中的复杂性、不确定性日益凸显,尤其是2008年全球金融危机的发生,再次告诫管理者,及时、准确地预测企业的财务危机并加以提早化解危机,才能维持企业经营以至于宏观经济的稳定与健康。为了能够及时准确地对公司未来财务情况进行预测,国内外专家学者进行了一系列的模型设计与应用的尝试。早期建立的模型主要是传统统计类统计模型,主要代表是Fitzpatrick、Beer(2006)的一元判别分析模型;Altman的多元判别分析模型;Ohlson的Logit回归模型;Theodossiou的累积求和模型。然而这些传统统计类预警模型一般都没有突破线形判别方法的局限性,且无动态学习和调整功能。
近年来由于计算机技术的发展,出现了一些新兴的人工智能型财务预警模型,代表有Frydman(2007)等用决策树进行了财务危机预警模型研究,Odom、Coats & Fant、Charalambous etc.人工神经网络模型;Franeis EH将粗集理论应用于财务危机预警模型;Vapnik(2005)等首先提出支持向量机(Support Vector Machine,SVM)技术。
我国理论界对财务危机预警模型的研究起步比较晚,始于吴世农和黄世忠的Fisher 判别分析财务危机预警模型。此后,对财务危机预警模型的研究逐渐兴起,各种传统统计模型以及智能模型也逐步被引进关于财务危机模型的研究当中。杨淑娥、黄礼借助人工神经网络,对120 家上市公司的截面财务指标作为建模样本,进行了财务危机预警模型的研究;张华伦、孙毅提出了一种基于粗集——模糊神经网络的模型,并给出相应的算法;李贺、冯天谨(2005)运用SVM 模型,对我国烟酒行业50 家上市公司连续 3年的财务数据进行了实证研究。
研究表明:遗传算法具有较高的预测准确率,最小二乘支持向量机能将非线性的模型很好地转化为一维线性求极值的问题,实现了二维以及多维规划问题的简便实现途径。本文即基于遗传算法,结合最小二乘向量机,运用MATLAB语言,实现对我国制造业上市公司的财务危机预警。
二、理论基础
(一) LS-SVM模型的原理
最小二乘支持向量机模型(LS-SVM模型)能够将二维规划问题转化为一维求极值问题。其模型为{(xi,yi )xi=l,2,3...n}。当输入xi就有一个yi与之对应。其中xi为被预测公司的财务指标数据,yi为预测出的公司状态,其只有两个结果。其中yi=+1代表财务困境公司。yi=-1代表公司财务运行健康。最小二乘支持向量机模型就是要建立这样的一个分类模型:利用LS-SVM模型进行降维转化为如下的优化问题:
最终求出的f(x)的只能取+1或-1。对本文来说,当 f(x)=+1时,其预测对应的是ST公司,当f(x)=-1时,对应健康公司。
(二)遗传算法原理
遗传算法的基本原理是随机产生一个符合该问题的初始个体,构成此问题的搜索空间,适应度函数根据该问题的适应度把适应度高的个体遗传到下一代,经过若干次的优化直到达到所要求的适应度。三、实证分析会计专业毕业小结
(一)样本选取
国内目前对财务困境的研究,一般都是将ST公司视为财务困境公司,但ST公司是盈利能力方面出了问题,并不意味着ST公司的流不足以履行偿还义务或违约。因此,ST公司并不等于财务困境公司。本文所使用的财务数据均是采用2005-2010年我国制造企业首次被ST的上市公司的财务报告。而这些被ST的上市公司原因是最近两个会计年度的审计结果显示的净利润均为负值的上市公司。这样剔除了由于其他原因而引起的ST,保证了数据的可靠性。而正是因为两年连续亏损后才在下一年被ST,所以选取这些公司被ST前第三年的财务数据才更具预测价值。例如2008年被首次ST的上市公司应该采用其2005年的财务数据。其中选取2005-2009年首次被ST的上市公司以及配对健康公司财务数据作为训练集用以提炼高预测度的财务指标和模型参数。配对健康公司指与ST公司同一年、规模大小相同、处于同一行业未被ST的上市公司,本文训练集有140家上市公司,其中ST公司70家,配对健康公司70家。选取2010年首次被ST的上市公司以及配对健康公司作为测试集,用来测试预测模型的准确率。测试共46家上市公司的财务数据,其中23家2010年首次被ST的上市公司,23家配对健康公司。因为选取的都是首次被特别处理的公司,因此没有重复的公司,健康公司也不重复,这就降低了财务指标的高相关性。(二)指标设置会计毕业论文答辩
本文在充分考虑财务指标之间互斥、敏感,以及财务指标可操作的基础上选取的指标体系如表1所示。(三)指标的选取
1.利用SPSS软件对25个财务指标进行正态性检验。在SPSS软件中对指标数据进行柯尔莫哥洛夫-斯米诺夫单样本正态分布检验。对于符合正态检验的财务指标进行T检验,对不符合正态分布的指标数据进行两独立样本曼-惠特尼方法非参数检验。(1)对于柯尔莫哥洛夫-斯米诺夫单样本正态分布检验。Shapiro-Wilk中Sig.值≥0.05为不符合正态分布检验的指标。因此,排除营业收入含量、资产负债率、固定资产比率等指标。(2)对符合正态分布的指标进行T检验。进行T检验目的就是验证ST公司与配对健康公司算数平均值是否相等。其中方差方程的 Levene 检验中Sig>0.05,均值方程的 t 检验中Sig.(双侧)<0.05的指标才符合均值相等。