spss系统工程运用回归分析法论文的范文

2024-05-11 15:56

1. spss系统工程运用回归分析法论文的范文

  运用逐步回归法
  分析影响上海银行存款的因素

  1.目的和意义
  在现代商品经济社会中,人们的工作与生活已经离不开货币。在生活中人们所需的各种商品,都需要用货币去购买;人们所需的各种服务,也需要支付货币来获得;人们劳动工作的所获得的报酬——工资,也是用货币支付的;人们为了种种目的,要积累财富,保存财富,采用的主要方式是积攒货币、到银行储蓄。除个人外,企业、行政事业部门的日常运行同样也离不开货币。财政收支也都是用货币进行的。可见,货币已经融入了并影响这经济运行和人们的生活。作为经营“货币”这种商品的银行的功能是办理各种存款(也称为负债业务)、放款和汇兑业务,其中商业银行所吸收的各种存款(活期、定期、储蓄)约占银行资金来源的70%~80%,为银行提供了绝大部分的资金来源,并为实现银行各职能活动提供了基础。所以说,银行存款对银行本身的生存和发展有着重要意义,除此之外,银行存款也能反映出一个特定时期人们的生活水平以及经济发展的水平。因此对上海的银行存款的分析是非常重要且必要的。本文将介绍运用SPSS11.5统计分析软件中的逐步回归法对影响上海银行存款的因素进行分析研究并建立模型,为相关专业人士的决策提供一定参考。

  2.影响银行存款的因素分析
  存款作为银行吸收资金来源的主要业务,其之影响因素非常的多。从中我选取了10个主要因素的(1951年至2000年)数据运用SPSS的逐步回归法分析和研究它们对上海银行存款的影响程度。这10个因素分别是全市居民储蓄(亿元)、从业人数(万人)、全市居民消费水平(元/人)、全市银行贷款(亿元)、全社会固定资产投资总额(亿元)、职工工资总额(亿元)、职工劳保福利费用(万元)、社会消费品零售总额(亿元)、外贸出口商品总额(亿美元)、全市财政收入(亿元)。上海全市银行存款及影响其的10个因素的1951年至2000年的数据见下表2.1。


  表2.1上海全市银行存款数据(1951年~2000年)
  年份 全市银行存款(亿元) 全市居民储蓄(亿元) 从业人数(万人) 全市居民消费水平(元/人) 全市银行贷款(亿元) 全社会固定资产投资总额(亿元) 职工工资总额(亿元) 职工劳保福利费用(万元) 社会消费品零售总额(亿元) 全市财政收入(亿元) 外贸出口商品总额(亿美元)
  1964 33.29 8.64 438.31 270 45.27 7.22 19.40 33117 26.55 73.35 6.52
  1965 37.66 9.98 460.76 276 49.77 7.75 20.07 33819 27.13 83.18 7.65
  1966 40.18 10.68 462.62 298 62.52 7.23 19.74 34536 28.72 92.49 8.74
  1967 43.58 10.60 478.39 300 71.82 4.61 20.22 35268 30.78 73.97 8.42
  1968 50.25 10.56 516.44 293 85.32 4.58 19.75 36016 29.94 83.98 8.49
  1969 57.42 10.18 536.70 309 82.12 7.45 21.06 36780 32.57 102.30 8.76
  1970 142.41 10.47 540.87 304 76.05 10.90 20.63 37560 31.85 114.02 8.67
  1971 155.28 11.29 560.29 318 88.74 11.36 21.14 38356 32.91 123.53 9.81
  1972 167.81 12.51 576.74 334 99.41 13.23 22.08 39169 36.15 129.11 13.30
  1973 175.86 13.13 589.52 357 112.66 16.24 22.37 39999 39.79 138.18 23.16
  1974 178.21 13.85 610.16 380 125.13 22.43 22.80 40847 44.06 143.04 24.39
  1975 185.09 14.66 646.88 397 129.61 32.53 23.49 41737 47.71 147.11 22.20
  1976 182.60 15.37 669.56 408 133.97 23.96 24.79 46531 49.98 144.42 19.78
  1977 205.30 16.00 679.65 411 143.19 18.00 24.97 49797 49.28 159.91 22.21
  1978 242.93 18.18 698.32 442 153.37 27.91 28.12 57424 54.10 190.67 28.93
  1979 267.92 24.88 712.59 527 165.16 35.58 32.73 81664 68.28 192.75 36.75
  1980 291.06 30.20 730.77 582 200.98 45.43 38.10 94004 80.43 198.85 42.66
  1981 148.85 32.92 750.22 638 221.98 54.60 39.59 102061 88.73 204.52 38.07
  1982 170.56 37.94 764.03 640 227.77 71.34 41.34 113909 89.80 200.69 36.05
  1983 190.73 45.97 768.90 688 239.50 75.95 42.91 127679 100.68 204.34 36.48
  1984 222.51 56.10 769.79 789 245.35 91.72 53.72 152282 123.72 215.79 35.87
  1985 261.09 70.09 775.53 1030 306.27 118.56 68.99 190217 173.39 263.86 33.61
  1986 324.81 90.95 782.99 1190 427.66 146.93 83.35 233574 196.84 257.72 35.82
  1987 396.38 120.33 788.12 1298 523.35 186.30 94.78 286323 225.25 241.36 41.60
  1988 419.68 141.21 792.13 1680 576.11 245.27 114.47 391974 295.83 261.69 46.05
  1989 473.73 193.47 784.96 1928 698.71 214.76 131.10 437789 331.38 297.25 50.32
  1990 613.86 252.16 787.72 2009 857.76 227.08 146.78 533797 333.86 284.36 53.21
  1991 769.95 328.22 798.13 2421 1008.82 258.30 172.84 670676 382.06 324.66 57.40
  1992 1051.45 413.09 806.91 2842 1213.32 357.38 217.21 804903 464.82 340.13 65.55
  1993 1495.06 578.39 787.25 4162 1605.57 653.91 279.33 1038701 624.30 439.53 73.82
  1994 2247.56 975.95 786.04 5343 1966.96 1123.29 357.89 1241344 770.74 615.91 90.77
  1995 3056.76 1396.13 794.19 6712 2387.33 1601.79 440.75 1496034 970.04 702.46 115.77
  1996 3870.98 1868.34 851.21 7742 2852.66 1952.05 492.70 1873885 1161.30 873.76 132.38
  1997 5560.65 2729.57 847.25 8699 3722.30 1977.59 510.10 1931500 1325.21 1070.95 147.24
  1998 5595.43 2372.94 836.21 9202 4259.71 1964.83 510.35 1878137 1471.03 1146.00 159.56
  1999 6270.91 2597.12 812.09 10328 4862.03 1856.72 583.54 2095239 1590.38 1390.58 187.85
  2000 6925.99 2524.05 828.35 11546 5415.71 2015.76 614.53 2521553 1722.27 1752.70 253.54
  注:该表数据来源:《上海统计年鉴》

  2.1全市居民储蓄(亿元)
  个人货币收入是用来供个人消费的,积蓄是准备用作远期消费或不可预测的需要,它们都不是资本,金额也比较小。由于现代银行制度的发展,举办储蓄,并支付利息,小额的货币收入就可以转化为资本,从而扩大了社会资本总量,加速经济的发展。由表2.1可看到,随着社会经济的发展和人们收入的不断提高,全市居民储蓄从1951年的1.01亿元增加至2000年的2524.05亿元,特别是1985年之后呈快速增长趋势。可见社会公众的储蓄增长会提高银行盈利资产的规模,一定程度上使商业银行获得更多的收益。所以,全市居民储蓄对银行存款有着直接而深远的影响。

  2.2从业人数(万人)
  从业人数是指在全市各行各业的企事业单位中从事工作人数的总和,其包括了国有、集体、合资、独资等其他单位的从业人员,城镇个体劳动者,农村集体和个体劳动者以及其他劳动者。从表2.1可知,从业人数是呈稳定增长趋势的,这与全市人口的增加有着极大的关系。上海近十几年经济的飞速发展和国际大都市的形象,吸引了大批的外来人口(外地和外国)来沪居住、创业以及工作。随着全市企业数量的不断增加,从业人数也在不断的增加。从业人数的多少与银行存款有着紧密的联系,因为每个从业人员都会有自己的收入,不管收入的多与寡,他们每个人都会在银行拥有一个以上的帐户并利用存折、借计卡来取工资或办理各种活期、定期的储蓄或取款;利用信用卡刷卡消费或提款。

  2.3全市居民消费水平(元/人)
  居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出来。反映居民消费水平的主要指标有:
  (1)平均实物消费量指标:平均每人全年主要有消费品的消费量、平均每百户耐用消费品拥有量、人均居住面积、平均每人生活用水量、平均每人生活用电量等;
  (2)现代化生活设施的普及程度指标:自来水普及率、煤气普及率、平均每百户主要家用电器拥有量、电话普及率等;
  (3)反映消费水平的消费结构指标:居民生活消费支出中食品的比例、居民生活消费支出中文化生活服务支出比例、不同质量消费品的消费比例等;
  (4)平均消费量的价值指标:平均每人消费基金、平均每人生活消费额、平均每人用于各项生活消费的支出等。
  从表2.1中可以看到1990年以后的居民消费水平有了大大的提升,可见人们的生活质量随着改革开放的步伐的加快也越来越好。

  2.4全市银行贷款(亿元)
  贷款,又称放款,是银行将其所吸收的资金,按一定的利率贷给客户并约定归还期限的业务。虽然银行运用资金的方式不止贷款一种,但是贷款是商业银行在其资产业务中的比重一般占首位。通过贷款联系,银行可密切与工商企业往来联系,有利于拓宽业务领域,获得更多的利润。银行贷款的种类按不同的标注至少又以下几类:按期限分为短期贷款、中期贷款和长期贷款;按用途可分为投资贷款、商业贷款、消费贷款和农业贷款;按贷款是否有抵押品分为:抵押贷款和无抵押贷款;按换款的方式分为:一次偿还贷款和分期偿还贷款。从表2.1可知,银行贷款不断的大幅度增加,表明了经济的快速发展和人们消费理念的变化。

  2.5全社会固定资产投资总额(亿元)
  固定资产投资总额是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。全社会固定资产投资包括基本建设投资、更新改造投资、国有单位其他固定资产投资、房地产开发投资、城镇集体固定资产投资、联营经济、股份制经济、外商投资经济、港澳台投资经济及其他经济类型的固定资产投资,农村集体5万元以上固定资产投资,城镇工矿区私人建房投资和国防、人防基本建设投资。
  全社会固定资产投资按经济类型可分为国有、集体、个体、联营、股份制、外商、港澳台商、其他等。按照管理渠道,全社会固定资产投资总额分为基本建设、更新改造、房地产开发投资和其他固定资产投资四个部分。
  是社会固定资产再生产的主要手段。通过建造和购置固定资产的活动,国民经济不断采用先进技术装备,建立新兴部门,进一步调整经济结构和生产力的地区分布,增强经济实力,为改善人民物质文化生活创造物质条件。这对我国的社会主义现代化建设具有重要意义。
  从表2.1可知,固定资产投资的总额是呈不固定态势来增长的,2000年的固定资产投资总额比1900年的增长8.8倍,非常真实地反映了上海在上世纪90年代经济的腾飞。

  2.6职工工资总额(亿元)
  职工工资总额是指各单位在一定时期内直接支付给本单位全部职工的劳动报酬的总和,包括奖金、津贴、补贴、加班工资和其他工资(附加工资、保留工资以及调整工资补发的上年工资等)。职工工资从某种程度上来说是市民收入的主要来源。而收入比较高的话,居民用于消费和储蓄的金额也会有相应的提高,所以职工工资直接影响着银行存款。

  2.7职工劳保福利费用(万元)
  劳保福利是指劳动保险和福利。为了保护工人职工的健康,减轻其生活中的困难,我国对劳动保险制定了相应的法律条文。福利指员工与工人福利之总称,亦指以企业员工为对象而实施的福利措施,包括法定的福利,企业主与工会所实施的提高职工生活水准的各种措施。由表2.1可知,2000年,单位支付职工劳保福利费用的总额已经达到2521553万元,并且其比例每年以3%~8%的速度增长,已高达67.9%,这一数据说明人们的基本生活标准可以得到保障,从而有更多的钱用于其它的消费和用于储蓄存款或其他金融投资。

  2.8社会消费品零售总额(亿元)
  社会消费品零售总额是指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。包括售给城乡居民用于生活消费的商品(不包括住房)和售给机关、团体、部队、学校、企业、事业单位和城市街道居民委员会、农村村民委员会用公款购买的用作非生产、非经营使用的消费品。这个指标反映通过各种商品流通渠道向居民和社会集团供应生活消费品来满足他们生活需要的情况,是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。

  2.9全市财政收入(亿元)
  财政既然要提供公共物品来满足公共需要,就要从国内总收入(GDI——与生产指标GDP相对应的收入指标)中集中一部分收入,从这个意义上来理解,财政收入是指一定量的货币收入,即国家占有的以货币表现的一定量的国内总收入;财政收入又可以理解为一个分配过程,这一过程是财政运行的第一个阶段或第一个环节,在其中形成特定的分配关系或利益关系。财政收入按其形式分为税收、收费、债务收入、铸币税和通货膨胀税。财政运行是国民经济的运行的一个部分,国民经济的运行决定了财政的运行,而财政的运行也反过来影响国民经济的运行,直接影响投资、消费和进出口,影响GDP的增长和结构,影响收入分配和各阶层之间的收入差距,影响经济的稳定和可持续发展。

  2.10外贸出口商品总额(亿美元)
  对外出口贸易一直以来是上海经济发展的重要环节及体现,也是赚取外汇,达到国际收支平衡和增加国际储备的前提条件。随着中国加入WTO,上海的对外贸易也越来越频繁且出口的商品数量和金额也大大的提高。目前国际货物买卖合同中买卖双方就支付条款的订立大多都通过银行采用现汇结算的方式。在国际货物买卖中使用的结算工具主要是货币和票据,而银行作为买卖双方的结算中介为其办理汇兑业务、信用证业务、承兑业务。前两者是银行存款业务衍生出来的结算业务,而承兑业务是以银行的信用来确保客户的信用。到2000年底,一般贸易出口增幅继续高于加工贸易,而出口产品结构调整也随之加快,高新技术产品和机电产品出口快速增长。

  3.回归方法与模型建立
  3.1研究方法与原理
  运用多元线性逐步回归方法研究预测影响上海的银行存款的因素。逐步回归是按自变量对因变量的作用程度从大到小逐个引入回归方程,每引入一个变量同时检验方程中各个自变量的显著性,合格保留、不显著剔除,反复进行直到再没有显著的变量可以引入为止。回归分析是根据自变量的最有组合建立回归方程(模型)预测因变量的未来发展趋势。
  该方法的运用条件是有大量的观测统计数据,适用研究没有确定关系形式的因素对象,运用工具为SPSS统计软件。

  3.2模型的建立及求解
  因为银行存款与大部分变量呈指数关系,所以把表2.1的各个原始变量的50年数据进行对数变换(LN10()),并且把转换后的样本数据倒退8年后来建模。
  设多元线性回归的模型为:
  lnY=β0+β1X1+β2X2+β3X3+…+β9X9+β10X10
  其中:
  Y:全市银行存款(亿元)
  X1 ——全市居民储蓄(亿元)             X6 ——职工工资总额(亿元)
  X2 ——从业人数(万人)                 X7 ——职工劳保福利费用(万元)
  X3 ——全市居民消费水平(元/人)        X8 ——社会消费品零售总额(亿元)
  X4 ——全市银行贷款(亿元)             X9 ——全市财政收入(亿元)
  X5 ——全社会固定资产投资总额(亿元)   X10 —— 外贸出口商品总额(亿美元)

  注:模型中倒退的年数用(t-n)表示,其中n表示倒退几年。(t-n)不参与任何计算,它只做标识之用。
  利用SPSS11.5对样本数据进行统计分析,运行后的输出的结果如表3.2.1所示。

  表3.2.1   逐步回归统计分析结果  Coefficients
  Model   Unstandardized Coefficients Standardized Coefficients t Sig.
  B Std. Error Beta
  18 (Constant) -.994 1.012   -.982 .334
  居储7 .692 .146 .595 4.741 .000
  从人1 1.386 .604 .216 2.294 .029
  固投6 -.285 .046 -.280 -6.246 .000
  财政4 -.634 .146 -.289 -4.358 .000
  银贷4 1.007 .100 .813 10.057 .000
  劳福2 -1.396 .189 -1.221 -7.380 .000
  工资1 1.053 .232 .754 4.531 .000
  财政3 -.670 .134 -.311 -5.005 .000
  从人8 -2.413 .336 -.485 -7.184 .000
  从人2 2.954 .670 .479 4.406 .000
  银贷2 .520 .110 .440 4.703 .000
  劳福6 .418 .193 .305 2.168 .039

  即回归模型为:
  lnY=0.595X1(t-7) +0.216X2(t-1) -0.28X5(t-6) -0.289X9(t-4) +0.813X4(t-4) -
  1.221X7(t-2) +0.754X6(t-1) -0.311X9(t-3) -0.485X2(t-8) +0.479X2(t-2) +
  0.44X4(t-2) +0.305X7(t-6)
  所以,在倒退8年的50年数据样本中,银行存款的增长与前7年的全市居民储蓄,前1年、前8年、前2年的从业人数,前6年的全社会固定资产投资总额,前4年和前3年的全市财政收入,前4年和前2年的银行贷款,前2年和前6年的职工劳保福利费用,前1年的职工工资总额等因素之间有显著意义的相关关系。

  4.结论和评价
  4.1模型评价
  4.1.1进入因素的分析

  表4.1.1.1   Variables Entered/Removed(a)

  Model Variables Entered Variables Removed Method
  1 居储7 . Stepwise (Criteria: Probability-of-F-to-enter = .100).
  2 工资7 . Stepwise (Criteria: Probability-of-F-to-enter = .100).
  3 固投8 . Stepwise (Criteria: Probability-of-F-to-enter = .100).
  4 从人1 . Stepwise (Criteria: Probability-of-F-to-enter = .100).
  5 . 工资7 Stepwise (Criteria: Probability-of-F-to-enter = .100).
  由于SPSS11.5软件通过特定程序对上海市相关数据进行整体的统计运算,所以具有更强的客观性和公证性。从上表中可以看出,按自变量对因变量的作用程度从大到小首先引入的是前7年的居民储蓄,等到第五步时把之前进入的前7年的职工工资给剔除了,再后面的第14和第17步中把前8年的固定投资和前3年的银行贷款给剔除了。这3个被剔除的变量在引入变量越来越多的情况下被检验出其显著性不合格。除此之外,在10个自变量中,诸如全市居民消费水平、社会消费品零售总额、外贸出口商品总额没有进入模型。因为的外贸出口商品总额涨幅没有达到足以进入方程的显著性,所以被剔除了。不过,随着贸易全球化和中国国际地位的提高,上海的外贸出口总额也会不断的增加,在不久的将来会对银行存款起明显的作用。
  我们可以从表3.2.1看到,在进入的因素中全社会固定资产投资总额、财政收入、前2年的职工劳保福利费用、前8年的从业人员与银行存款是负相关,即随着它们的增加加快,银行存款的增长会减慢,其中前2年的职工劳保福利费用影响最强,其系数为-1.221。前8年的从业人员、财政收入、全社会固定资产投资总额的影响顺次递减。比如说,全社会固定资产投资总额增加,表明了国有、集体、个体、联营、股份制、外商、港澳台商提供了对基本建设、更新改造、房地产开发投资和其他固定资产投资额,那么他们必须从银行拿出自己的存款,有时还需要向银行进行贷款来完成投资,所以银行的存款量会增加缓慢是可以想象的。又比如说财政收入,政府的财政收入是通过税收、收费等途径获得,如果国家对个人、企业所征取的税越多的话,个人与企业的支出就会增加,净收入也就变少了,而如果其用于消费的指出不变或提高的话,那么其用于银行存款的货币就会相应减少,从而导致全市银行存款的递增缓慢。
  而居民储蓄、银行贷款、职工的工资、前1年和前2年的从业人员、前6年的职工劳保福利费用与银行存款呈正相关,即随着它们的增加加快,银行存款的增长也会加快,其中前四年的银行贷款的影响最强,其系数为0.813,其次是居民储蓄等等。比如说,职工工资的增加会使得人们的收入上升,收入上升后虽然有一部分会被用来支付消费,但绝大部分人们还是会把钱存入银行,用于各种类型的投资,这种行为使得银行存款的增加加快。又如:居民储蓄的增加,当然会直接影响银行存款量的增加,这是勿庸置疑的,因为居民储蓄是银行存款业务的主要内容,它是银行吸收资金的主要方式。再如:经济的发展会使得银行贷款量上升,银行想要通过贷款给个人或企业客户来获得更多利润,那么银行就会运用各种手段来增加吸引资金量。在这种情况下,社会上的闲置资金由于较高的收益而会流向银行,使得银行存款增加速度加快。

  从表4.1.2.1中我们可以看到,随着进入的变量越多,F值由大变小,然后再由小变大,使得最后一步的F值达到1191.379,表明回归模型包括12个变量,且拟合度较高。

  4.1.3自相关问题的诊断
  DW值一般要求1.5~2.5时,残差与自变量互为独立。从表4.1.3.1可见回归模型的DW值为2.342,说明该模型无自相关的问题,此模型可以被使用。
  表4.1.3.1  Model Summary(s)
  Model R R Square Adjusted R Square Std. Error of the

  4.1.4样本检验
  表4.1.4.1
  年份 取对数值(y1) 取对预测值(y2) 相对误差(%)
  2001 3.93 4.05 3.05
  2002 3.98 4.17 4.77
  2003 4.09 4.32 5.62
  以上的样本检验的相对误差的计算方法是用2001年~2003年各个取对预测值减去对应的取对数值之后再除以取对数值后得到的。其公式:
  相对误差=(y2-y1)/y1×100%
  样本检验的相对误差需不大于10%,表示所建立的模型是可以使用的。表4.1.4.1中的所计算的相对误差的都小于10%,说明模型建立的较好。

  4.1.5残差正态性检验

  图4.1.5.1 银行存款对数的标准化残差直方图
  图4.1.5.1表明:标准化残差的正态曲线的均值为0,标准差为0.84,接近标准正态曲线,基本满足随机误差项正态分布的假设理论,模型拟合效果比较好。

  4.1.6银行存款对数的正态概率图和残差散点图

  图4.1.6.1    正态概率图

  图4.1.6.2    散点图
  图4.1.6.1表明:代表样本残差的数据点基本处在表示指定正态分布的直线上或周围,因此基本符合残差正态分布的假设理论。
  图4.1.6.2表明:残差散点的分布随机均匀,且大多落在水平直线-2和2之间,所以可以判断残差与因变量之间相互独立性较高,基本满足残差独立的假设理论,模型的拟合效果比较好。

  4.2结论
  综上所述,商业银行的存款不断的增加,可以反映上海居民的收入在不断地增加、生活品质也在不断的提高,更可以从侧面反映上海金融的飞速发展和经济的繁荣。我国加入世贸组织后,金融对外开放程度加深,国内各银行之间、外资银行与中资银行之间的竞争越来越激烈,而存款是竞争的重要领域。随着我国国民物质生活的丰富,消费观念的变化,投资渠道的增多,这些因素将深刻地影响客户存款需求的特性。目前我国商业银行负债以存款为主,负债结构单一,缺乏稳定性;同时银行特别是国有商业银行由于历史和体制的原因,存在资产质量差,不良贷款率高,资本金不足等问题,使得我国银行业积聚了大量的风险。因此,我国商业银行的存款产品必须进行契约设计的改进,完善其中的激励与约束对等的机制设计,创新存款产品种类,满足不同客户的个性化需求;同时要提高存款的稳定性。上海作为全国的金融中心,应该顺应时代的进步建立一个合理的金融体系并完善其制度,而商业银行作为金融的重要环节应不断地对自身进行改革和创新更好地为个人和企业客户服务,这对于上海人民的生活水平的提高和经济的稳定发展具有重要的意义和作用。


  参考文献
  [2]黄达.金融学[M].北京:中国人民大学出版社,2004
  [3]郑道平.货币银行学原理[M].北京:中国金融出版社,2005
  [4]陈共.财政学[M].北京:中国人们大学出版社,2004
  [6]彼得·K·奥本海姆,官青译.跨国银行业务[M].北京:中国计划出版社.2001
  [6]上海统计年鉴. http://www.stats-sh.gov.cn/2004shtj/tjnj/tjnj2007.htm

spss系统工程运用回归分析法论文的范文

2. 我要写论文,请问在spss中用那种分析方法来分析那几个因素最重要??请具体一点,第一次用SPSS~

单因素方差分析

3. 我想用spss来做中国房地产的财务分析论文,,请高手指点啊,我不太会用spss,也不知道用那些分析方法

这个软件确实不错,在房地产方面也有一些先例,正好我这有一个房地产应用案例,希望对你有帮助:

我想用spss来做中国房地产的财务分析论文,,请高手指点啊,我不太会用spss,也不知道用那些分析方法

4. spss数据分析论文,使用分析方法三种以上,带数据和问卷

不知道你要做什么分析?能说具体一点不?愿意帮忙。QQ:80677398

5. spss中主成分分析法的数据如何进行标准化处理?

先将x1-x12作为指标名在转置排列,即行为指标名,列为数值。然后打开软件,导入数据,单击分析->数据缩减->因子分析,进入因子分析窗口,选中所有变量加入右边框,点击描述->相关矩阵-,勾选系数,kmo两项单击继续回到因子分析窗口,在选择旋转,勾选无,然后按确定就行了。一般软件会进行标准化处理的,应该不用你自己处理。
这个步骤只是大致的,因为SPSS版本不同,界面也会有所不同,还有中英文版的,所以可能还要你对软件的语言翻译一下。身边现在只有中文版的,不好意思啦~~

spss中主成分分析法的数据如何进行标准化处理?

6. spss进行层次分析法

1、首先在电脑中spss之后,点击上方导航栏的——转换选项卡。

2、然后在弹出的下拉菜单中点击——自动重新编码,如下图所示。

3、打开对话框,鼠标点击语文变量,将其添加到右侧的变量栏中。

4、接着自定义一个变量名称,点击——添加新名称。

5、最后设置好后点击——确定按钮。

6、这样结果就出来了,不过需要注意相近的数据尽量排列整齐,不然会显示统计不全的情况。

7. 主成分分析法在spss的应用

感觉问错了吧,应该是怎样用spss解决主成分分析的问题吧!
其实主成分分析的数据处理过程含以下几个方面:
1.数据的标准化。
2.标准化后数据的协方差阵
3.协方差阵的特征值特征向量
4.计算累积贡献率,确定主成分个数。

主成分分析法在spss的应用

8. 求SPSS分析调查问卷的分析方法

  当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细的介绍.
Spss处理: 
      第一步:定义变量 
      大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View两个标签,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位) 、label(变量标签) 、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类).
       我们知道在spss中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我们以问卷第一个问题为例来说明变量的设置.为了便于说明,可假设此题为:
1.请问你的年龄属于下面哪一个年龄段(   )?
  A:20—29      B:30—39     C:40—49      D:50--59
       那么我们的变量设置可如下: name即变量名为1,type即类型可根据答案的类型设置,答案我们可以用1、2、3、4来代替A、B、C、D,所以我们选择数字型的,即选择Numeric, width宽度为4,decimals即小数位数位为0(因为答案没有小数点),label即变量标签为“年龄段查询”。Values用于定义具体变量值的标签,单击Value框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入1,第二个输入20—29,然后单击添加即可.同样道理我们可做如下设置,即1=20—29、2=30—39、3=40—49、4=50--59;Missing,用于定义变量缺失值, 单击missing框右侧的省略号,会弹出缺失值对话框, 界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义显示列宽,可自己根据实际情况设置;Align,定义显示对齐方式,有居左、居右、居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。
       以上为问卷中常见的单项选择题型的变量设置,下面将对一些特殊情况的变量设置也作一下说明.
1.开放式题型的设置:诸如你所在的省份是_____这样的填空题即为开放题,设置这些变量的时候只需要将Value 、Missing两项不设置即可.
2.多选题的变量设置:这类题型的设置有两种方法即多重二分法和多重分类法,在这里我们只         对多重二分法进行介绍.这种方法的基本思想是把该题每一个选项设置成一个变量,然后将每一个选项拆分为两个选项项,即选中该项和不选中该项.现在举例来说明在spss中的具体操作.比如如下一例:
请问您通常获取新闻的方式有哪些(   )
1 报纸     2 杂志     3 电视     4 收音机     5 网络
       在spss中设置变量时可为此题设置五个变量,假如此题为问卷第三题,那么变量名分别为3_1、3_2、3_3、3_4、3_5,然后每一个选项有两个选项选中和不选中,只需在Value一项中为每一个变量设置成1=选中此项、0=不选中此项即可.
        使用该窗口,我们可以把一个问卷中的所有问题作为变量在这个窗口中一次定义。
到此,我们的定义变量的工作就基本上可以结束了.下面我们要作就是数据的录入了.首先,我们要回到数据录入窗口,这很简单,只要我们点击软件左下方的Data View标签就可以了.
       第二步:数据录入 
       Spss数据录入有很多方式,大致有一下几种:
1.读取SPSS格式的数据
2.读取Excel等格式的数据
3.读取文本数据(Fixed和Delimiter)
4.读取数据库格式数据(分如下两步)
(1)配置ODBC    (2)在SPSS中通过ODBC和数据库进行
       但是对于问卷的数据录入其实很简单,只要在spss的数据录入窗口中直接输入就可以了,只是在这里有几点注意的事项需要说明一下.
1. 在数据录入窗口,我们可以看到有一个表格,这个表格中的每一行代表一份问卷,我们也称为一个个案.
2. 在数据录入窗口中,我们可以看到表格上方出现了1、2、3、4、5…….的标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变量名,即1代表第一题,2代表第二题.以次类推.我们只需要在变量名下面输入对应问题的答案即可完成问卷的数据录入.比如上述年龄段查询的例题,如果问卷上勾选了A答案,我们在1下面输入1就行了(不要忘记我们通常是用1、2、3、4来代替A、B、C、D的).
3.我们知道一行代表一份问卷,所以有几分问卷,就要有几行的数据.
        在数据录入完成后,我们要做的就是我们的关键部分,即问卷的统计分析了,因为这时我们已经把问卷中的数据录入我们的软件中了.
       第三步:统计分析 
       有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。这要根据我们的问卷调查的目的和我们想要什么样的结果来选择.SPSS有数值分析和作图分析两类方法.
1.作图分析:
       在SPSS中,除了生存分析所用的生存曲线图被整合到Analyze菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分::
(1)Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。
(2)Interactive:交互式统计图。
(3)Map:统计地图。
(4)下方的其他菜单项是我们最为常用的普通统计图,具体来说有:
条图
散点图
线图
直方图
饼图
面积图
箱式图
正态Q-Q图
正态P-P图
质量控制图
Pareto图
自回归曲线图
高低图
交互相关图
序列图
频谱图
误差线图
        作图分析简单易懂,一目了然,我们可根据需要来选择我们需要作的图形,一般来讲,我们较常用的有条图,直方图,正态图,散点图,饼图等等,具体操作很简单,大家可参阅相关书籍,作图分析更多情况下是和数值分析相结合来对试卷进行分析的,这样的效果更好.
2.数值分析:
       SPSS 数值统计分析过程均在Analyze菜单中,包括:
(1)、Reports和Descriptive Statistics:又称为基本统计分析.基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。
Descriptive Statistics包括的统计功能有: 
Frequencies(频数分析):作用:了解变量的取值分布情况
Descriptives(描述统计量分析):功能:了解数据的基本统计特征和对指定的变量值进行标准化处理
Explore(探索分析):功能:考察数据的奇异性和分布特征
Crosstabs(交叉分析):功能:分析事物(变量)之间的相互影响和关系
Reports包括的统计功能有: 
OLAP Cubes(OLAP报告摘要表):功能: 以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。
Case Summaries(观测量列表):察看或打印所需要的变量值
Report Summaries in Row:行形式输出报告
Report Summaries in Columns:列形式输出报告
(2)、Compare Means(均值比较与检验):能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。
以下是进行均值比较及检验的过程:
MEANS过程:不同水平下(不同组)的描述统计量,如男女的平均工资,各工种的平均工资。目的在于比较。术语:水平数(指分类变量的值数,如sex变量有2个值,称为有两个水平)、单元Cell(指因变量按分类变量值所分的组)、水平组合
T test 过程:对样本进行T检验的过程
单一样本的T检验:检验单个变量的均值是否与给定的常数之间存在差异。
独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性差异)
配对T检验:检验两组相关的样本是否来自具有相同均值的总体(前后比较,如训练效果,治疗效果)
one-Way ANOVA:一元(单因素)方差分析,用于检验几个(三个或三个以上)独立的组,是否来自均值相同的总体。
(3)、ANOVA Models(方差分析):方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如:医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,都可以使用方差分析方法去解决
(4)、Correlate(相关分析):它是研究变量间密切程度的一种常用统计方法,常用的相关分析有以下几种:
1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。
2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系
3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远
(5)、Regression(回归分析):功能:寻求有关联(相关)的变量之间的关系在回归过程中包括:Liner:线性回归;Curve Estimation:曲线估计;Binary Logistic:二分变量逻辑回归;Multinomial Logistic:多分变量逻辑回归;Ordinal 序回归;Probit:概率单位回归;Nonlinear:非线性回归;Weight Estimation:加权估计;2-Stage Least squares:二段最小平方法;Optimal Scaling最优编码回归;其中最常用的为前面三个.
(6)、Nonparametric Tests(非参数检验):是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。
  非参数检验的过程有以下几个:
1.Chi-Square test   卡方检验
2.Binomial test   二项分布检验
3.Runs test   游程检验
4.1-Sample Kolmogorov-Smirnov test  一个样本柯尔莫哥洛夫-斯米诺夫检验
5.2 independent Samples Test 两个独立样本检验
6.K independent Samples Test K个独立样本检验
7.2 related Samples Test 两个相关样本检验
8.K related Samples Test 两个相关样本检验
(7)、Data Reduction(因子分析)
(8)、Classify(聚类与判别)等等
        以上就是数值统计分析Analyze菜单下几项用于分析的数值统计分析方法的简介,在我们的变量定义以及数据录入完成后,我们就可以根据我们的需要在以上几种分析方法中选择若干种对我们的问卷数据进行统计分析,来得到我们想要的结果.
第四步:结果保存 
     我们的spss软件会把我们统计分析的多有结果保存在一个窗口中即结果输出窗口(output),由于spss软件支持复制和粘贴功能,这样我们就可以把我们想要的结果复制﹑粘贴到我们的报告中,当然我们也可以在菜单中执行file->save来保存我们的结果,一般情况下,我们建议保存我们的数据,结果可不保存.因为只要有了数据,如果我们想要结果的,我们可以随时利用数据得到结果.
总结: 
        以上便是spss处理问卷的四个步骤,四个步骤结束后,我们需要spss软件做的工作基本上也就结束了,接下来的任务就是写我们的统计报告了.值得一提的是.spss是一款在社会统计学应用非常广泛的统计类软件,学好它将对我们以后的工作学习产生很大的意义和作用.
  SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定类;二 注意定义不同的数据类型Type。
       各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 
1 单选题:答案只能有一个选项
例一 当前贵组织机构是否设有面向组织的职业生涯规划系统? 
A有 B 正在开创 C没有 D曾经有过但已中断
编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。
录入:录入选项对应值,如选C则录入3
2 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。
(1)方法一(二分法):
       例二 贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示
考虑在内。
A月薪员工 B日薪员工 C钟点工
编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。
录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。
(2)方法二:
       例三 你认为开展保持党员先进性教育活动的最重要的目标是那三项:
1( ) 2 ( ) 3( )
A、提高党员素质 B、加强基层组织 C、坚持发扬民主
D、激发创业热情 E、服务人民群众 F、促进各项工作
编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2”B,“3” C,“4” D,“5” E,“6” F
录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。
注:能用方法二编码的多选题也能用方法编码,但是项数不定的多选只能用二分法,即方法一是多选题一般处理方法。
3 排序题: 对选项重要性进行排序
       例四 您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列) 
第一位 第二位 第三位 第四位 第五位
编码:定义五个变量,分别可以代表第一位 第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格
录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。
4 选择排序题:
       例五 把例三中的问题改为“你认为开展保持党员先进性教育活动的最重
的目标是那三项,并按重要性从高到低排序”,选项不变。
编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1” 未选,“2” 排第一,“3” 排第二,“4” 排第三。
录入:以变量的Value值录入。比如三个括号里分别选的是 ECF,则该题的6个变量的值应该分别录入:1(代表A选项未选)、1、 3(代表C选项排在第二)、1、2、4。
注:该方法是对多选题和排序题的方法结合的一种方法,对一般排序题(例四)也同样适用,只是两者用的分析方法不同(例四用频数分析、例五用描述分析),输出结果从不同的侧面反映问题的重要性(前一种方法从位次从变量的频数看排序,后一种方法从变量出发看排序)。
5 开放性数值题和量表题:这类题目要求被调查者自己填入数值,或者打分
例六 你的年龄(实岁):______
编码:一个变量,不定义Value值
录入:即录入被调查者实际填入的数值。 
6开放性文字题:
       如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。
三 问卷一般性分析
       下面具体介绍SPSS中问卷的一般处理方法,操作以版本spss13.0为例,以下提到的菜单项均在Analyze主菜单下
1频数分析:
        Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。
适用范围:单选题(例一),排序题(例四),多选题的方法二(例三)
频数分析也是问卷分析中最常用的方法。
实现: Descriptive statistics……Frequencies 
2 描述分析:
       Descriptives:过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。
适用范围:选择并排序题(例五)、开放性数值题(例六)。
实现: Descriptive statistics……Descriptives,需要的统计量点击按钮Statistics…中选择
3 多重反应下的频次分析:
适用范围:多选题的二分法(例二)
实现:
       第一步在Multiple Response……Define Sets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入1。第二步在Multiple Response……Frequencies中做频数分析。
4 交叉频数分析:解决对多变量的各水平组合的频数分析的问题
适用范围:
       适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表则一目了然。
实现:
        第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptive statistics……Crosstabs 
四 简单图形描述介绍
       在做上述频数分析、描述分析等分析时就可以直接做出图形,简单方便,同时也可以另外作图。SPSS的作图功能在菜单Graphs下,功能强大,图形清晰优美。现在把常用图简单介绍如下
1饼图:又称圆图,是以圆的面积代表被研究对象的总体,按各构成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系的统计图。频数分析的结果宜用饼图表示。
2曲线图:是用线段的升降来说明数据变动情况的一种统计图。它主要表示现象在时间上的变化趋势、现象的分配情况和2个现象的依存关系等。
3面积图:用线段下的阴影面积来强调现象变化的统计图。
4条形图:利用相同宽度条形的长短或高低表现统计数据大小及变化的统计图。
五 问卷深入分析
       除了以上简单的分析,spss强大的功能还可以对问卷进行深入分析,比如常用的有聚类分析、交叉分析、因子分析、均值比分析(参数检验)、相关分析、回归分析等。因为涉及到很专业的统计知识,下面只将个人觉得比较有用的方法的适用范围和分析目的简单做介绍:
1聚类分析
       样本聚类,可以将被调查者分类,并按照这些属性计算各类的比例,以便明确研究所关心的群体。比如按消费特征对被调查者的进行聚类。
2 相关分析
        相关分析是针对两变量或者多变量之间是否存在相关关系的分析方法,要根据变量不同特征选择不同的相关性的度量方式。问卷分析中的多数用的变量都属于分类变量,要采用斯皮尔曼相关系数。
其中可以用卡方检验,其是对两变量之间是否具有显著性影响的分析方法
3均值的比较与检验
(1)Means过程:
        对指定变量综合描述分析,分组计算计算均值再比较。比如可以按性别变量分为男和女来研究二者收入是否存在差距。
(2)T 检验:
       独立样本t检验用于不相关的样本是否开来自具有相同均值的总体的检验。比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。
如果样本不独立则要用配对t检验。比如研究参加职业培训后 工作效率是否提高。
4 回归分析
        问卷分析中的回归分析常采用的是用离散回归模型,一般是逻辑斯蒂模型,解释一个变量对另一变量的影响具体有多大。比如,研究对某商品的消费受收入的影响程度