实验调查法讲义(完整版)
芥菜饭-短信集锦
一、开场白
我们今天讲的是第四章《市场调查方法》的第八节,也是最后一节的《实验
调查法》。
我们教材中所讲的内容均比较详细,各位同学自己看书也能明白,所以我们也不必多加累述。
今天我们想多讨论一点教材上没有的东西,当然还包括一些PPT上没有的内容。也就是说,
P
PT或者书上有的内容我们今天不会讨论,一些书上和PPT上没有的内容我们今天有可能
会谈到,视具
体情况而定。有必要的同学可以记一记笔记,以加深理解。
二、实验调查法的概念
实验调查
法也称为实验法,实验法是通过小规模的实验来了解企业产品对社会需求的适
应状况,以测定各种经营手
段取得效果的市场调查方法。那我们接下来看一下,实验的基本
要素有哪些?实验法的基本要素有实验者
、实验对象、实验活动、实验环境、实验活动和实
验检测。实验者即进行实验的主体,而实验对象就是被
实验的客体。而实验活动应在可控可
测的特定环境下进行。所谓的实验环境,应是实验对象所处的各种条
件的总和。实验调查的
过程,就是实验者控制这些条件——使一些条件发生变化。另一些条件不发生变化
,或使某
几个条件相互作用、相互影响的过程。在实验法中,实验者控制一个或多个的自变量(如价格、包装、广告),研究在其他因素(如产品质量、服务、销售环境等)都不变或相同的情
况下,这
些自变量的对因变量(销售量)的影响效果。举例来说,例如某家寿险公司对某种
万能保险产品的价格修
正后,检测其在某一地区市场中的消费者接受程度。那么实验者即是
这家寿险公司,而实验对象就是我们
进行修正后的这款万能保险的潜在消费者。
在市场实验中,我们未必都能控制所有其他因素不改变。例
如对手竞争策略的改变、消
费者的偏好等等。这些外来因素都有可能对实验的结果有影响。所以,我们在
进行实验设计
的时候,要特别考虑如何尽可能地减少实验的误差;此外,我们对收集而来的数据应该通过
统计分析的方法进行检验,以确定在一定的水平下,自变量对因变量的影响是否显著,即T
检验
。让我们回忆一下《计量经济学》中第二章《一元线性回归模型》中有关于一元线性回
归模型的统计检验
的内容,其中与之相关的即检验参数的显著性。回归模型的判定系数
R
度
量了回归直线
的拟合优度,但
R
并本身不能告诉我们估计的系数是否在统计上是显著的。
如果某个解
释变量对被解释变量的影响不重要,那么我们就应该从回归模型把它剔除,重建
更简单的回归方程,使分
析更精确。
2
2
三、实验调查法的步骤
在了解了实验调查法的概念之后,
我们需要进一步的了解实验调查法的步骤。如PPT
上所示实验调查法的具体步骤一共有6个。分别是“
提出研究假设”、“进行实验设计”、“选
择实验对象”、“控制实验环境”、“比较实验差异”和“搜
集实验数据”。我们这里只讨论前
三个,后面三个较为简单,同学们可以自己参照教材进行学习。
1、提出研究假设
这是个十分要紧的问题,因为解决问题的第一步在于认清为题的实质。 爱因斯坦曾说
过:“提
出(发现)一个问题往往比解决一个问题更为重要,因为解决一个问题也许只是一
个数学上或实验上的技
巧问题。而提出新的问题、新的可能性,从新的角度看旧问题,却需
要创造性的想像力,而且标志着科学
的真正进步。”爱因斯坦正是因为提出了解决牛顿力学
体系中存在的问题或矛盾而建立了相对论。对于许
多研究而言,研究是需要假设的,这是一
种实证主义的研究思路。在实证主义研究视野下,没有研究假设
意味着你的研究是没有基础
的,你的研究是盲目的,也意味着你的研究结果是不可预期的。而且也意味着
这样的研究是
冒险的,其代价将是非常大的。按照美国实证主义哲学家杜威的说法,研究假设就是对所研
究问题的一种最有可能性的答案的猜测,然后进行验证,得出结论完成一个科学研究过程。
能够
对问题的解决方案的各种可能性进行猜测并在各种可能性之间进行排除是非常不容易
的事情,你如果对该
问题认识非常浅是不可能做到这一步的。而当你不能提出研究假设时,
你就需要认真地考虑一下你的研究
问题是否真正存在。如果你的研究问题根本不存在,你就
不可能杜撰出什么可能性的结论的,也不可能对
研究有什么预期。这一点是很多做市场调查
和预测的人会犯的错误。
总而言之,正如教材上关
于研究假设的论述的最后一句所说的,没有研究假设的提出,
实验活动无从进行。我们在做市场调查的过
程中,往往需要已有的理论和经验对某一社会现
象和另一社会现象之间是否存在因果或公共关系提出理论
假设。而这种理论和经验往往是时
间累积所得。如我们在进行寿险产品利润分析的时候会发现,保费递减
的定期寿险的退保率
会比保费均衡的定期寿险的退保率要低,这是人的天性使然也是寿险公司在长期运营
中发现
的一个现象,精算工作者在产品定价不可不考虑到这个规律。
2、进行实验设计 实验设计是实验的关键,它是研究人员研究控制、操作实验环境和实验对象,验证研究
假设的规划。
我们前面业已说过,实验法是运用类似于自然科学中的实验室求证原理来研究
市场问题,单纯从逻辑上说
,实验法最具备科学色彩,因为只有实验法才能证明实验变量和
目标变量之间是否真正存在因果关系,因
此,实验调查法也可以称为因果性调查。实验调查
法是否真正“科学”的关键就在于实验的设计是否“科
学”。广义的实验设计指科学研究的
一般程序的知识,它包括从问题的提出、假说的形成、变量的选择等
等一直到结果的分析、
论文的写作一系列内容。它给研究者展示如何进行科学研究的概貌,试图解决研究
的全过程。
狭义的实验设计特指实施实验处理的一个计划方案以及与计划方案有关的统计分析。狭义的<
br>实验设计着重解决的是从如何建立统计假说到作出结论这一段。很明显,我们这里讨论的是
狭义的
实验设计。对于实验来说,不管是自然科学实验还是我们这里所讨论的市场调查方法
的实验设计,最重要
的一点还在于控制变量。因为如果我们不能把握其他无关变量对因变量
的影响的话,那么实验和预测的结
果就不具备可比性。简单举一个例子,就像我们开发一款
保险产品时,除了应考虑公司与利润目标相关的
三要素外,还应该考虑资本市场风险的波动、
消费者的偏好、市场的客观需求和接受程度、竞争者的对策
等等。这其中某个关键要素改变
的话,对于精算模型的参数都需要重新进行估计。
3、选择实验对象
实验对象的选择大体上可以分为随机性选择与非随机性的选择。教材中说“
非随机性的
方法操作简便,只是把握不住自变量和因变量,可靠性差一些。”我对这句话其实是有保留<
/p>
的。假设我现在想要调查某地区的消费者对一款投资连结险的接受程度,那么为了保证调查
的可靠性和公正性,我在挑选实验对象的时候就不能只挑选月薪在10000或20000以上的高收入者,也不能只挑选月薪在1000~2000的低收入群体。因为高收入群体的投资方式较为广
泛和自主,因此对于投资连结险的需求就不如一般水平,而低收入群体的需求就更低了。因
此我们在挑选
实验对象的时候要注意这一点。
四、实验调查法的分类
实验调查法的分类可以按照不同的分
类方法进行分类。例如按照实验场所分类我们可以
分为实验室实验和现场实验两种;按照是否将实验单位
随机分组,市场实验可以分为随机化
实验和非随机化实验。这里我们主要讨论非随机化实验。这里面其实
涉及到一个实验设计方
案的问题。由于这其中多涉及我们不曾学习过的统计学的内容,所以这里我们不多
展开讨论,
我们只讨论教材上的三种主要的也是市场调查和预测过程最常遇见的三种类型——“实验组<
br>前后连续对比实验”、“实验组与控制组对比实验”和“实验组与控制组前后对比实验”。
在讨
论这三种实验类型前,我们需要先搞清楚四个术语——“实验组”、“控制组”、“事
后设计”和“事前
事后设计”。在实验中,我们将实验单位随机地分成两部分,一部分接受
处理后的自变量,也叫“处理组
”或者“实验组”;而另一部分是受控制的即不接受处理的,
叫“控制组”。举个简单的例子,假如我现
在是个社会学家,我现在要研究失业对恋爱的影
响,可以在同一阶层选取两个受试组,一组为失业者(也
就是实验组),一组为非失业者(即控
制组),然后我们分别收集两组的恋爱数据,进行统计比对,以得
出结论。对实验单位进行
处理之后才测量自变量对因变量的影响的叫“事后设计”。在实验中,选择一批
实验对象作
为实验组,通过对其实验激发的前后检测,并进行分析做出结论的,叫“事前事后设计”。
1、实验组前后连续对比实验
以我们教材中P123页的例子为例,这间食品厂为了提高糖果
的销售量,改变包装并设
计新图案,并在此基础上对被实验组进行前后各一个月的销售量的跟踪调查。那
么这种实验
就可称为“无控制组事前事后设计”。因为在此实验中,实验组前后连续对比实验,且其观<
br>察对象只有一个,就是实验组本身,故我们可称之为“无控制组事前事后设计”。当我们了
解了这
种实验的类型后,那么接下来我们就该来分析这种实验设计背后的原理、思路以及模
型。我们可以看到这
是最简单的一种实验调查法,它是在没有控制组作参照的情况下,考察
实验组在改变实验因素前后发生的
变化,从而来测定实验因素对调查对象影响的实验效果,
因此,它是一种纵向对比,即在前后时间上的比
较。采用这种方法,事先要对正在经营的情
况进行测量;然后再测量实验后的情况,通过事前事后对比观
察,了解实验变量的效果。我
们可以画图来表示其模型,如下所示:
事前测量
实验激发(实验处理)
事后测量
如表可见在表中没
有控制组,只有实验组的事前实验和事后实验所产生的事前实验测定
值X1及事后实验测定值X2。我们
通过观察实验激发前后X1和X2的大小来分析实验的影
实验组
X1
有
X2
控制组
—
—
—
响。其实验效
果可用两种指标来表示,即绝对指标和相对指标。绝对指标我们可以用E来
表示,绝对指标即绝对实验效
果E = X2 − Xl;相对指标即相对实验效果,我们用RE来表
示,公式如下:
RE
X2X1E
*100%*100%
X1X1
我
们可以按照公式来计算一下教材中给出的例子。我们可以设实验前5种糖果品种的累
计的销售量(即事前
实验测定值)为X1,设实验后5种糖果品种的累计的销售量(即事后
测定值)为X2,很明显,X1=
1740,X2=1920.故,绝对的实验效果E=X2-X1=1920-1740=180.
相对
实验效果RE=EX1=1801740=10.344%.
无控制组的事前事后对比实验是一种纵向
比较,操作起来简便易行,表面上看比较科学,
但事实上其实验误差较大,因为它无法消除事前事后实验
期间其他非实验因素的影响,因为
在进行事前实验和事后实验期间其他非实验因素会发生改变,这样实验
组的事后测定值就不
纯粹是实验因素改变的结果,还有非实验因素,如自然因素、商业因素、心理因素等
改变的
结果,这些都会影响实验效果的准确性。如课本P123页的这个例子,我们很难判断是否是其他因素对销售量造成的影响,180千克的销售增加量,不一定只是包装引起的。
2、实验组与控制组对比实验
实验组与控制组对比实验在实验设计上的专业术语是“有控制的
事后设计”,因为实验
对象中存在实验组与控制组,且仅关注试验后自变量对因变量的影响。简单地说,
其设计原
理为: 有控制组的事后实验是指在同一时期内,对实验组改变其实验因素进行实验,对控制组则不改变任何实验因素,照常规活动,将实验组和控制组的事后测定值进行对比,因此,
这是一
种横向比较,即在同一时间上的不同比较。这种方法是目前市场研究中最常见的方法。
同样的,我们也可以用表格来表示该实验类型的模型,如下所示:
事前测量
实验激发(实验处理)
事后测量
实验组
—
有
X2
控制组
—
—
Y2
由
表可见,在表中没有事前实验的测定值,只有实验组和控制组的事后实验测定值,其
实验效果也有两种指
标。绝对指标即绝对实验效果,同样的,我们用E来表示绝对实验效
果,E = X2 −
Y2;相对指标即相对实验效果,我们用RE来表示相对实验效果,公式如下:
RE
X2Y2E
*100%*100%
Y2Y2
同
样的,我们也可以按照公式来计算教材P124页所给出的例子。我们设食品厂改变面
包的配方后(激发
实验后)两周内新配方面包的销售量(实验组事后测定值)为X2,原配
方面包的销售量(控制组事后测
定值)为Y2,可得X2=A、B、C组第一周的销售量+D、E、
F组第二周的销售量=150+14
0=290,Y2=A、B、C组第二周的销售量+D、E、F组第一周的
销售量=120+130=2
50.故绝对实验效果E=X2-Y2=290-250=40,相对销售效果
RE=EY2=4025
0=16%.(注意这里有可能会造成混淆,本题的原意是ABC三个商店第一周销
售新配方的面包,第
二周销售原配方的面包,DEF三个商店则相反。)
这种有控制组的事后实验最明显的优点是:克服了
前面的无控制组的事前事后实验所存
在的非实验因素影响。由于这是一种横向对比实验,
在同时间里.诸如自然因素、商业因素、
心理因素等非实验因素基本相同,在实验对比中可以抵消。这种
实验法的缺点是:选择控制
组难度较大,实验效果的准确性直接取决于控制组与实验组的可比性,两者之
间客观条件越
接近,实验效果的准确性越高;反之,实验效果的准确性就越低。
3、实验组与控制组前后对比实验
有控制组的事前事后对比实验是指在实验中,分别设立控制
组和实验组,在实验组中引
入实验因素,控制组中不引入实验因素,按常规活动,然后将实验组事前事后
实验的测定值
同控制组的事前事后实验测定值进行对比的实验调查方法。故也可以把它叫做“有控制组的
事前事后设计”。其模型如下表所示:
事前测量
实验激发(实验处理)
事后测量
实验组
X1
有
X2
控制组
Y1
—
Y2
由表可见既有
纵向对比,实验组与控制组前后对比实验即有横向对比实验组事前事后对
比(或者说既有不同时点的对比
又有同一时点的对比)。
与前面两种实验方法相同,把实验组绝对变化量我们定义为E1,且E1=X2 − Xl,在
这组变化量中,包括实验因素对经济变量的影响,也包括其他非实验因素对经济变量的影响。
实验控制组
事前事后对比,其绝对变化量设为E2,E2=Y2 − Y1,由于在控制组中不引入
实验因素,因此
,在绝对变化量E2就没有实验因素对经济变量的影响,而只受到非实验因
素的影响。故我们可以推断控
制组的相对变化量RE2=Y2-Y1Y1=E2Y1,而对于课本中评价
实验组的绝对实验效果的计算
方法其实我是有所保留的。因为你不能够剔除非实验因素对于
实验组前后测定值变化的影响,所以课本中
(X1-X2)-(Y1-Y2)的表达方法其实是错误的。
正如我前面所说,因为控制组没有实验因素
对经济变量的影响,而只受到非实验因素的影响,
故可推断控制组的相对变化量RE2=E2Y1,并依
此来推断非实验变量对于数据组总体的影
响。我们知道,实验组和控制组中是同一经济变量,且处于同一
环境中,因此,在实验组中
非实验因素对每单位经济变量的影响程度也等于控制组中非实验因素对每单位
经济变量的
影响。故我们可以认定,非实验因素对实验组的影响程度为(E2Y1)*X1。然后我们可
以来描
述实验因素对于实验组的影响绝对程度(非实验因素和实验因素影响下的测定值的变化量减
去非实验因素的影响下测定值的变化量),即E1=(X2-X1)-(E2Y1)*X1。而实验组的相对<
br>变化量则相对容易求出,公式如下:
RE1
E1(X1X2)(E2Y1)*X1
*100%*100%
X1X1
五、实验的有效性
1、内部有效性和外部有效性 实验的有效性问题实际上是实验调查法的应用问题的延伸,即研究实验调查法在何种情
况下适用的问题,不知道为什么,我们的教材上没有涉及到这方面的内容,但我还是很想在
这里讲一讲
。如PPT上显示的,我们可以把实验的有效性分为内部有效性和外部有效性。
内部有效性表示用实验
测量自变量的影响或效用的准确性。如果我们能够有某种可靠的
方法证明实验变量或处理变量真正对因变
量产生的可观察到的差异,那么这个实验就是内部
有效的。例如我们要研究“烟草税在多大程度上能减轻
吸烟?”这个问题,那我们就必须对
某段时间和地域内香烟的销售额、价格、税收和个人收入进行统计,
并计算其需求的价格弹
性。假如我们能够证明征收烟草税的地区的香烟销售量的变化是由征收烟草税引起
的,而不
是由其他原因因素引起的,那么我们就可以说这个实验室内部有效的。
与内部有效性
相对应,外部有效性表示的是将实验的结果推广到实验环境意外或更大总
体的可能性。如果具体的实验环
境没有考虑到真实世界中其他相关变量的交互作用,外部有
效性就会受到很大的影响。同样是上面烟草税
的例子,在实际的调查中我们就会发现,烟草
税较低的地区因而香烟价格较低而吸烟率较高,烟草税高的
地区因而香烟价格较高而吸烟率
较低。然而由于因果关系的双重作用,即一方面低税收引起高消费,另一
方面如果某个地区
内有大量的烟民,则当地的烟草经销商为了维持自己利润的最大化,则会想尽一切办法
降低
香烟的成本以变相降低香烟的价格来取悦烟民。因此我们对这些数据的分析是复杂的,我们
在考虑到自变量对因变量的影响因素外,还应该考虑外来变量对实验的影响,即前面所说的
非实验因素对
事后测量结果的影响。接下来我们将继续讨论这一点。
2、外来变量对实验有效性的威胁
外
来变量也叫无关变量,是指除自变量外一切能影响因变量值的变量。这些变量可以把
因变量的测量值搅乱
,因而使结果变弱或者无效,这就有点像一元线性回归模型中的随机干
扰项μ,但是这样说还不太准确,
因为这些变量也有不能不具备随机性。那么我们在描述这
种变化关系的时候,是否也要把这些所有的因素
考虑进去,从而使得模型更加准确呢?就如
同在线性回归模型中增加解释变量的个数以提高拟合优度R
的值一样呢?答案当然是否定
的,原因有两个,一者是没有要,为什么呢?这就好比你画
一张地图,我们不必把现实中的
每一处细节都描述下来,一张和现实一样大的地图是没有意义的。这就好
比我们构建一个模
型,我们不可能也没必要把所以相关因素都考虑进去,我们要考虑和验证的应该是那些
对结
果的影响的显著程度最高的那些因素。再者我们也不可能这么做,因为,这些变量我们不一
定能发现,而且这些变量本省具有随机性,你很难去预料它。这就好比当下的时事新闻对于
股票市场的影
响,李克强或者是肖钢的一句话就能够叫资本市场地动山摇。那么我们下面就
具体来看一下有哪些外来变
量,然后我们才能知道如何控制它以不至于让它太过扰乱实验的
结果。
1) 时间效应;所谓
时间效应是指发生在实验期间影响数量的任何变化和事件,例如在
研究促销手段对某款投资连结型寿险产
品销售量影响的实验期间内,发生了央行的
大幅度降息或者资本市场的大规模动荡,那么我们就可以肯定
得出的来的效果是受
影响的,是不可靠的。
2) 选样偏差;这个好理解。其实我们之前在说
实验对象的选择的时候其实就已经提到
了这一点,当我们选择的实验组的个体与控制组的个体有系统性差
异时,就会产生
选样偏差对实验有效性的威胁,因为实验组事后测量值与控制组事后测量值的区别
很可能是两组选样的差异所造成的,而并不是因为实验变量或处理变量的影响。
3) 回归效应;回
归效应是指具有极端行为的目标群体在实验过程中向着行为均值发展
的趋势造成的影响。就如同德尔菲法
中的专家一样,在几轮的咨询或测试过后,意
2
见会趋于一致。这是人的天性使
然。
4) 失员效应;失员效应是由于实验过程中实验单位的“丢失”而形成的外来变量造成
的现象。若出现“失员现象”,则实验群体可能变得不具有代表性,且亦缺少外部
有效性。这种现象最常
出现在我们的人口调查中,2000年美国的全美人调查就是
一个例子,当时美国政府花了100亿美元
来搞人口普查,结果得出的数据倍遭诟病。
原因就是外来变量没有把握好。
5) 测试效应;
是指实验过程本身对我们观察到结果产生的影响,测试效应又可以分为
主效应和交互效应两种。主效应是
指早起观察对后期观察产生的影响,这有点类似
于我们前面所说的回归效应。简单的说,就是一个问题你
问他两次,他给了你不同
的答案。测试的主效应主要影响的是实验的内部有效性。交互效应是指先前的观
察
对这个实验效果的影响。举个例子,就好比我现在要调查某汽车品牌广告的效果时,
参与调查
的消费者肯定会比没参与调查的消费者对该汽车品牌更加敏感,更有可能
对测试的广告表现出关注,那么
测试出的广告效应就无法推广到总体。所以,测试
的相互效应影响到的是实验的外部有效性。
3、控制外来变量对实验有效性的影响
我们已经知道,外来变量的存在将影响因变量,扰乱实
验效果,严重威胁实验的有效性。
所以我们必须要对这些外来变量加以控制,那么如PPT上所示,常见
的控制方法有以下几
种。
1) 随机化分组;这个很简单,就是实验单位随机的分配到实验组
和控制组中,同时实
验条件也随机的非配到各组。这就好比是薛定谔的猫,你不开盒子,你就不知道猫<
br>是死的还是活的。故我们可以近似地认定实验的各组从一开始就是基本平等的。
2) 匹配分组
;匹配分组是相对于随机化分组而言的,就是在分配实验单位的时候按照
一些关键背景变量来比较实验单
位,使得每个实验组都有相匹配的实验单位。这种
方法在现实中运用得比较少。
3) 统计控
制和实验控制。这两种分别指采用统计分析的方法去测定外来变量并修正其
影响还有精心设计实验方案,
来使外来变量得到有效的控制。这两句实际上是废话。
六、结束语
关于后面的“
实验法的优缺点”的部分相对来说比较简单,所以我也就不展开来讲了,
我相信同学们自己看书都能掌握
。谢谢大家听我絮絮叨叨地讲了这么多,谢谢!如果有谁想
要课件或者是讲义的可以下课后找我要,也可
以在我的博客上面下载。谢谢大家!
一、开场白
我们今天讲的是
第四章《市场调查方法》的第八节,也是最后一节的《实验调查法》。
我们教材中所讲的内容均比较详细
,各位同学自己看书也能明白,所以我们也不必多加累述。
今天我们想多讨论一点教材上没有的东西,当
然还包括一些PPT上没有的内容。也就是说,
PPT或者书上有的内容我们今天不会讨论,一些书上和
PPT上没有的内容我们今天有可能
会谈到,视具体情况而定。有必要的同学可以记一记笔记,以加深理
解。
二、实验调查法的概念
实验调查法也称为实验法,实验法是通过小规模的实验来了解企
业产品对社会需求的适
应状况,以测定各种经营手段取得效果的市场调查方法。那我们接下来看一下,实
验的基本
要素有哪些?实验法的基本要素有实验者、实验对象、实验活动、实验环境、实验活动和实验检测。实验者即进行实验的主体,而实验对象就是被实验的客体。而实验活动应在可控可
测的特定
环境下进行。所谓的实验环境,应是实验对象所处的各种条件的总和。实验调查的
过程,就是实验者控制
这些条件——使一些条件发生变化。另一些条件不发生变化,或使某
几个条件相互作用、相互影响的过程
。在实验法中,实验者控制一个或多个的自变量(如价
格、包装、广告),研究在其他因素(如产品质量
、服务、销售环境等)都不变或相同的情
况下,这些自变量的对因变量(销售量)的影响效果。举例来说
,例如某家寿险公司对某种
万能保险产品的价格修正后,检测其在某一地区市场中的消费者接受程度。那
么实验者即是
这家寿险公司,而实验对象就是我们进行修正后的这款万能保险的潜在消费者。
在市场实验中,我们未必都能控制所有其他因素不改变。例如对手竞争策略的改变、消
费者的偏好等等。
这些外来因素都有可能对实验的结果有影响。所以,我们在进行实验设计
的时候,要特别考虑如何尽可能
地减少实验的误差;此外,我们对收集而来的数据应该通过
统计分析的方法进行检验,以确定在一定的水
平下,自变量对因变量的影响是否显著,即T
检验。让我们回忆一下《计量经济学》中第二章《一元线性
回归模型》中有关于一元线性回
归模型的统计检验的内容,其中与之相关的即检验参数的显著性。回归模
型的判定系数
R
度
量了回归直线的拟合优度,但
R
并本身不能告诉我
们估计的系数是否在统计上是显著的。
如果某个解释变量对被解释变量的影响不重要,那么我们就应该从
回归模型把它剔除,重建
更简单的回归方程,使分析更精确。
2
2
三、实验调查法的步骤
在了解了实验调查法的概念之后,我们需要进一
步的了解实验调查法的步骤。如PPT
上所示实验调查法的具体步骤一共有6个。分别是“提出研究假设
”、“进行实验设计”、“选
择实验对象”、“控制实验环境”、“比较实验差异”和“搜集实验数据”
。我们这里只讨论前
三个,后面三个较为简单,同学们可以自己参照教材进行学习。
1、提出研究假设
这是个十分要紧的问题,因为解决问题的第一步在于认清为题的实质。 爱因斯坦曾说
过:“提
出(发现)一个问题往往比解决一个问题更为重要,因为解决一个问题也许只是一
个数学上或实验上的技
巧问题。而提出新的问题、新的可能性,从新的角度看旧问题,却需
要创造性的想像力,而且标志着科学
的真正进步。”爱因斯坦正是因为提出了解决牛顿力学
体系中存在的问题或矛盾而建立了相对论。对于许
多研究而言,研究是需要假设的,这是一
种实证主义的研究思路。在实证主义研究视野下,没有研究假设
意味着你的研究是没有基础
的,你的研究是盲目的,也意味着你的研究结果是不可预期的。而且也意味着
这样的研究是
冒险的,其代价将是非常大的。按照美国实证主义哲学家杜威的说法,研究假设就是对所研
究问题的一种最有可能性的答案的猜测,然后进行验证,得出结论完成一个科学研究过程。
能够
对问题的解决方案的各种可能性进行猜测并在各种可能性之间进行排除是非常不容易
的事情,你如果对该
问题认识非常浅是不可能做到这一步的。而当你不能提出研究假设时,
你就需要认真地考虑一下你的研究
问题是否真正存在。如果你的研究问题根本不存在,你就
不可能杜撰出什么可能性的结论的,也不可能对
研究有什么预期。这一点是很多做市场调查
和预测的人会犯的错误。
总而言之,正如教材上关
于研究假设的论述的最后一句所说的,没有研究假设的提出,
实验活动无从进行。我们在做市场调查的过
程中,往往需要已有的理论和经验对某一社会现
象和另一社会现象之间是否存在因果或公共关系提出理论
假设。而这种理论和经验往往是时
间累积所得。如我们在进行寿险产品利润分析的时候会发现,保费递减
的定期寿险的退保率
会比保费均衡的定期寿险的退保率要低,这是人的天性使然也是寿险公司在长期运营
中发现
的一个现象,精算工作者在产品定价不可不考虑到这个规律。
2、进行实验设计 实验设计是实验的关键,它是研究人员研究控制、操作实验环境和实验对象,验证研究
假设的规划。
我们前面业已说过,实验法是运用类似于自然科学中的实验室求证原理来研究
市场问题,单纯从逻辑上说
,实验法最具备科学色彩,因为只有实验法才能证明实验变量和
目标变量之间是否真正存在因果关系,因
此,实验调查法也可以称为因果性调查。实验调查
法是否真正“科学”的关键就在于实验的设计是否“科
学”。广义的实验设计指科学研究的
一般程序的知识,它包括从问题的提出、假说的形成、变量的选择等
等一直到结果的分析、
论文的写作一系列内容。它给研究者展示如何进行科学研究的概貌,试图解决研究
的全过程。
狭义的实验设计特指实施实验处理的一个计划方案以及与计划方案有关的统计分析。狭义的<
br>实验设计着重解决的是从如何建立统计假说到作出结论这一段。很明显,我们这里讨论的是
狭义的
实验设计。对于实验来说,不管是自然科学实验还是我们这里所讨论的市场调查方法
的实验设计,最重要
的一点还在于控制变量。因为如果我们不能把握其他无关变量对因变量
的影响的话,那么实验和预测的结
果就不具备可比性。简单举一个例子,就像我们开发一款
保险产品时,除了应考虑公司与利润目标相关的
三要素外,还应该考虑资本市场风险的波动、
消费者的偏好、市场的客观需求和接受程度、竞争者的对策
等等。这其中某个关键要素改变
的话,对于精算模型的参数都需要重新进行估计。
3、选择实验对象
实验对象的选择大体上可以分为随机性选择与非随机性的选择。教材中说“
非随机性的
方法操作简便,只是把握不住自变量和因变量,可靠性差一些。”我对这句话其实是有保留<
/p>
的。假设我现在想要调查某地区的消费者对一款投资连结险的接受程度,那么为了保证调查
的可靠性和公正性,我在挑选实验对象的时候就不能只挑选月薪在10000或20000以上的高收入者,也不能只挑选月薪在1000~2000的低收入群体。因为高收入群体的投资方式较为广
泛和自主,因此对于投资连结险的需求就不如一般水平,而低收入群体的需求就更低了。因
此我们在挑选
实验对象的时候要注意这一点。
四、实验调查法的分类
实验调查法的分类可以按照不同的分
类方法进行分类。例如按照实验场所分类我们可以
分为实验室实验和现场实验两种;按照是否将实验单位
随机分组,市场实验可以分为随机化
实验和非随机化实验。这里我们主要讨论非随机化实验。这里面其实
涉及到一个实验设计方
案的问题。由于这其中多涉及我们不曾学习过的统计学的内容,所以这里我们不多
展开讨论,
我们只讨论教材上的三种主要的也是市场调查和预测过程最常遇见的三种类型——“实验组<
br>前后连续对比实验”、“实验组与控制组对比实验”和“实验组与控制组前后对比实验”。
在讨
论这三种实验类型前,我们需要先搞清楚四个术语——“实验组”、“控制组”、“事
后设计”和“事前
事后设计”。在实验中,我们将实验单位随机地分成两部分,一部分接受
处理后的自变量,也叫“处理组
”或者“实验组”;而另一部分是受控制的即不接受处理的,
叫“控制组”。举个简单的例子,假如我现
在是个社会学家,我现在要研究失业对恋爱的影
响,可以在同一阶层选取两个受试组,一组为失业者(也
就是实验组),一组为非失业者(即控
制组),然后我们分别收集两组的恋爱数据,进行统计比对,以得
出结论。对实验单位进行
处理之后才测量自变量对因变量的影响的叫“事后设计”。在实验中,选择一批
实验对象作
为实验组,通过对其实验激发的前后检测,并进行分析做出结论的,叫“事前事后设计”。
1、实验组前后连续对比实验
以我们教材中P123页的例子为例,这间食品厂为了提高糖果
的销售量,改变包装并设
计新图案,并在此基础上对被实验组进行前后各一个月的销售量的跟踪调查。那
么这种实验
就可称为“无控制组事前事后设计”。因为在此实验中,实验组前后连续对比实验,且其观<
br>察对象只有一个,就是实验组本身,故我们可称之为“无控制组事前事后设计”。当我们了
解了这
种实验的类型后,那么接下来我们就该来分析这种实验设计背后的原理、思路以及模
型。我们可以看到这
是最简单的一种实验调查法,它是在没有控制组作参照的情况下,考察
实验组在改变实验因素前后发生的
变化,从而来测定实验因素对调查对象影响的实验效果,
因此,它是一种纵向对比,即在前后时间上的比
较。采用这种方法,事先要对正在经营的情
况进行测量;然后再测量实验后的情况,通过事前事后对比观
察,了解实验变量的效果。我
们可以画图来表示其模型,如下所示:
事前测量
实验激发(实验处理)
事后测量
如表可见在表中没
有控制组,只有实验组的事前实验和事后实验所产生的事前实验测定
值X1及事后实验测定值X2。我们
通过观察实验激发前后X1和X2的大小来分析实验的影
实验组
X1
有
X2
控制组
—
—
—
响。其实验效
果可用两种指标来表示,即绝对指标和相对指标。绝对指标我们可以用E来
表示,绝对指标即绝对实验效
果E = X2 − Xl;相对指标即相对实验效果,我们用RE来表
示,公式如下:
RE
X2X1E
*100%*100%
X1X1
我
们可以按照公式来计算一下教材中给出的例子。我们可以设实验前5种糖果品种的累
计的销售量(即事前
实验测定值)为X1,设实验后5种糖果品种的累计的销售量(即事后
测定值)为X2,很明显,X1=
1740,X2=1920.故,绝对的实验效果E=X2-X1=1920-1740=180.
相对
实验效果RE=EX1=1801740=10.344%.
无控制组的事前事后对比实验是一种纵向
比较,操作起来简便易行,表面上看比较科学,
但事实上其实验误差较大,因为它无法消除事前事后实验
期间其他非实验因素的影响,因为
在进行事前实验和事后实验期间其他非实验因素会发生改变,这样实验
组的事后测定值就不
纯粹是实验因素改变的结果,还有非实验因素,如自然因素、商业因素、心理因素等
改变的
结果,这些都会影响实验效果的准确性。如课本P123页的这个例子,我们很难判断是否是其他因素对销售量造成的影响,180千克的销售增加量,不一定只是包装引起的。
2、实验组与控制组对比实验
实验组与控制组对比实验在实验设计上的专业术语是“有控制的
事后设计”,因为实验
对象中存在实验组与控制组,且仅关注试验后自变量对因变量的影响。简单地说,
其设计原
理为: 有控制组的事后实验是指在同一时期内,对实验组改变其实验因素进行实验,对控制组则不改变任何实验因素,照常规活动,将实验组和控制组的事后测定值进行对比,因此,
这是一
种横向比较,即在同一时间上的不同比较。这种方法是目前市场研究中最常见的方法。
同样的,我们也可以用表格来表示该实验类型的模型,如下所示:
事前测量
实验激发(实验处理)
事后测量
实验组
—
有
X2
控制组
—
—
Y2
由
表可见,在表中没有事前实验的测定值,只有实验组和控制组的事后实验测定值,其
实验效果也有两种指
标。绝对指标即绝对实验效果,同样的,我们用E来表示绝对实验效
果,E = X2 −
Y2;相对指标即相对实验效果,我们用RE来表示相对实验效果,公式如下:
RE
X2Y2E
*100%*100%
Y2Y2
同
样的,我们也可以按照公式来计算教材P124页所给出的例子。我们设食品厂改变面
包的配方后(激发
实验后)两周内新配方面包的销售量(实验组事后测定值)为X2,原配
方面包的销售量(控制组事后测
定值)为Y2,可得X2=A、B、C组第一周的销售量+D、E、
F组第二周的销售量=150+14
0=290,Y2=A、B、C组第二周的销售量+D、E、F组第一周的
销售量=120+130=2
50.故绝对实验效果E=X2-Y2=290-250=40,相对销售效果
RE=EY2=4025
0=16%.(注意这里有可能会造成混淆,本题的原意是ABC三个商店第一周销
售新配方的面包,第
二周销售原配方的面包,DEF三个商店则相反。)
这种有控制组的事后实验最明显的优点是:克服了
前面的无控制组的事前事后实验所存
在的非实验因素影响。由于这是一种横向对比实验,
在同时间里.诸如自然因素、商业因素、
心理因素等非实验因素基本相同,在实验对比中可以抵消。这种
实验法的缺点是:选择控制
组难度较大,实验效果的准确性直接取决于控制组与实验组的可比性,两者之
间客观条件越
接近,实验效果的准确性越高;反之,实验效果的准确性就越低。
3、实验组与控制组前后对比实验
有控制组的事前事后对比实验是指在实验中,分别设立控制
组和实验组,在实验组中引
入实验因素,控制组中不引入实验因素,按常规活动,然后将实验组事前事后
实验的测定值
同控制组的事前事后实验测定值进行对比的实验调查方法。故也可以把它叫做“有控制组的
事前事后设计”。其模型如下表所示:
事前测量
实验激发(实验处理)
事后测量
实验组
X1
有
X2
控制组
Y1
—
Y2
由表可见既有
纵向对比,实验组与控制组前后对比实验即有横向对比实验组事前事后对
比(或者说既有不同时点的对比
又有同一时点的对比)。
与前面两种实验方法相同,把实验组绝对变化量我们定义为E1,且E1=X2 − Xl,在
这组变化量中,包括实验因素对经济变量的影响,也包括其他非实验因素对经济变量的影响。
实验控制组
事前事后对比,其绝对变化量设为E2,E2=Y2 − Y1,由于在控制组中不引入
实验因素,因此
,在绝对变化量E2就没有实验因素对经济变量的影响,而只受到非实验因
素的影响。故我们可以推断控
制组的相对变化量RE2=Y2-Y1Y1=E2Y1,而对于课本中评价
实验组的绝对实验效果的计算
方法其实我是有所保留的。因为你不能够剔除非实验因素对于
实验组前后测定值变化的影响,所以课本中
(X1-X2)-(Y1-Y2)的表达方法其实是错误的。
正如我前面所说,因为控制组没有实验因素
对经济变量的影响,而只受到非实验因素的影响,
故可推断控制组的相对变化量RE2=E2Y1,并依
此来推断非实验变量对于数据组总体的影
响。我们知道,实验组和控制组中是同一经济变量,且处于同一
环境中,因此,在实验组中
非实验因素对每单位经济变量的影响程度也等于控制组中非实验因素对每单位
经济变量的
影响。故我们可以认定,非实验因素对实验组的影响程度为(E2Y1)*X1。然后我们可
以来描
述实验因素对于实验组的影响绝对程度(非实验因素和实验因素影响下的测定值的变化量减
去非实验因素的影响下测定值的变化量),即E1=(X2-X1)-(E2Y1)*X1。而实验组的相对<
br>变化量则相对容易求出,公式如下:
RE1
E1(X1X2)(E2Y1)*X1
*100%*100%
X1X1
五、实验的有效性
1、内部有效性和外部有效性 实验的有效性问题实际上是实验调查法的应用问题的延伸,即研究实验调查法在何种情
况下适用的问题,不知道为什么,我们的教材上没有涉及到这方面的内容,但我还是很想在
这里讲一讲
。如PPT上显示的,我们可以把实验的有效性分为内部有效性和外部有效性。
内部有效性表示用实验
测量自变量的影响或效用的准确性。如果我们能够有某种可靠的
方法证明实验变量或处理变量真正对因变
量产生的可观察到的差异,那么这个实验就是内部
有效的。例如我们要研究“烟草税在多大程度上能减轻
吸烟?”这个问题,那我们就必须对
某段时间和地域内香烟的销售额、价格、税收和个人收入进行统计,
并计算其需求的价格弹
性。假如我们能够证明征收烟草税的地区的香烟销售量的变化是由征收烟草税引起
的,而不
是由其他原因因素引起的,那么我们就可以说这个实验室内部有效的。
与内部有效性
相对应,外部有效性表示的是将实验的结果推广到实验环境意外或更大总
体的可能性。如果具体的实验环
境没有考虑到真实世界中其他相关变量的交互作用,外部有
效性就会受到很大的影响。同样是上面烟草税
的例子,在实际的调查中我们就会发现,烟草
税较低的地区因而香烟价格较低而吸烟率较高,烟草税高的
地区因而香烟价格较高而吸烟率
较低。然而由于因果关系的双重作用,即一方面低税收引起高消费,另一
方面如果某个地区
内有大量的烟民,则当地的烟草经销商为了维持自己利润的最大化,则会想尽一切办法
降低
香烟的成本以变相降低香烟的价格来取悦烟民。因此我们对这些数据的分析是复杂的,我们
在考虑到自变量对因变量的影响因素外,还应该考虑外来变量对实验的影响,即前面所说的
非实验因素对
事后测量结果的影响。接下来我们将继续讨论这一点。
2、外来变量对实验有效性的威胁
外
来变量也叫无关变量,是指除自变量外一切能影响因变量值的变量。这些变量可以把
因变量的测量值搅乱
,因而使结果变弱或者无效,这就有点像一元线性回归模型中的随机干
扰项μ,但是这样说还不太准确,
因为这些变量也有不能不具备随机性。那么我们在描述这
种变化关系的时候,是否也要把这些所有的因素
考虑进去,从而使得模型更加准确呢?就如
同在线性回归模型中增加解释变量的个数以提高拟合优度R
的值一样呢?答案当然是否定
的,原因有两个,一者是没有要,为什么呢?这就好比你画
一张地图,我们不必把现实中的
每一处细节都描述下来,一张和现实一样大的地图是没有意义的。这就好
比我们构建一个模
型,我们不可能也没必要把所以相关因素都考虑进去,我们要考虑和验证的应该是那些
对结
果的影响的显著程度最高的那些因素。再者我们也不可能这么做,因为,这些变量我们不一
定能发现,而且这些变量本省具有随机性,你很难去预料它。这就好比当下的时事新闻对于
股票市场的影
响,李克强或者是肖钢的一句话就能够叫资本市场地动山摇。那么我们下面就
具体来看一下有哪些外来变
量,然后我们才能知道如何控制它以不至于让它太过扰乱实验的
结果。
1) 时间效应;所谓
时间效应是指发生在实验期间影响数量的任何变化和事件,例如在
研究促销手段对某款投资连结型寿险产
品销售量影响的实验期间内,发生了央行的
大幅度降息或者资本市场的大规模动荡,那么我们就可以肯定
得出的来的效果是受
影响的,是不可靠的。
2) 选样偏差;这个好理解。其实我们之前在说
实验对象的选择的时候其实就已经提到
了这一点,当我们选择的实验组的个体与控制组的个体有系统性差
异时,就会产生
选样偏差对实验有效性的威胁,因为实验组事后测量值与控制组事后测量值的区别
很可能是两组选样的差异所造成的,而并不是因为实验变量或处理变量的影响。
3) 回归效应;回
归效应是指具有极端行为的目标群体在实验过程中向着行为均值发展
的趋势造成的影响。就如同德尔菲法
中的专家一样,在几轮的咨询或测试过后,意
2
见会趋于一致。这是人的天性使
然。
4) 失员效应;失员效应是由于实验过程中实验单位的“丢失”而形成的外来变量造成
的现象。若出现“失员现象”,则实验群体可能变得不具有代表性,且亦缺少外部
有效性。这种现象最常
出现在我们的人口调查中,2000年美国的全美人调查就是
一个例子,当时美国政府花了100亿美元
来搞人口普查,结果得出的数据倍遭诟病。
原因就是外来变量没有把握好。
5) 测试效应;
是指实验过程本身对我们观察到结果产生的影响,测试效应又可以分为
主效应和交互效应两种。主效应是
指早起观察对后期观察产生的影响,这有点类似
于我们前面所说的回归效应。简单的说,就是一个问题你
问他两次,他给了你不同
的答案。测试的主效应主要影响的是实验的内部有效性。交互效应是指先前的观
察
对这个实验效果的影响。举个例子,就好比我现在要调查某汽车品牌广告的效果时,
参与调查
的消费者肯定会比没参与调查的消费者对该汽车品牌更加敏感,更有可能
对测试的广告表现出关注,那么
测试出的广告效应就无法推广到总体。所以,测试
的相互效应影响到的是实验的外部有效性。
3、控制外来变量对实验有效性的影响
我们已经知道,外来变量的存在将影响因变量,扰乱实
验效果,严重威胁实验的有效性。
所以我们必须要对这些外来变量加以控制,那么如PPT上所示,常见
的控制方法有以下几
种。
1) 随机化分组;这个很简单,就是实验单位随机的分配到实验组
和控制组中,同时实
验条件也随机的非配到各组。这就好比是薛定谔的猫,你不开盒子,你就不知道猫<
br>是死的还是活的。故我们可以近似地认定实验的各组从一开始就是基本平等的。
2) 匹配分组
;匹配分组是相对于随机化分组而言的,就是在分配实验单位的时候按照
一些关键背景变量来比较实验单
位,使得每个实验组都有相匹配的实验单位。这种
方法在现实中运用得比较少。
3) 统计控
制和实验控制。这两种分别指采用统计分析的方法去测定外来变量并修正其
影响还有精心设计实验方案,
来使外来变量得到有效的控制。这两句实际上是废话。
六、结束语
关于后面的“
实验法的优缺点”的部分相对来说比较简单,所以我也就不展开来讲了,
我相信同学们自己看书都能掌握
。谢谢大家听我絮絮叨叨地讲了这么多,谢谢!如果有谁想
要课件或者是讲义的可以下课后找我要,也可
以在我的博客上面下载。谢谢大家!