所谓“漏斗法”,顾名思义乃指最初所提出的问题性质广泛,应答者怎样回
答都行,然后逐渐把范围缩小,到最后所问的则属特殊专门性问题。例如,某市
场调查公司欲调查消费者对吃朱古力糖是否会对牙齿产生不良后果的意见,便不
宜一开始就提出以下的问题:你认为朱古力糖会对牙齿产生不良影响吗?
或者:你所以不吃朱古力糖主要是怕损坏到牙齿?
以上两个问题事实上乃属引导性问题,应答者可能回答“是”,这样所获得
的资料并不可靠。再者也可能应答者根本就不吃朱古力,或者他之所以不吃主要
是怕肥胖(尤其是女性),因此较佳方法是使应答者自发性的回答上述问题。这
可以用一种较广泛的问法开始:你对朱古力糖的意见怎样?
或者:你对吃朱古力糖的看法怎样?
以上两个问题都给予应答音有回答牙齿损害的机会,自然应答者不一定就会
一如想像中那样回答。下一步便可把问题缩窄一些。例如:你在小孩时候吃不吃
朱古力?
你让你的小孩吃朱古力吗?
应答者的答案如果是“否”的话,应加一问题:“为什么?”以便应答者有
机会提及牙齿损害的答案。然后可把问题再缩窄一些。
你认为吃朱古力糖有什么害处吗?
最后所问的问题更加狭窄,比如:有的人说吃朱古力糖对牙齿会有损害,但
也有人说没甚影响。你的看法怎样?
或者:你认为吃朱古力糖会使牙齿受到损害,还是认为多数人吃朱古力糖不
会令牙齿受到损害?
以上问题的内容乃是逐渐缩窄,尽量使应答者自动提及朱古力与牙齿之间的
关系。事实上,用以上提问方式尚可获得一些何以要吃朱古力的原因,这些原因
在应答者心目中,也许比较牙齿损害这一因素更加重要,亦未可知。
在问卷中,有关同类性质的问题往往有若干条,为不白费时间一条一条询问
起见,应在每类问题之前加上一个前文提过的“过滤”问题。如在上例中应先询
问:你经常买朱古力吗?
或者:
你在过去两个礼拜买过朱古力吗?
如果答案为“是”,才采用“漏斗法”询问下去,否则大可省略,跳过有关
的问题,而从另一类问题开始发问。自然在这类问题之前可再加上“过滤问题”。
如果问卷上问题甚多,可能使应答者产生疲倦,以致对某类问题,一开始就
回答“否”,借使调查工作早点完。为了避免有这种偏差起见,在问卷上将一些
问题的次序加以转换。在某些问卷上置于前面,另一些则置于中间,还有一些可
置于后面。换言之需要印几种不同次序排列的问卷,但平均而言,仍可认为所排
列的位置相同。
有的应答者喜欢选择问题中所建议的第一个答案,例如:你认为那一种彩色
电视机牌子的彩色较佳,大光牌抑或白星牌?
有些应答者就选第一种答案,为了避免这种偏差起见,可将问卷印成两类,
一类是两个牌子的次序如上,另一类则将两个牌子的次序颠倒,变成:你认为那
一种牌子的彩色电视机的彩色较佳,白星牌抑或大光牌?
如果为了节省印刷费用,则问卷不必印两类,只须在询问应答者时,将应答
者分为两半,一半用第一种次序询问,另一半则用转换了的次序询问,这样可降
低由于问题排列次序不同而引致应答者产生不同反应的缺点。
□评价问卷的原则设计一份优良的市场调查问卷,是市场调查工作顺利进行
的一个重要条件。在评价问卷时,应考虑以下几个方面的内容:1.有利于调查人
发问、记录一份设计优良的问卷,能使调查人员根据它顺利发问、顺利记录,所
获取的调查资料是完整的、正确的、没有调查偏差的。
2.有利于被调查人理解、回答一份设计优良的问卷,应使被调查人能够充分
理解的问句,且能够回答、愿意回答、能够顺利回答、乐意真实回答,不会发生
偏差。
3.有利于收集到必要的资料从资料的搜集来看,一份设计优良的问卷,不设
置一个多余的问句,去获取不需要的资料,最大限度地减轻调查工作量。如从问
卷其他问句中能够计算整理出来的间接资料,就不必在问卷上直接列出。像居民
家庭收支调查需要“人均收入”指标,但不必单独列出,可从“家庭总收入”和
“家庭人口”两个项目计算得到。一份设计优良的问卷,也不遗漏一个必需的问
句,必需的资料没有收集,致使调查资料残缺不全,或不系统。
4.有利于资料的整理分析一份设计优良的问卷,从资料整理来看,当调查完
成之后,审核、整理和分析比较方便。
问卷设计得是否优良,最基本的一条,就是看它是否有利于提高问卷的回收
率,问题的回答率。但也应当指出,问卷的回收率和问题的回答率,不单取决于
问卷本身,还有实际调查人员和被调查人的因素,调查环境的民主气氛如何,也
是很重要的保证。
总之,由于种种原因,问卷的回收率和问题的回答率都不可能达到100 %。
因此,在确定分发问卷对象数量时,应多于计划研究的对象数量。分发问卷对象
的数量则应根据问卷回收率和所回收的问卷中的有效率(即可利用
的部分)来确定。
问卷的回收率和有效率随着调查单位的不同(如党政机关、社会群众团体、
企事业单位)、被调查对象的不同、问卷内容的吸引力和难易程度不同、采用调
查方法不同,以及对被调查者填答有无鼓励措施而有明显的区别,可采取经验估
计的方法确定。
分发问卷对象数量计算公式:M=NR×S 式中:M ——分发问卷对象数N ——
计划研究对象数R ——问卷回收率S ——回收问卷中的有效率
《运筹帷幄——市场营销研究与预测》市场研究的结果——资料分析
未整理的材料,杂乱无章,并无意义。
一、资料的分析与处理
当市场资料收集完备后,下一步的工作便是资料的整理。未整理的资料必然
是杂乱无章,并无意义,因此应根据研究的目的予以有系统的整理、编校、编号、
列表,这样市场资料才能显出它的功能。资料整理的主要程序有:
□分类分类工作往往是科学的基础。事实上,在设计问卷时,已可将某些问
题,例如被调查者的职业先予以分类,每类给予一号数,在以后资料整理时可减
少许多手续,此乃预先编号(precoding )的办法。不过有些资料无法事先加以
分类,例如采开放式(自由式)的问题、非结构性的询问及投影法等,只能事后
予以分类。
分类时应注意以下三个原则:(1 )各类别之间应有显著差异性:有显著差
异存在,资料分类才有意义,否则便与未分类无异。
(2 )相同(或近似)的反应资料应归于同一类:类别之间应育显著差异,
但同一类的反应资料则应尽量保持相同性质。
(3 )分类应详尽:被调查的反应可能有许多种,因此分类应尽量详尽,这
样才能提供有意义的情报。
□编辑将收集到的资料加以核校,以消除其中的错误或含糊不清,期能达到
资料准确的目的,编辑工作应在资料收集完备后立即开始,以便在找出错误所在
时,调查员因刚离调查过程不久,尚能记忆可能发生错误之处,况且早期纠正或
消除错误,对后期的资料分析意义重大。
如果样本不大,编辑工作,一人即可应付,但样本较大时,则宜用数个编辑
者,每个编辑者负责一类资料,以增加编辑工作的效率。
编辑工作既可以在现场进行也可以在办公室进行。现场编辑对个人访问特别
重要,因为调查者在访问时很难填满整个问卷,多半是用常用的记录符号来记录
答案的,因此在访问后应尽快审阅或更正。在进行小组访问时常有多个调研人员,
各人负责的方面不同,而调研小组的主持人要督促他人进行及时更正,以尽量防
止可能出现的问题。办公室进行的编辑是在收到所有访问记录、邮寄问卷或电话
记录后,进行的综合的审查编辑。这对邮寄问卷调查特别重要。下面是在进行编
辑工作时常会遇到的一些基本问题。
假访问——这类假访问出现在个人访问和电话调查中,比如结果中有下寻常
的一致性和不一致性。这多是由于课题所雇用的某些调查员不认真负责而做的假
象。因此,如果发人有这种行为就应仔细检查,经常性的检查有助
于减小欺骗的倾向。
不一致或矛盾的回答——在收到的问卷里,可能会发现应答者的回答前后不
一致,如某个应答者在一开始说他家里没有小孩,但在后来的问题里却提到他的
两个小孩的年龄和名字。编辑吉可以判断出第一个问题的答案是错的,因为应答
者特别地给出了两个小孩的年龄。在这种情况下,要作出判断常常还要其它更精
确的信息。
无法读懂的回答——如果邮寄问卷上的答案是手写的,有些问题的答案可能
难以读懂,编辑者就只得把这些答案扔掉。开口问题越多,难读的答案也越多。
不正确的回答——比如把时间记错了。
不完全的回答——回答者可能会把他使用的商品的品牌给忘掉了,在谈到学
位时,应答者可能只列出了研究生学历而漏掉了该回答的本科学历。
“不知道”和没有答案——在“不知道”出现的情况下,应答者表明他对所
问问题没有形成一个答案或观点。而“没有答案”是指应答者让某个问题空着不
予回答。在有些情况下,“不知道”和不回答的情况很少,这对研究结果也并不
重要。但在很多情况下,这却出现得很多。不回答的情况有三种:1 )有些回答
者确实不知道该如何回答;2 )回答者或许不理解所问的问题从而难以给出明确
的回答;3 )回答者不想回答问题,不回答或答“不知道”
以避免思考等。
那么如何处理上述问题呢?仅仅把这类问题或把整个问卷扔掉是不明智的。
或许不回答的人在某种程度上属同一类型,需要进一步研究。不完全的问卷总是
有不少有用的信息的。
进行编辑工作时应注意以下几个原则:(1 )纪录之易读性(legibility)。
当发觉答案不清楚时,如果问卷系由被调查者本人填写者,在时间允许的情况下,
应寄回原处或派调查员前去复核更正。凡不能辨认的纪录,如不能重填。则应予
剔除。
(2 )纪录之完整性(completeness)。市场调查问卷的所有问题都应有答
案,如果有并无答案之情形,可能系被调查者不能或不愿回答,也可能系调查员
遗忘所致。研究者应决定是否再向原来之被调查者询问,以补填空白问题,或者
询问调查员有无遗漏,若有,是否能记忆被调查者所作答案,要不然就应考虑剔
除这些遗漏了的资料。
在问卷中往往出现一些“不知道”的答案。如果“不知道”答案在各该问题
中所占的百分率不大,可以单独列一栏(或列)予以表示,但如果所占的百分率
过大时(例如3O%),则会影响到资料的完整性,有违资料的准确性原则。处理
“不知道”答案的方法有三:①比例分配到其他答案项下;②单独列为一项;③
根据其他答案的百分率分布来推测与“不知道”答案最接近的答案项目,从而将
之归并入内。例如在调查各收入阶层对某些日用品支出的问卷中,发现有些答案
未填收入,如果背这些问卷对各种日用品支出的百分率与各收入阶层所支出的百
分率加以比较,假定发现与中等收入阶层的支出百分率只为近似,则可推定这些
未填收入之家庭亦应属中等收入家庭,这样就可把该“收入不明”的问卷的其他
资料合并在中等收入家庭这一类中处理。
(3 )纪录之协调性(consistency )。对每一问卷均应作详细审核,检视
答案内容是否前后一致。例如在某一问题的答案中,被调查者申言在超级
市场购买洗衣粉,但在另一问题中却说经常在杂货店购买日用品,该被调查
者的两个答案显然并不一致,问题是那一个答案方属正确。在这情形下,研究者
应决定是否再向该被调查者询问,还是整份问卷剔除不用。
(4 )纪录之正确性(accuracy)。编校者应对资料作详尽校正,凡对答案
怀有疑问,应即予以澄清纠正。
□编号编号是给问题的答案配上数字或符号以便为表格化作准备。编号在整
理问卷时就可完成,但一般应在整理编辑完成之后。下面讨论编号的一些方法。
(1 )对量化资料进行分类编号。对资料应当进行分类才能满足研究目的。
在很多情况下,问卷中的问题本身就已经对答案进行了分类,如“请您指出您的
月收入在哪个范围?”
①小于150 元;②150 ~180 元;③181 ~200 元;④201 ~250 元;⑤大
于250 元。
这五个答案等级就可用在编号分类中。但如果问题是“请您指出您在今后两
年中的月收入大小”,其回答是具体数值,如140 元,就有必要依据回答的规律
进行分类。
像上面讨论的那样,对涉及到数量资料的问题(收入、销售量、使用频率、
旅行距离、年龄等),编号就是把数据放在某个间隔里。下面是一些常用的原则
:①应知道将要进行哪些类型的统计分析,进行的分类也要以研究的目的和假设
为依据。
②使用的间隔要使最常出现的答案(数)在中间。比如,如果有许多人回答
他们的收入在80元左右,而另一些人回答他们的收入在120 元左右,分类间隔就
应该是70~100 元,101 ~13O 元等。而使用80~100 元,101 ~120 元等则是
不合适的。
③分类间隔应是相互排斥的,如70~100 元,101 ~150 元,>150 元等。
而70~100 元,100 ~150 元,≥150 元则会使应答者困惑。
④分类间隔多比分类间隔少好。如果分类多还可综合成较少的类别,而在一
开始就使用很少几类,则可能影响分析。比如把收入分为两类:≤100 元;>100
元就太粗略,难以说明问题。
⑤使用多重分类。在不知道要进行什么统计分析或想要做何种分析时,就有
必要进行两种以上的分类。比如可以记下某个应答者的工资为85元,工资额也可
放在下面的间隔里,如50~70元;71~90元;91~110 元 .(2 )对定性资料进
行分类编号。在涉及到定性资料(职业、产品品牌等)时,应该注意下面几点:
①在分类与编号之前,要看是否有一定量的回答存在;②使用的分类与其它的资
料相适应以利于比较;③分类是简洁和互斥的,每个回答只能放在一个间隔里;
④包容所有可能的回答。这并不是指每个答案都应有一个数字编号,但每个回答
都应当能放在某个类别里。通常使用“其它”来包括所有没有指出
的答案选择;⑤在给一般消费者的邮寄调查中,常用开口问题来让回答者指
出他的职业“请谈谈您的职业”,而不是要他们在所规定的答案中作选择,因为
很多人不知道他们的工作应属什么职业。分类工作应该由研究者自己来审定;⑥
生活方式的分类可以把回答者的年龄、性别、家庭等都包括在一起。
但这并不能代替其它人文学上的问题。
(3 )数字尺度的类型。给每个问题的答案进行编号的目的是为对每个问题
进行表格化和统计分析作准备。在编号过程中要根据资料的类型和含义判断每个
问题的编号属什么类型的数字尺度。
例如,对某路汽车服务进行调查,共提出25个问题,有7 个被调查者,每个
问题有4 种答案。应答结果可列表如下:表5.1 某路汽车服务调查问卷答案编号
答问 1 2 3 4 5 6 7 8 9 10 11 12 13 14 … 24 25案题应答者
1 1 2 2 3 2 4 1 1 3 2 4 1 2 1 1 3
2 3 2 4 1 1 3 3 2 1 2 3 1 3 2 4 2
3 2 1 4 2 3 3 2 2 2 1 1 2 2 3 1 3
4 2 1 2 4 2 4 2 4 4 3 3 1 2 1 2 4
5 1 4 5 1 1 1 1 3 2 4 2 1 3 1 4 1
6 1 1 3 3 1 2 4 2 2 1 1 2 1 3 3 1
7 3 3 1 2 2 4 3 1 1 2 3 1 2 1 1 4
…
□表格化这一步工作是把收集到的资料组合起来并且表格化,可以由人工或
计算机完成。表格化就是使答案以某种报告的形式出现。
1.每个问题的表格化分析工作数据分析的第一步通常是对每个问题进行单独
分析,常用的方法是频率分布分析和平均值分析。
(1 )频率分布分析。频率分布分析是指出每个问题中各备选答案被选择的
数量,如表5.2 和表5.3 中应答者家庭中有无录像机的数目和月收入范围数目及
其分布百分比,从而反映出被调查者家庭录像机的拥有比例以及收入范围分布。
由表中可以看出百分比在对数据进行解释、判断时比回答的绝对数量更直观、容
易。
表5.2 家庭有无录像机频率分布
录像机回答者数量(个)百分比(% )
有 185 37 无 315 63 总和 500 100
EMBED Word.Document.6 \s(2 )平均值分析。对有些问题特别是有关被调
查者态度的问题的回答常需用某个简单数据,如样本平均值来进行描述。表5.4
中描述了人们对与录像机有关问题的看法的平均情况。问题中使用了赖克梯量度
(完全同意7 ——完全不同意1 )。第一栏数据给出了500 位被调查者回答的总
平均值。
结果表明,总的来说被调查者认为家庭需要录像机;录像机目前的价格太贵
;对国产录像机的质量稍有不信任感。而按家庭是否有录像机来分,被调查者的
回答又有一定差别(见表中其它几栏数据)。与家庭没有录像机的被调查者相比,
有录像机的被调查者偏向于认为录像机是必需品,不那么认为录像机价格太贵。
对国产录像机的评价也较高。
平均值总平均差别陈述有录像机无录像机1.录像机是必需品 4.6 5.6 4.0 1.6
2.目前录像机价格太贵 5.3 4.1 6.0 -1.9 3.国产录像机质量尚可 3.9 4.2 3.7
0.5 样本大小 500 185 315
在对每个问题进行分析时是使用频率分布分析还是平均值分析,视具体情形
而定。一般来讲频率分布分析能提供较多的信息,而平均值分析只能以一个数据
表达总的综合情况而反映不了某些回答的极端情况。因此在计算平均值时也常要
求计算出标准差。频率分布分析在对潜在的顾客进行分类或市场分片时很有用。
另外对使用类别尺度的问题也只能使用频率分布分析。而平均值分析则多用于对
态度测量问题的分析。
2.多问题和多因素的综合分析——横列表法资料分析的第二步是对每个单个
问题针对不同的被调查者类型(或其它不同因素进行分解分析,因为在比较的情
况下会使对结果的分析更有意义。
对被调查者的分类有各种方法,如按产品的使用者与非使用者,高等收入、
中等收入与低等收入,不同教育程度,乡下与城市等对顾客进行分类。
如果最初的分析涉及到频率分布分析,则进一步的分析应使用横列表法。下
面对横列表法进行介绍。
横列表法的开始就是形成一维的数据,然后把这些数据分成两个或多个类目。
所使用的类目必须基于研究的目的。当然有些类目也可能是出于研究者直觉上的
考虑以便寻求某些可能的联系。下面是一个描述横列表法应用的例子。
(1 )横列表法的应用举例。某保险公司对影响保险户开车事故率的因素进
行调查,并对各种因素进行了横列表分析。从初始表(表5.5 )中可以
看出有61%的保险户在开车过程中队未出现过事故。
表5.5 驾车者的事故率
百分比(% )
开车时无事故 61 开车时至少经历一次事故 39 样本数量(人) 17800
然后在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。这样
就出现了下面这种二维的表(表5.)。6 表5.6 男女驾车者的事故率男(% )女
% 开车时无事故 56 66开车时至少有一次事故 44 34样本数量(人) 9320 8480
这个表的结果令男士懊恼,因为他们的事故率要高,也表明女士驾驶车时涉
及事故的人数较男的要少。但人们会提这样的疑问而否定上述判断的正确性,即
男的事故多,是否因为他们驾驶的路程较长。这样就引入第三个因素“驾驶距离”
(表5.7 )。
表5.7 不同驾驶距离下的事故率男(% )女(% )
驾驶距离>1 万公里<1 万公里>1 万公里<1 万公里开车时无事故51 73
50 73 开车时至少49 27 50 27 有一次事故样本数量(人) 7170 2150 2450 6050
表5.7 的结果表明,男驾驶者的高事故率是由于他们的驾驶距离比女的长,
并没有证明男的或者是女的驾驶得更好或更仔细。结果仅证明事故率只跟驾驶的
距离成正比而与驾驶者的性别无关。
(2 )横列表中使用因素的选择。上面的例子说明横列表使用的成功,取决
于研究者选择关键因素以及根据这些因素组成横列表的能力。使用的因素的类型
和数量随着研究的性质而变化。在简单的事实收集研究中,要考虑的因素是已知
的,研究者只不过是把资料按需要的形式组合。如研究武汉市拥有彩电的家庭,
要使用的因素比较明确,即彩电的拥有与家庭人员的年龄、收入、职业的关系。
在描述性的研究中,研究者有较大的范围来选择这些因素。例如某大公司想
判断有哪些关键因素影响着它的销售人员的能力。这些因素可能包括销售员的年
龄、经历,或许还有在学校里学的课程、参加社交活动的次数等等。
在这种情况下,横列表中要用的因素取决于研究委托人的要求和研究者直观
的探索。
在探索性的研究中,研究者可凭直觉选择所有的用于横列表的因素。例如在
研究消费者时,研究者自由选择那些可能会景响购买偏好的因素(年龄、性别、
生活方式、收入、教育等)。
但不管研究者有多大的自主权来选择用于横列表中的因素,这些因素的选择
都应当在资料收集之前就已决定。这并不是说其它因素不可增加进去,只是因为
横列表分析只能基于有数据基础的因素上进行。
(3 )从横列表里发现含义。使用横列表的目的是发现可能存在于某些因素
之间的联系。下面再举例说明。
假设一研究课题为调查某小镇居民看电影的习惯而选择了1000个居民样本
(年龄大于12岁)作为调查对象。研究结果表明26.7%的人是有规律的看电影者
——每月两次以上(见表5.8 )。
表5.8 居民看电影的习惯百分比(% )样本量(人)% 常看 26.7 267 不常
看 73.3 733 总和 100 1000
已假设大学生与非大学生居民相比是常看电影者。因此这些资料可以分解为
下面的表格(表5.9 )。表5.9 大学生与非大学生居民看电影的习惯大学生非大
学生常看 37% 21%不常看 63% 79%样本量(人) 350 650
表5.9 表明大学生看电影和习惯与非大学生居民不同。但在我门接受这个结