栏目图片
当前位置: 首页 >> 管理学科动态 >> 正文 管理学科动态
梁建:中国管理研究中的量表使用取向(2006~2015):关键问题与改进建议
作者: 2019/05/08 22:05:48 阅读数:

尽管基于中国样本的问卷研究在过去10年间有了长足进步,但是测量内容在中国组织背景中的情境化水平仍然有待进一步提升。针对这一问题,我们在总结讨论各种使用取向实践的基础上,尝试就如何在量表使用过程中促进测量内容的情境化水平提出相应的建议。

(一)使用翻译取向时的问题与建议

考虑到源于西方的研究目前占据的主导地位,不难理解翻译取向成为中国管理研究中量表使用的一个主要选择。但是在将这些量表引入中国组织情境时,研究者不仅需要处理语言差异问题,还必须保证原始测量在中国情境中的语义与概念对等性的问题,即这些源于西方的测量题目在中国组织背景中是否还具有相同的含义(Hambleton & Patsula1998Tsui et al.2007)。简单的翻译程序可能会将不合适的西方测量内容带入到中国背景下,使得研究结果可能带有一些偏见。因此,我们建议研究者在使用翻译取向时考虑以下三个问题:

1.构念具有跨文化概念对等性吗?

使用翻译取向的一个前提是源于西方的构念及其测量题目在中国背景下具有跨文化的对等性。在决定使用翻译取向前,研究者必须对这一前提假设进行审视。心理测量的本质是用一些外在可观察的指标去描述无法被直接测量的、抽象的构念,最终实现将抽象的概念操作为可以计算的数字(Schwab1999)。基于这种性质,清晰概念的属性有助于我们界定测量的边界,判断测量内容在中国情境中的等同性,确保测量题目在中国情境中的内容效度。同时,在判定量表内容的跨文化对等性时,我们还需要思考该量表题目在语义上的抽象层次。认知心理学家认为人类社会的语言是一个由不同抽象水平组织起来的逻辑体系。这一认知体系有助于人们进行感知、推论以及进行复杂的理解和记忆(Fiske & Taylor1991)。当一个量表的特定性水平(level of specification)较高时,其测量题目对于某一群体或情境有着较高的针对性且内容效度很高,但对另一群体或情境而言则内容效度很低。因此,较高语义特定性水平的测量题目可能会导致测验量表的普适性过低(DeVellis 2003Vogt et al.2004)。相比而言,高度抽象的题目更加容易获得跨文化的适用性。如SmithBond2003)所阐述的:如果我们希望就社会行为做出较为泛化的结论,它们就必须以一种高度抽象的方式进行表述。相反,如果我们希望强调这些行为的文化特殊性,那么我们就需要用具体的事件或行为来进行表述(p.58。一旦我们有理由相信源自西方的概念及其测量题目不适用于中国组织情境中,研究者就需要思考使用修改取向或是情境化取向,而不是翻译取向。

2.应该遵循什么样的翻译过程?

目前普遍采用的翻译过程是翻译-回译法(translation-back translationBrislin et al.1973),即由一名合适的翻译者将英文问题翻译成中文,再由另一位翻译者将中文回译成英文。如果回译后的英文与起初的英文清晰一致,即可完成翻译过程。由这一描述可以看出,翻译-回译法需要两种语言习惯之间存在很多共同之处,而中英文之间恰恰存在很多不同之处。因此,应用翻译-回译法往往会带来很多挑战。在以往讨论的基础上(谢家琳,2012;梁建和樊景立,2012),我们再来看看两个例子:首先,中文语法一般遵循着主语 + 谓语 + 宾语(表语)的语序,而英语的词序有着更加灵活的变化,在感叹句、倒装句、疑问句、否定句、强调句当中,英文可以出现语句倒装的现象(刘万里,2012)。这样的差别可以通过下面的例子说明:

  原文:With the last hours of the afternoon went her hopesher courage and her strength

  译文1:随着那天最后的几个小时过去,一起消失了她的希望、勇气和力量。

  译文2:她的希望、勇气和力量都随着那下午的最后几个小时一起消失了。

在这个例子中,与译文2相比,译文1严格地按照英文次序来翻译,但是这些翻译并不符合汉语表达习惯,致使句子文意不通。其次,中英文的表达方式也受到历史、宗教、风俗和生活等方面影响,给使用翻译-回译法造成障碍。如下面的例子:

原文:High buildings and large mansions are springing up like mushrooms in Beijing

译文1:在北京,高楼大厦犹如蘑菇般地涌现。

译文2:在北京,高楼大厦犹如雨后春笋般地涌现。

在这个例子中,译文1反映了英国的习俗。在英国,竹子是不常见的植物,因此英国人习惯于用蘑菇来形容雨后迅速增长之势。而译文2表面上看起来有点失真,但更加符合中国的语言习惯。虽然这两个例子并不直接与管理研究有关,但是足以反映中西方在语言习惯和思维方式的差异。因此,刻板地遵循翻译-回译法可能面临一些问题:起初的翻译者为了确保回译人员能够准确翻译,他们会机械地根据英文的语言习惯进行翻译,而不太敢于根据中文的表达习惯进行创造性翻译。这些不符合中国语言习惯的翻译很有可能在数据收集中产生很多误解、困惑,从而使得被试给出很多没有实质意义的回答。

在过去的研究中,一些研究者已经开始尝试弥补翻译-回译法的不足。例如,在Greenholtz2005)对跨文化敏感性的研究中,起初的测量题目分别由四个人进行翻译,形成四个不同的翻译版本,从中选择最终的版本,并交给两位本地人对翻译结果进行评价。最后,研究者和两位评价者对每个条目的语言和概念的精准性进行讨论。Sun等(2007)在研究高绩效人力资源管理实践、组织公平行为和组织绩效的关系时,在完成翻译-回译步骤后,将中英文版本的问卷交给一名中国的翻译学教授去检查中文版本是否实现了对于英文语句的无偏翻译。这两种方法都在翻译-回译法的基础上进行了改进,在解决语言方面的差异的基础上,有助于实现中英文版本量表之间的概念对等性。

3.如何报告概念对等性的证据?

概念对等性是进行跨文化比较的前提条件之一,主要是通过一系列的统计步骤去检验所测量的概念在跨文化样本中是否存在测量的对等性(Schaffer & Riordan2003)。虽然基于中国样本的问卷研究并不一定进行跨文化比较,但是因为西方学者在开发量表时并没有考虑中国情境,所以我们在翻译这些量表时,应该报告支持概念对等性的证据,以保证量表在中国背景下的构念效度(Tsui et al. 2007)。针对这一问题,一个值得推荐的例子是Liao等(2010)的研究。在研究社会交换关系对个体创造力影响时,Liao及同事为了保证翻译后的问卷题目在中国情境中的对等性问题,采用了四个步骤的工作:(1)邀请调研公司人士和具有中英文能力的管理学家判断量表的语义对等性;(2)在文献回顾的基础上,确认研究中所涉及的测验量表曾在中国组织背景得到应用,并具有良好的心理学测量指标;(3)针对每个测验量表,进行探索性因素分析和验证性因素分析并确认它们得出的因子结构和西方是一致的;(4)通过一系列验证性因素分析程序检验了变量测量之间的区分效度。这样的程序都或多或少地应用在目前的中国管理研究中,但是并不是每一个研究都对这一问题给予了足够的重视。我们推荐这一例子正是希望研究者能够从中得到启发,在使用翻译取向时积极寻找支持概念和测量对等性的证据,特别是在将西方量表第一次引入中国情境中时更加应该关注这一问题。

(二)使用修改取向的问题与建议

在过去10年间,修改取向的应用比例只有4.2%。尽管比例较低,但是中国管理学者已经成功地进行若干情境化尝试,通过修改源于西方的量表使之适合中国的组织情境,例如员工创造力量表(Gong et al.2009)、工作嵌入量表(Job embeddedness Hom et al.2009)、知识转移量表(Wang et al.2009)、高绩效工作系统量表(Wu & Chaturvedi2009)和市场导向量表(Wei & Lau2008)等。在对这些尝试进行总结的基础上,我们建议研究者在使用修改取向时需要处理以下两个问题:

1.在什么情况下适合使用修改取向?

修改取向意味着研究者选择修改已经发表的成熟量表。因此,研究者必须给出充分的说明以论证修改的合理性。结合对以往实践的回顾,我们建议研究者可以在两种情况下思考使用修改取向:第一、当文献综述或者经验数据证实源自西方的部分测量题目不适用于中国组织情境时,修改取向是一个合适的量表发展策略。Hom等(2009)对工作嵌入量表的修改就是这一很成功的例子。在以工作嵌入视角去研究员工-组织关系对员工的影响时,他们发现原来的量表通过一些具体的指标来衡量一个人如何嵌入于其工作中,而这些指标需要修改才能适合中国情境。通过对一些MBA同学的访谈和开放式问卷调查以及其他研究者的帮助,他们不仅修改了部分题目(如以午餐补贴、交通费等清晰地定义中国情境中的津贴类别),还增加了一些中国人较为看重的人际关系因素(如与中、高层管理者和客户建立的良好关系)。在这个例子中,源于西方的概念同样适用于中国情境,只是其对应的量表使用了特定性水平较高的题目,所以研究者选择了修改原有的题目以适用于中国被试。第二、当研究者进行中西跨文化比较时,有可能需要考虑采用修改取向来发展测验量表,以保证构念在不同样本之间的对等性。例如,FuYukl2000)比较了美国和中国的经理人在影响他人时使用不同影响策略(influence tactics)的有效性。为了进行合理的比较,研究者不仅在西方文献中找到了一些影响策略,而且在对中国经理的访谈中得到了一些新的策略(如在提出请求前送礼物、在非正式场合提出请求等)。他们将西方文献中发现的策略和基于中国情境发现的策略同时放入了问卷之中,然后让中美的管理者评价这些影响策略在某个特定情境下的有效性。结果发现美国的经理人认为理性劝说、交换策略更为有效,而中国的经理人认为送礼物、联合施压以及向上请求更加有效。在这个例子中,研究者充分意识到了理论构念在中西方背景下测量指标的不对等性。这时如果仅仅使用来自西方的测量内容,就无法完整理解文化情境对经理人选择使用影响策略的影响,而经过修改的量表为完成高质量的跨文化比较奠定了基础。

值得指出的是,由于中、西方学者在发展测量题目时的着眼点不同,很有可能造成在量表经过修改后新、旧测量题目存在着某种内容的不一致。为了避免这一问题,我们建议研究者在修改原有量表时,应该首先详细了解原量表的开发过程,充分理解概念定义和原有的测量题目,以确保补充的题目与原有的题目在测量属性上保持一致。而在完成量表修改后,研究者需要通过内容效度检查、探索性因素分析等程序检验新、旧测量题目之间的结构一致性。

2.使用中国背景下开发的量表还需要重新修改吗?

一般而言,修改取向是指修改成熟的西方量表以使其符合中国组织情境,但有时研究者也需要对源于中国的量表进行情境化的修改,以使其更加符合研究者的测量目的。在对以往实践回顾的基础上,我们建议在以下两种情况下应该考虑这种选择。

第一、随着时间变化或是对研究现象了解的不断深入,原来开发的量表不足以反映目前的情境,这时研究者可以选择修改原有的量表。两个例子可以说明这种情况:(1Hom等(2009)在研究雇佣关系对员工的影响时,重新修订了以往的员工-组织关系量表。最初的量表由Tsui等(2002)针对中层管理者以定性归纳的方式开发,Wang等(2003)应用这一量表检验了员工-组织关系对于公司绩效的影响。在此基础上,作者通过对中国MBA学生的访谈,在之前的员工-组织关系量表中加入了另外5个题目;(2)另外一个例子是HorngChen2008)对自主品牌管理绩效影响因素的研究。在这个例子中,作者修改了自己在2004年发展的、以技术维度为主的品牌管理绩效量表,以更好地反映许多台湾制造业公司在发展自主品牌过程中野心和期望。从这两个例子可以看到,量表开发是一个不断完善的过程。当概念对应的现象发生了变化或是研究者对构念本身有了新的认识后,我们都需要修改原有的测验量表。这一点对使用归纳法发展的量表尤为重要,因为这样的量表往往与当时的背景以及所使用的样本高度相关。

第二、当研究者把量表应用在一个不同的情境时,可能需要对其内容进行修改。例如,Su等(2009)研究了在中国企业在管理营销渠道时的人际影响策略。他们认为供应商拥有的社会资本越多,它们就有可能应用人际影响策略,并因此获得更高的渠道满意度。在测量供应商的社会资本时,他们选择使用了ParkLuo2001)开发的、六条目的企业间关系量表。这一量表分两个维度测量了中国企业与所在商业群体以及与政府之间的关系。前者包括企业与买方、供应商和竞争对手的关系,而后者包括了企业和政府、工业部门和其它管理机构的关系。为了更好地将这一测量应用在捕捉供应商的社会联系,作者用焦点小组访谈的形式对测量内容进行了确认。结果表明除了以上六种社会资本之外,供应商还会依靠于第三方或朋友的朋友去拓展他们的社交网络,因此形成了七条目的新量表。在这个例子中,研究者使用的量表是由一个本土概念发展而来。在把这一量表应用在一个新情境时,他们同样关注了对测量内容的修改。

(三)使用情境化和去情境化取向的问题和建议

在翻译和修改国外量表的同时,中国管理研究者近年来也开发了若干较有影响的测验量表。我们在表3中对一些具有代表性的量表开发过程进行了整理。从表3可以看到,这些量表既包括了采用了去情境化取向、适用于各种文化情境的量表(如高绩效人力资源实践,Sun et al.2007;员工建言,Liang et al.2012;谦逊型领导,Ou et al.2014),还包括了意在捕捉中国情境特殊性、采用了情境化取向开发的量表(如关系紧密性,Chen & Peng 2008;矛盾性领导行为,Zhang et al. 2015)。但是无论是去情境化还是情境化取向,研究者在开发这些新量表时都遵循了通用的过程范式(Hinkin 1998)。为了避免重复,我们将这一节中在兼顾其不同的基础上,将这两种使用取向一并进行讨论。我们主要针对以下5个方面的问题,总结讨论在过去一段时间内中国管理研究者采用的、具有创造力的量表开发步骤。

1 量表题目开发范例


 

1.如何在去情境化和情境化取向中做出选择?

去情境化和情境化取向都是研究者选择使用在中国组织情境中开发的量表,这是它们与翻译和修改取向的最大不同之处。但是这两种取向也存在本质的不同,研究者在概念界定和量表使用过程中应该对其间的区别给予重视,谨慎地做出选择。

首先,去情境化取向是研究者基于普适性假设而进行的量表使用或开发。在应用这一取向时,研究者认为所研究的主题在不同文化背景下享有一个共同的概念框架(Schaffer & Riordan 2003)。在这一前提下,研究者在发展问卷题目时不会讨论中国管理情境对构念定义和测量内容的影响。与之相对应,遵循这种取向所进行的探索是研究者创造普适性管理学知识(universal management knowledge)的一个重要来源(Tsui2004)。表3中三个采用去情境化取向的例子可以帮助说明这一特点:研究者在测量高绩效人力资源管理实践(Sun et al.2007)和谦逊型领导(Ou et al.2014)时,所依据的概念框架均基于西方的文献得出,并没有讨论中国情境的特殊性。Liang等(2012)在测量抑制性建言时,虽然他们使用了从中国组织情境归纳出的测量题目,但他们将这些题目与西方文献的相关题目进行了整合,并没有将之明确区分。在这三个例子中,中国组织情境只是为量表发展提供了实证样本,但中国情境因素并没有影响构念的定义及结构维度。

与去情境化思路不同,持情境化观点的研究者通常认为他们提出的构念来源于中国情境,而就这一概念而言各个文化之间不太可能存在共有的认知框架(Schaffer & Riordan2003)。基于这种认识,相对应的量表开发过程需要研究者充分理解中国组织情境中内部人的观点以归纳他们特有的认知思维模式。例如,Yang等(1989)开发的传统性量表就充分体现了儒家思想中的五伦观念和行为逻辑。君臣、父子、兄弟、夫妇、朋友五种人伦关系和忠、孝、悌、忍、善的关系行为准则构成其量表题目的主要内容来源。同样,家长式领导量表的发展也遵循着同样的逻辑:研究者在对中国组织中领导行为的观察基础上,尝试分析了这些行为特征的文化根源,最后以三维度的理论模型作为量表开发的基础(Farh & Cheng2000)。虽然家长式领导可能是一个普适性的概念(Pellegrini & Scandura2008),但是这个量表的开发是一个典型的情境化过程:量表的测量内容直接来自中国文化传统对领导行为的影响。一个最近的例子是Zhang等(2015)开发的矛盾性领导量表(见表3)。这个量表开发的基础是建立在阴阳逻辑之上矛盾认知观点。作者认为这一特征直接反映在了中国领导行为方面,并以此为基础通过定性归纳的方式发展了测量题目。在这些例子中,中国情境被整合进了研究者的概念发展之中,并以之作为发展测量题目的理论基础和内容来源。这种情境化的努力最终贡献的是特有的管理学知识(context-specific management knowledgeTsui2004)。

由以上分析可见,去情境化和情境化取向的一个本质区别在于:前者的理论来源是现有的西方文献,所产生的知识直接贡献于相应的研究领域;而后者的理论基础则植根于中国特有的社会情境,以贡献特有管理学知识的方式影响相关领域。研究者应该准确地了解两种取向的差异,从而有效地将基于中国背景的本土情境知识融入到全球的知识创造体系中,为推动管理学知识的发展做出中国学者的贡献(李海洋和张燕,2016)。

2.在开发量表时,研究者如何恰当地使用归纳法?

构建测量题目库是量表开发过程中的重要一步(Clark & Watson1995)。一般而言,研究者可以通过三种方式生成题目库:(1)基于构念定义,自己编写测量题目;(2)修改文献中已有的测量题目;(3)通过访谈相关专家(如企业人士或是领域专家)获得描述目标构念的典型特征,在此基础上编写测量题目。前两种方式属于测量题目发展的演绎法,而后一种称为归纳法(Hinkin1998)。

量表开发一般而言以演绎法为主,这是因为在量表开发之前,研究者已经进行了大量的文献回顾,这些知识可以帮助确定构念的内容范围,为编写题目提供了理论基础。但是通过对过去10年的回顾可以看出(如表3中的例子),中国学者在发展量表时大多采用了费事、费力的归纳法。出现这一选择的原因可能有两点:(1)由于中国社会转型的复杂性和快速的变化,研究者需要通过咨询相关专家的经历或想法,以保证对构念内容的了解是完整而准确的;(2)引入归纳法有利于研究者结合实际管理现象论证概念结构,从而增加中国管理研究的合法性,进而得到国际学者的认可和接受。相对于去情境化取向,归纳法的使用无疑对情境化取向的帮助更大,这是因为基于情境化取向的概念往往涉及了中国社会的特殊情境特征,通过归纳过程得出这些概念的内涵无疑有益于国际学者更好地理解这些特征。在表3中就有两个典型的例子:关系亲密度(Chen & Peng2008)和矛盾性领导行为(Zhang et al.2015)。在这两个例子中,研究者需要向西方学者介绍中国人的关系理念和基于阴阳的矛盾管理思想,这无疑是相当具有挑战性的任务。因此,研究者在理论分析的基础上,通过归纳法得出丰富的定性材料,为发展理论构念和测量题目提供了厚实的描述(thick description)。

在现阶段,严谨的归纳过程对于开发情境化的测验量表、构建具有中国特色的管理理论是非常必要的。因此,我们必须了解到归纳法在使用时可能存在的不足:使用归纳法发展出的测量题目有可能对于构念而言是不完整的或是加入了不符合构念定义的内容。出现这一问题的主要原因是研究者在使用归纳法时大多缺乏一个清晰的概念定义和内容框架。这时如果过多地依赖了访谈对象的意见,这些人由于并不完全了解研究内容而很有可能造成测量内容的污染或是缺陷。简单的访谈归纳可以帮助研究者积累大量关于构念的表层描述,但不足以识别其内在深层特征(Jahoda1980)。因此,研究者在使用归纳法时的首要任务是利用调研对象提供的信息完善和明确构念的定义边界和内容结构,而不是从定性材料中直接发展测量题目。从表3中可以看到,除了归纳法以外,许多的研究者都在开发量表题目时结合使用了演绎法,从而确保在一个清晰的理论框架指导下开发测量题目。

3.在使用归纳法时,如何采用合适的定性研究方法?

在使用归纳法时,选择合适的信息采集方式也是非常重要的。恰当的定性数据收集方式有助于研究者准确地理解构念背后的现象基础,从而有针对性地发展测量题目,保证量表的内容效度(Haynes et al.1995;梁建和樊景立,2012)。基于归纳法在当前中国情境下发展量表的重要性,我们整理了过去10年间研究者采用定性数据收集方法的情况。结果显示,在全部196个使用去情境化和情境化取向的量表中,共有45个量表在发展过程中使用了归纳法,其中使用开放式问卷的有20个量表,占全部的44.4%,而使用个人面谈的有22个量表,占48.8%,而使用焦点小组访谈的量表仅有5个,占11.1%。由此可见,焦点小组访谈是目前相对被忽略的一种方法。

焦点小组访谈是一种由多名参与者在一名主持人的协调下就某一特定话题进行的讨论(Vogt et al.2004)。与个人面谈和开放式问卷相比,焦点访谈小组在了解研究现象、发展测量题目过程中具有一些独有的优势,比如参与者不仅需要回答研究者提出的问题,还需要回答其他参与者的问题,这一特点使得小组访谈最终得到的信息量往往大于单独对每个小组成员进行访谈的总和;与其他有相似经历的人在一起讨论,可以降低其评价焦虑,从而避免被试给出社会称许性很高的信息。同时,群体讨论也可以在一定程度上抑制个别参与者提供误导信息的可能。因此,焦点小组访谈是一种在发展量表题目时重要的信息收集方式。

在过去10年的实践中,有两个值得推荐的例子:(1Su等(2009)使用了焦点小组访谈的方式开发了关系取向量表。他们分别组织了与供应商和零售商的焦点小组讨论,以了解描述关系取向的两个核心思想——仁和义。最后,作者通过整理焦点小组讨论提供的信息生成了衡量关系导向的15个题目;(2)另一个例子是Liu等(2015)对社会化中黑暗面与新员工绩效之间的关系研究。为了测量社会化中的黑暗面,他们提出了三个构念:老员工饮酒规范(veteran alcohol use norms)、客户饮酒规范(client alcohol use norms)以及饮酒的绩效动机(performance drinking motives)。为了测量这三个概念,他们在7家中小企业组织了焦点小组访谈,要求访谈对象描述他们与客户喝酒或观察客户喝酒的场景,以及与客户喝酒的理由,在这些信息的基础上发展测量题目;随后,他们组织了另外6家中小企业的焦点小组访谈,要求访谈对象判断之前生成的题目是否可以反映所要测量的构念,以及是否还需要补充其它的题目。在这两个例子中,小组访谈的形式有助于研究者深入地了解所研究的管理现象,弥补研究者对特定管理情境的知识缺陷,从而有效地提升测量内容的代表性和充分性,保证问卷研究质量。

在使用焦点小组访谈时研究者也应该注意一些问题:首先,有些话题可能并不适用于小组访谈的方式。例如,让中国员工公开评价领导的行为应该是一件很敏感的事情,这时研究者最好选择使用个人面谈等方式进行调查(郑雅琴等,2013);其次,小组访谈对主持人的要求较高。在访谈过程中,小组讨论很有可能偏离研究者预期的问题,而一些不恰当的询问更有可能误导小组讨论。因此,在焦点小组访谈中,研究者需要选择一个不仅了解研究目的,同时拥有专业知识、可以站在客观立场有效引导受访者的主持人(Vogt et al.2004)。

4.在使用归纳法时,如何保证样本的代表性与充分性?

如前所述,在使用归纳法时构念的测量范围是通过自下而上的模式确定的:研究者通过收集相关信息以确定描述构念的核心特征(Hinkin1998)。因此,选择的合适样本是使用归纳法的一个关键性问题,研究者获得的信息越完整充分,就越有可能开发出一个准确、有效的测量工具(DeVellis2003Haynes et al.1995)。随着中国社会的转型,不同年龄层的员工拥有着不同的价值观和工作态度(侯烜方等,2014)。这种多元化特征是使用归纳法发展量表时研究者可能遇到的一个挑战。

许多研究者倾向使用MBA学生作为开发量表的样本。这可能是因为收取MBA学生的数据更加容易,沟通成本较低。但是MBA学生均具有较高的教育水平,年龄相仿且经历类似。这样过于同质的样本很显然不利于研究者获得描述构念的多元化信息。从表3可以发现,这些较为成功的量表开发过程大多以多元化的样本作为信息归纳、发展问卷题目的基础。因此,我们建议研究者可以考虑以下三种措施:(1)努力获取多方面的信息来源。通过多元化的信息来源,问卷开发者可以更容易找到理论构念在现实生活的完整表征,从而增强量表的情境化特征与内容效度。例如,传统性(Yang et al.1989)和员工-企业关系量表(Tsui et al.2002)在开发时都运用了多种收集数据的方式。这些方法不仅包括焦点小组访谈、开放式问卷,还包括了许多其它的来源如杂志、报纸等。除直接询问受访者外,新媒体和出版物也是研究者在开发量表时一个非常有用的信息来源;(2)积极寻求多方专家的协助。例如,Ou等(2014)在发展谦逊领导方式时,使用了一个由17个专家组成的小组去归纳测量指标,包括8位领导力领域内的管理学教授、3位有丰富的行业咨询经验的管理顾问和6位企业人员。这种信息收集方式可以将领域内专家和企业员工的意见有机地结合起来,从而获得关于研究现象丰富的描述;(3)使用多个样本进行数据收集。在Xin等(2002)研究组织文化时,在通过一组员工的样本生成了组织文化的类别后,她们还对另一组员工进行了焦点小组访谈。这次焦点小组访谈的目的不是收集收据,而是检验归纳法得到的类别是否充分且具有普遍性,这一过程无疑对发展一个内容完整的高质量量表是非常重要的。

5.问卷题目完成后,研究者应该如何检验量表的内容效度?

在发展出测量指标后,研究者还需进一步分析每一个题目的内容效度,即测量指标是否准确而完整地测量了构念的特征(Haynes et al.1995)。这一步骤对现阶段的中国管理研究非常重要,因为很多的研究通过归纳法收集信息、发展测量题目,而这些题目可能只描述了某一特定阶段或群体员工的认知或是行为。因此,研究者应该仔细地检查测量指标的代表性和稳定性。

结合我们完成的文献回顾,我们针对这一问题提出三点建议:第一、研究者必须对构念有一个清晰的定义。研究者一般倾向于认为自己对测量内容有清晰的认识,但是很多时候他们并不清楚(DeVellis2003)。在使用归纳法时,许多研究者往往选取那些被提及次数较多的指标去测量目标概念。但事实上,最常被提起的指标不一定反映事件的频率或重要性,可能只反映了人们最容易想到的部分(availability heuristics bias), 更不足以描绘理论构念的整体范围。只有在清晰地阐述了概念的边界后,研究者才能判断哪些测量题目符合测量的目的,而哪些应该从测量中删除。例如,Wang Kim2013)研究员工主动社会化行为时,根据概念定义采用了三条标准对测量指标进行筛选:(1)指标在中国语境下是否有清晰明确的含义;(2)指标是否是描述员工的行为;(3)指标是否和概念定义相一致,并且没有和其它概念有重复之处。可见,如果研究者在使用归纳法时并没有发展一个清晰的概念定义,他们就无从评估其测量指标的内容效度。

第二、在对测量指标进行内容分析时,研究者需要关注这些指标的时间稳定性。如前所述,中国社会目前正在经历一些前所未有、快速的制度变迁。在这一时期,人们的认知和行为受到了诸多因素的影响。例如,如果在1995年与2015年分别询问什么样的员工行为属于描述一名好员工标准的组织公民行为,我们很有可能得到一些非常不同的回答。在过去20年间,中国市场经济的转型与国有企业的改革使得企业评价员工的标准发生了很大的变化。但是与文化的影响相比,这些制度/经济因素对人们的影响可能只是暂时现象(Triandis1994)。因此,在使用基于归纳法发展的量表时,研究者需要思考使用的题目是否容易受到时代的影响。在有必要时,研究者应该及时地对这样测量内容进行修订,以保证测量题目在环境变化后的内容效度。

第三、在对测量指标进行内容分析时,研究者有必要遵循一系列的定性评价步骤。内容效度评价一般被认为是在量表开发过程中由研究者主导的主观评价步骤(Hinkin1998)。但是研究者有可能会无意识地根据自己的预期对测量题目进行诠释,这样的内容效度检验可能是不正确的或是不完整的。因此,与发展测量题目相似,内容效度的评价可以采用类似焦点小组访谈的方式咨询一组与研究主题相关的专家进行评价。例如Zhang等(2015)在对矛盾性领导行为的题目进行内容效度分析时,首先由两位专家分别对指标进行修改和评价,然后由第三位专家对比他们的相似之处和不同之处并对他们的结果进行整合、修正或删除,再将结果返回给之前的两位专家,由他们进行再修改之后返回给第三位专家。这个过程一直持续到三位专家的意见达成一致为止。最后,研究者将这个版本的量表交给三组研究生,每组包含5-6名成员,由这三组学生判断附加的修改是否是必要的。在这个过程中,多名专家以及学生的参与可以帮助研究者克服自身的认知局限,更好地判断通过归纳得到的指标是否符合测量要求。当然,在这一程序中,研究者过分注重研究专家的参与。如果有企业员工的参与,可以避免单纯从研究者的背景进行内容判断。

附录:中国管理学者引用超过4次以上的量表名称


 

来源:本文节选自梁建, 刘芳舟, 樊景立. 中国管理研究中的量表使用取向(20062015):关键问题与改进建议[J]. 管理学季刊, 2017(2):63.