文章来源:企鹅号 - 江苏省哲学社会科学规划办公室
政治科学研究越来越强调寻找因果机制。许多合乎逻辑的实证研究,均以各种方法分析因素和变量间因果关系,指明其作用如何产生、其结果何以形成,以探求其中的作用机制。随着互联网及大数据技术的蓬勃发展,大数据方法丰富了社会科学研究方法、拓展了政治科学研究议题,但与此同时,不能忽视传统小数据研究方法的必要性,二者在推进因果解释中具有互补性优势。
伴随着实验方法的发展和应用场景的丰富,政治科学研究经历了从因果关系(或称因果效应)分析到因果机制解释的关注转变。
因果关系主要回答“X影响Y”的问题,因果机制主要在于提供“X如何影响Y”的解释。在因果关系分析中,现已形成运用充分必要条件逻辑的休谟(David Hume)传统、遵循共融性(Cotenability/反事实与现实前提逻辑一致)原则的反事实推理(Counterfactuals)、控制关键变量分离单一变量对结果影响的实验方法等不同视角。因果机制是探讨原因如何导致结果的过程,致力于揭示因果关系形成的作用机制,是在因果关系基础上的重要补充。二者的区别在于:因果关系分析侧重寻找结果的原因(Causes of Effects),即从一个结果回溯其原因何在,强调系统地检验社会现象之间的关系;因果机制更加强调识别原因的影响(Effects of Causes),即始于从原因追问如何对结果产生影响。因此,近年来越来越多的研究者不再满足于识别变量之间的因果关系,转而致力于寻求因果关系背后机制的阐释。
目前,学界对因果机制的界定各异。从马奥尼(Mahoney)总结的24个定义,到格零(Gerring)归纳的10种类型来看,学者对因果机制是否易于观察、是普遍性理论还是有限性理论、是偶然性解释还是常规性解释、属中观理论还是微观理论等认知,存在诸多争议。但是,上述有关争议还是形成了一些共识,即认为因果机制是介于社会现象描述和社会定律之间的中层层面,是打开原因和结果的“黑箱”,是探寻因果关系的过程、路径、环节和链条;在研究方法上,既可通过个案资料等数据的搜集进行质性分析,也可通过数学模型进行量化分析、呈现理论。在探索因果机制的多重路径和方法中,主要基于各种形式实证数据的分析归纳来建构与经验相符的理论。
大数据拓展因果分析方法路径
大数据时代的来临,对传统政治科学的因果分析研究客观上形成了巨大冲击,甚至有国外专家提出,大数据使传统科学研究方法过时了。同时,大数据方法因更重视相关性而非因果性分析亦饱受诟病。由此,国内外学者从实践、方法论层面展开了广泛讨论。
例如,一些政治学者早期在探究因果机制过程中,通过降低分析层次、寻求微观基础,来打开因果关系“黑箱”。他们研究隐藏在政治现象背后的社会整体趋势和运转模式,通过案例观察、深度访谈、抽样调查、实验研究等方式,获得了社会个体的态度、认知、行为和互动数据。而伴随互联网的发展,大数据技术为获取这些数据以及揭示以往难以直接观察的行为,创造了可操作的空间。
有学者提出,大数据所凸显的相关关系,在实践层面实质性地推进了对传统因果概念的深入反思。其展示的正负、强弱相关关系指向“我们解开既存结果——事物现象的密码”。在把握全量数据的变量相互作用基础上,人们从既存结果推展到潜在结果,可对即将产生的社会现象形成原因和结果的精确预判。大数据所刻画的这一因果结构,是运用数据分析因果的基础,为探索性分析和生成假设开辟了新的可能性,增加了实证检验的理论意涵。
此外,相对于传统研究方法,大数据提供了更加多元的方法论工具包,且在推进因果推论的功能上逐步完善。特别是在描述性推论(分类、聚类方法)、相关性推论(主题分析、情感关系分析)、因果推论(可与传统统计方法、实验方法等结合)和预测性分析(机器学习等)方面,日渐成熟的方法创新推动着政治科学研究范式的变迁。
小数据在大数据方法中的延伸
相比传统政治学通过抽样问卷、实验研究、深度访谈等方式所获得的小数据,政治科学因果分析的大数据方法具有以下6种优势:一是整体性。大数据在获取近乎全量数据的基础上,使研究者对社会现象具有全面系统认知,可有效解决抽样或实验数据中的代表性和抽样误差问题。二是客观性。大数据是原始行为记录和网络行为痕迹基础上的分析,而非有目的性地设计和采集数据。因而,它是社会现象运行模式和规律等的客观反映。三是时空性。大数据所蕴含的时空信息,使研究者对一定时间或空间中整个社会行为的趋势变化判断成为可能。四是即时性。大数据技术可实时采集互联网记录的公众行为痕迹与各类网络数据,及时反映社会事件发展、民情民意变化、经济波动过程或信息传播结果等,可为政府决策提供时效性和针对性强的数据实证支撑。五是历时性。时间维度是过去传统研究方法开展因果分析的一大局限,如抽样调查耗费成本巨大、实施周期长,而大数据则可实时收集整合数据,形成某个时间维度上的长跨度数据库,这是其他研究方法所无可比拟的。六是特殊性。大数据方法将海量数据以可视化形式呈现,有助于学者发现特定区域的异常现象,从而有选择性地对特殊事件进行深度剖析。
然而,面对大数据的被动性、可获得性、个案差异等局限,小数据方法有助于共同推进因果机制的探索。小数据虽具有成本高、周期长、覆盖偏差、抽样误差等局限,但较之于大数据研究逻辑,它具有以下显著特点:首先,主观性优势。较之大数据只能客观获得已经存在的数据而言,小数据具有目的明确、设计性强的优势。研究者可根据研究目的和需求,设计问卷、访谈问题或调查实验,从而获取有用数据。其次,代表性优势。目前来说,大数据主要对网络用户群体行为产生的海量数据进行分析,该数据体量庞大,但在总人口中对不通过网络表达个人意见或不使用网络的人群有所忽略。小数据则可予以互补。如通过GPS-GIS辅助的科学抽样方法,通过分层多阶段抽取样本开展调查,从而获得覆盖各类人群意见的代表性抽样数据。再次,个案解释差异性优势。小数据在公众行为产生原因、政府—社会互动机制、主体行为策略等内在逻辑的个案分析和解释上具有明显优势。个案研究所获小数据可使研究者深入了解个案全貌与过程,在此基础上提炼的社会现象因果机制,具有个案在同质性和异质性方面的更强理论解释力。
总之,大数据与小数据并非是单纯相斥与替代关系,二者可利用彼此优势、互补结合,为推进因果机制分析提供更有力的方法论工具。整体来看,二者可以通过以下方式实现有机结合:第一,大数据提供宏观背景分析,小数据作因果机制解释。运用大数据初步挖掘与分析结果来认知社会运行整体模式与机制、提出理论假设,在此基础上有针对性地采取小数据进行个案深度阐释和假设验证。第二,基于小数据分析提出理论假设,运用大数据来检验理论解释力。运用小数据的先验知识为大数据挖掘提供方向指引,在此基础上,对通过个案或抽样数据提出的理论进行大数据验证。第三,通过大数据分析识别的变量间关系,为小数据调查或干预提供参考,以获得对变量影响机制的情景设置,并深度分析此情景下的个体认知与行为互动策略等背后的内在逻辑。长远来看,大数据和小数据方法的有效融合是一个趋势,二者结合将共同推进政治科学探索因果机制的理论挖掘和实证研究。
作者:赵娟,系清华大学社会科学学院政治学系助理研究员
排列图法、因果分析图法和直方图法的应用
1.排列图法的应用(表3-26)
表3-26排列图法的应用
排列图法是利用排列图寻找影响质量主次因素的一种有效方法。排列图又叫帕累托图或主次因素分析图,它是由两个纵坐标、一个横坐标、几个连起来的直方形和一条曲线所组成。左侧的纵坐标表示频数,右侧纵坐标表示累计频率,横坐标表示影响质量的各个因素或项目,按影响程度大小从左至右排列,直方形的高度示意某个因素的影响大小 |
(1)画横坐标。将横坐标按项目数等分,并按项目频数由大到小顺序从左至右排列 |
(1)观察直方形,大致可看出各项目的影响程度。排列图中的每个直方形都表示一个质量问题或影响因素。影响程度与各直方形的高度成正比 |
排列图可以形象、直观地反映主次因素。其主要应用有: |
因果分析图法的应用(表3-27)
表3-27因果分析图法的应用
因果分析图法是利用因果分析图来系统整理分析某个质量问题(结果)与其产生原因之间关系的有效工具。因果分析图也称特性要因图,又因其形状常被称为树枝图或鱼刺图 |
因果分析图的绘制步骤与图中箭头方向恰恰相反,是从“结果”开始将原因逐层分解的,具体步骤如下: |
直方图法的应用(表3-28)
表3-28直方图法的应用
直方图法即频数分布直方图法,它是将收集到的质量数据进行分组整理,绘制成频数分布直方图。用以描述质量分布状态的一种分析方法,所以又称质量分布图法 |
(1)观察直方图的形状,判断质量分布状态 |
常用的质量管理方法介绍
1、 现代的质量管理工作是以数理统计方法及现代化管理方法作为基本手段来控制、预防质量问题。现代化科学方法的应用才能使质量管理水平获得明显的提高。要提高质量管理水平就得认真学习掌握相关的知识。
2、“以数据说话”是质量管理的基本特点之一,要重视和做好数据的收集、整理分析工作,质量管理一定要养成“以数据说话”的习惯,(拿出数据、资料来说明问题)
3、在质量管理方面,为了形象描述和分析问题,常用七种工具就是:
②.分层法(数据分层法、层别法)
③.排列图(柏拉图、帕累托图)
④.因果图(特性要因图、树枝图、鱼刺图、鱼骨图)
不能测量也不能数出来的与产品质量相关的数据,只能通过评分、评比的办法来判定(其质量方面的色、香、味、外观颜色)
①. 掌握和了解生产的现状、正常还是异常;
②. 分析问题、查找原因,解决问题和改进、提高;
③. 调整、调节生产、使工艺参数调到规定的标准状态;
④. 对一批产品的质量进行评价和验收;
②. 必须真实可靠,严禁弄虚作假;
⑥. 要记录相关内容:什么数据、名称、料号、时间、收集人,收集的环境、条件(用的计量器等、仪器和设备、治具等),有的统计分析报表、图还要经过会签、审核、批准等;
⑦. 要对反映出来和发现的问题进行检查,分析造成的原因,要研究解决问题的措施,并组织实施,跟踪实施效果;不要收集数据后就无下文了,有时可以及时召开专门会议讨论分析和研究解决的办法。
一、调查表:(统计表)作用和目的:
对不合格品进行调查统计、针对不合格品较多的项目,要查找原因采取措施,减少生产中出现的不合格品。
正 正 正 正 正正 正 正 正 正 |
正 正 正 正 正正 正 |
二、 分层法:就是把性质相同的,同一条件下的数据收集归纳在一起,以便进行比较分析。是统计方法中最基础的工具,通常与柏拉图、因果图等结合使用。(即再用柏拉图→查主要问题、缺陷,用因果图→查出造成问题、缺陷的原因)
2、 分层法的作用:用于归纳整理所收集到的统计数据,然后对数据进行分析和比较,从而找出问题的原因(哪些方面造成不一样?什么原因?)和解决方法。
3、 举例:某厂用分层法分析气缸盖漏油原因,常用了三种分层法进行分析比较:
※ 应采用李师傅的操作方法
B、按气缸垫生产厂家分层:
C、按气缸垫、操作者综合分析分层:
※ 从综合情况看,用一厂的气缸垫时,应采用李师傅操作方法,用二厂的气缸垫,应采用王师傅的操作方法,因为这样可以把漏油率降低、甚至到零。
××厂八月上旬成品验货统计表(按时间分层)
※ 从表中可以清楚分别看出8月1日至10日每天的不良项目和不良数量,也可以看出8月1日至10日各种不良每天出现的数量,从而进行比较分析。
4、使用分层法应注意的二个问题:
①. 对分层法的原则掌握不准,有时把不同性质的数据混淆在一起,影响对问题的分析和判断;
②. 分层不够细致,对有些问题只进行一次分层还不够,还需再次分层,这样效果会更好。
三、排列图:又称柏拉图、帕累托图,由意大利经济学家帕累托(Ptrelo)提出的“关键少数和无关要紧的多数”理论,美国质量管理学家朱兰博士把它应用于质量管理,因而得名 。
1、 排列图的结构:由两个纵坐标,一个横坐标,几个柱形条和一条折线所组成。两个纵坐标:左边表示频次(件数、个数、金额、工时等等),右边表示频率(百分比表示)横坐标表示影响质量的各种因素,质量的多种状况、程度,从大到小顺序排列。
折线表示各种影响因素,质量状况大小、多少的累计百分数,由左向右逐步上升叫帕累托曲线(柏拉曲线)
①. 画出统计表:(收集一定期间的数据并整理列表,计算)
②. 按一定比例,画出两个纵坐标和一个横坐标
⑥. 在排列图下方注明排列图名称,收集数据的时间,绘图人等可供参考的事项。
某厂9月份电阻不合格品排列图计算表(要加名称、料号、明确哪一种电阻)
9月份电阻不合格品排列图 绘制人:××× 日期:×年×月×日
某厂曲轴主轴颈车加工不合格品数统计表
曲轴主轴颈车加工不合格品排列图
首先要观察柱形条高的前面2~3项(累计比率80%的项),这几项是影响质量的重要因素(如:电阻的沾污、裂纹、油漆、曲轴的轴颈有刀痕和轴向尺寸超差)
①. 纵坐标的高度与横坐标的宽度之比以(1.5~2):1为好。
②. 对于影响质量的主要因素可以进一步分层,画出几个不同的排列图,加以分析,使问题得到更好的解决。
①. 数据收集的时间过长或较短,影响了对问题的分析和所采取的措施;
②. 确定问题的项目按分层不适当,造成问题主、次排列图有些颠倒,不能抓住主要矛盾,影响对问题的分析,判断会失误;
③. 未能灵活运用好排列图,一味从质量特性来分析,而忽视了经济性、有时要从“损失金额”、“损失工时”等角度来分析,有时要画出分层排列图来追根溯源;
④. 未能利用、再用排列图来确认改进的效果。采取措施后,应画出排列图,前后作出对照比较,确认改进效果,看所采取的措施是否有效;
⑤. 分类项目过多过少、影响分析(很多,突出不了重点,少了说明不了问题)。
四、因果分析图:(树技图、鱼骨图、鱼刺图)
排列图→寻找影响质量的主要问题。运用柏拉图找到主要问题之后,需要进一步用因果图来分析问题产生的原因。问题的解决,要把产生问题的原因找到。要在错综复杂的原因中找出其中真正起主导作用的原因。
因果分析图→是一种能系统地分析和寻找影响质量问题原因的简便而有效的方法。
因果图是以结果作为特性、以原因作为因素,在它们之间用箭头联系起来,表示因果关系的图。
①. 明确提出存在问题的结果(特性)画出主干线和鱼头
②.明确影响质量的大原因,画出大原因分枝线。
③.分析、寻找影响质量的中原因、小原因。
④.找出影响质量的关键因素并用方框框起来,作为制订质量改进措施的重点考虑对象。
⑤.找出的原因要进一步的确认:
A.用投票表决法,参加讨论的人进行投票表决,要广泛讨论后表决;
B.现场调查和确认,确认的项目框起来,不认为问题的排除,有争议的可以进一步试验分析确认:比如用正交试验法、散布图等方法
⑥.要注明画图者、参加讨论分析的人员、时间等可供参考事项
某五金厂QA部对7月份ZA-33多用工具钳不良状况以后,做了如下的几项工作。
A. ZA-33多用工具钳不良状况统计表
B.画ZA-33多用工具钳柏拉图(略)
C.从统计表、柏拉图反映的不良项目中主要不良是钳头不良,因此运用因果图对钳头不良项目进行分析,寻找产生不良的主要原因。(鱼骨图见附件)
通过对钳头不良的原因分析,查找出其中的主要原因是:
①.作业人员:招进的新员工过多,没有进行足够的培训,另外,老员工有经验的工人流失过多;
②.物料:免检放行的物料太多,且未严格执行先进先出的原则;
③.作业方法:未及时更换作业指导书,操作不规范;
④.设备:电压不稳定,造成质量不稳定,多个供应商的钻头混用,也造成质量不稳定;
⑤.作业环境:噪声大、光线暗等影响作业员注意力
⑥.其它方面:急单过多,造成加班频繁,客户给定的图纸中,参数有误差;
研究后提出的改善对策:
①.加强对员工的培训,每个班,至少安排二名有经验的老员工进行辅导,对重点机台重点产品进行监控;
②.由工程部申请新变压器
③.加强钻头管理,杜绝同一产品使用多种钻头的现象,并编制书面的钻头质量要求给供应商;
④.清查仓库中的不良钢板,由品保部对钢板质量进行重新评定;
⑤.工程部尽快制定新的作业指导书,并对客户图纸中的技术参数与客户进行确认;
⑦.生管部在编排生产计划时合理评估产能,加强与销售部门沟通研究,尽量避免急单;
①.是一种科学分析方法简单易行,根据结果,按系统方法由浅入来寻找原因,与“顺藤摸瓜”思想相同;
②.能够集思广益,集中群众智慧,可以集中有关人员讨论分析,了解真实情况;
③.能使到会者受到一次深刻的质量教育。了解自己的工作与质量,与质量问题的关系,引起足够重视和实施、执行改进措施。
①.画图时,应该结合质量问题进行分析,边开会边画图;
②.应邀请有经验的工人,相关工程技术人员(设计、工艺、管理、领导、质管人员参加;
③.讨论分析时,用提问的形式为好,易于启发大家深入讨论;
④.讨论分析要充分发挥民主,畅所欲言;
⑤.对关键原因采取措施后,应再用排列图等来检验其效果。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。