当前位置:首页 > 经典书库 > 科学技术论手册

调查研究:态度、素养和理解

出处:按学科分类—自然科学总论 北京理工大学出版社《科学技术论手册》第279页(5126字)

研究公众理解科学运用了大规模的调查方法,这是与多年来标准的定量抽样方法——公众的科学态度的抽样——联系在一起的,后者至少可以追溯到1972年美国国家科学基金会(NSF)关于“科学指标”的项目。它建立在美国国家科普作家协会(NSWA)在1957年提出的一个更早的提议上[威西,1959]。国家科学基金会项目的作者乔恩·米勒认为,“事实上,可能只有少数人对科学持有某种态度”[国家科学基金会,1991b,第175页],这需要专注于科学,因此它只有少数人在追求。所以,米勒的调查试图不仅在理解科学与科学态度的水平上,而且在对科学的专注水平上收集数据。

对于历时的、跨国的或在不同群体中测量并比较公众理解科学的水平来说,显然需要有一个稳定的测量系统。它的精确性使它成了在国家水平上测量与比较“科学素养”的常规手段[米勒,1983b,1991]。从20世纪80年代晚期以来,美国国家科学基金会用以测量公众对科学的态度和理解的“科学指标”,已经拓展成一种用作比较的手段,能与日本与欧洲的调查展开横向的比较。这些方法、它们的研究议定书及其输出在测量“公众理解科学”中成为一种通用的国际框架。

在米勒的着作中,对科学的“专注”是通过某项指标来定义的,这项指标综合了对科学的兴趣、对知识水平的自我评估以及对不同信息源的常规性使用这三个方面的内容。在此基础上,米勒[1991]才能得出这样的结论,比如,“大约8%的美国成年人专注于新的科学发现”,而大约20%的美国成年人“专注”于环境污染。至于对被调查者自己所说的对科学“感兴趣”究竟是什么意思,则未曾提及。

在测量公众理解科学时,首先就一些实质性的议题提出已有定论的问题,比如原子的结构或者病毒与细菌之间的区别,然后根据“正确”的答案对反应做出评估。自1988年以来,这些方法也在国际间的比较研究中得到应用。有些调查的结果令人不解,甚至大跌眼镜,因为它们表明理解的水平低得出奇。1991年美国《科学指标》的报告[国家科学基金会,1991b]显示,关于酸雨的成因,只有6%的人能够给出“科学的、正确的”答案。即便在“有兴趣的公众群体”中,也有76%的人无法给出比“污染”更为具体的回答。事实上,在这次调查中,所谓的专注科学的公众并不比普通的公众更能科学地理解环境问题。人们的结论是,在本次调查所定义和测量的专注与理解水平之间并无多大的相关性。对这些结果的解释通常过于简单化,比如在科学素养的国家排名中,有的解释正是由这些研究者本人给定了的。比如,杜兰特、米勒和切尔尼娅[1991年]在谈及自己的研究时说:“1988年米勒对美国和英国的研究表明,没有科学素养的人达到了90%以上。”[第1页]

然而,这些解释绝非是无懈可击的。比如,关于酸雨的调查结果忽视了这样的事实,即科学家本人对酸雨的确切成因也是相当不确定的;因此,根据“正确”的答案来测量公众的反应并非易事。关于其他问题,比如,是地球绕太阳转还是太阳绕着地球转,“显见”的正确答案是前者。但是事实上两者都是正确的;“显见”的正确答案无疑是一种简单化。在其他问题上,比如热气是否上升或者光的传播是否比声音快,答案则是比较明确的。即便如此,脱离背景去建构一种能测量“科学素养”的苍白的标准必定会面临一个严肃的问题,这些测量标准事实上意味着什么,以及这种研究无意中扮演了何种规定好了的政治角色。

1957年,美国国家科普作家协会的调查[威西,1959]首次尝试测量公众对科学方法的理解;应答者被要求用自己的话来描述,科学地研究某物究竟是什么意思。这个开放性的问题在后续的调查中得到了保留[米勒,1991;国家科学基金会,1991b]。然而,怎样的回答是“正确的”,评价是依据带有浓厚的波普尔色彩的科学模型作出的。M.鲍尔(M.Bauer)[1992]写道:

[分析这个开放性问题]的方法武断地以波普尔式的科学观为基准……[它所]测量的与其说是人们对科学的理解,毋宁说是某种科学观念在公众中的传播……理论、演绎和通过实验数据的证伪回答了它们在这个符号框架中为何有如此高的出现率。如果不只是想知道公众波普尔化的程度,我们就必须采用一种更加开放的方法。

在国家科学基金会的“科学指标”项目中也采纳这类似乎是理所当然的进路。米勒[1991]把它看做是科学素养的综合指标的一部分。然而,其他的调查表明,一经涉及更具体、有定论的问题,比如有关统计检验或临床试验之类的问题时,人们在有关科学程序问题上的得分要高得多。杜兰特、埃文斯和托斯[1989,1992]对这一开放性问题的可靠性提出了质疑,因为他们发现,在回答这个开放性问题时,2000个应答者样本中只有14%提到实验;而回答具体的、有定论的问题,比如医学研究的问题时,有56%的人提到了实验。

杜兰特和他的同事对过程维度作了进一步的考察,他们根据下述两个问题进行随机抽样,一个有关实验在测试新药物中所起的作用,另一个有关实验在测试机器部件中的所起的作用[例如,欧洲晴雨表]。每一组的表格都是一样的,要求应答者在不同的“方法”中做出选择:(a)病人或机械师的意见、(b)现有的理论、(c)实验测定,或者(d)不知道。两组的回答在分布上截然不同。就医学问题而言,选择实验的占多数,而在回答冶金学问题时,选择现有理论知识的占了大多数。作者对此的解释是,公众对医学研究活动更熟悉些,因此作为实验方法的临床试验是公众理解科学方法的一般性范例。F.普赖斯[个人交流,1992]对此提出了质疑,因为它未能区分公众对临床医学与对医学研究的熟悉程度。

从某种程度上说,这项调查与定性研究的见解不谋而合。杜兰特和他的同事得出的结论是,寻找独立于情境的科学方法可能是一种误导,这个结论在PUS的定性研究中得到了充分的支持[见下文]。

然而,这项研究凸现出一些在调查中未曾得到承认的问题。除杜兰特等人的结论,即与其他科学领域的方法比,公众更熟悉医学试验之外,对不同反应模式还存在其他可能的解释。如一些成问题的项目,一种情况下是新药,另一情况下则是机器,其新颖性可能会影响人们做出这样的判断,即现存的知识是否值得追求。在每种情况下,对错误-代价的把握也有所区别。而且杜兰特假定,公众也许认为冶金学理论比“医学理论”更“先进”,但是他们随后会否定这种解释,认为这是无稽之谈。不过人们有理由认为,冶金知识比有关新药的药理知识更确凿、更通俗,因为后者似乎处于生物医学研究的不确定性的前沿。这也许是人们在药物项目中选择“实验”而在冶金项目下选择“现有知识”的良好理由。调查方法从本质上说是无法把握公众理解中的种种差别的。

这里我想说的并非是这些可能的解释一定比杜兰特等人的更好,而是说调查方法本质上无法控制这些变量,比如人们在提及“现有知识”、“理论”或“实验”时意指什么。即便是相同的调查表也无法显示,应答者对上述因素的把握与判断是否以及如何影响收集到的数据。这只是一些非正式的情境性因素,就此而言,定性方法是必要的。

在调查中,当我们要求人们对科学意味着什么做出界定,或对不同学科,包括占星术的科学地位做出评估时,也会遇到类似的基础性难题[杜兰特等人,1989]。当[调查]覆盖像“医学”这样的领域时,就会包含它的种种含义,比如生物医学研究、产前超声波监测或全科医生的诊断,我们根本无法左右应答者所说的,比如“医学”、“心理学”或“科学的”究竟是什么意思。

米勒[1983a,1991]试图把人们把握占星术的科学地位纳入到测量科学素养的构成要素中来。要是人们把占星术也归入科学,那么他们就算得上是没有科学素养的。但是鲍尔和杜兰特[1992]发现,一个人对占星术的信任与他所接受的对科学理解的测量之间不存在任何特定的相关性。

有些调查项目试图考察公众对科学制度的理解,这一考察的维度超越了科学内容与其过程的对立。米勒[1991]很大程度上把目光集中在科学技术与科研的效果之间的关系上。M.鲍尔[1992]试图考察人们对科学效果的理解。这些调查还是试图根据事先规定好的“正确的”基准模型来测量公众的理解,殊不知这些模式本身是带有倾向性的。上述模型甚至没能大致公正地对待科学在制度层面上的复杂性,比如对可交际性的把握、控制或产权,以及科学在各个领域中广泛的可测度性。

在美国国家科学基金会的提议下,以及在美、英和欧洲之间展开的横向调查项目中,已促成了一连串尝试,以考察诸多国家的公众对科学的态度。有些项目的涉及面很广,如印度的一项研究有1.6万个被调查者[拉扎、杜特、辛格和瓦希德,1991],中国的一项研究有4000多个被调查者[张仲梁和张建生(音译),1991]。后者是按照米勒-杜兰特的美-英合作调查项目设计的。在印度的其他一些研究中,注意力更多地集中在科学的制度和文化层面上[拉伊纳、拉扎、杜特和辛格,1992;瓦桑塔,1992]。

在具体的技术领域,如能源、化工或生物技术中,有关公众对科学的理解或态度的定量调查很普遍[比如坎特利,1988;库奇曼和芬克-詹森,1990;马利耶,1992;马丁和泰特,1992;技术评估办公室,1987;奥特韦和高,1990;英国无线电学会,1988]。这些调查大多把态度问题,如关于控制进一步的研究或为之辩护的风险和需要的问题与理解问题结合在一起。人们通常不加批判地预设,“更好的公众信息”将带来更深的“理解”,进而意味着更多的接受;至于其他可能起作用的竞争性信息或“理解”则很少被涉及。这些调查大多没能对应答者所使用的核心概念意味着什么做相应的控制,比如,问及是否相信基因工程的进一步研究有价值时所使用的“进一步研究”这个概念。

欧洲晴雨表(EuroBarometer)调查项目[马利耶,1992]对公众关于生物技术的“看法”展开了最广泛、最细致的定量研究,调查中“不知道”占了很高的比率[大约30%],尽管问题的设计总的来说不是为了检验知识。调查还发现,这个领域中最可信的信息来自于消费组织和环境组织;只有在丹麦,政府机构才得到与这些非政府组织大体相当的信任。

马丁和泰特[1992]发现,“理解”这一变量与态度之间存在复杂的关系。尽管大多数调查假定知识或理解与态度有正相关的关系,但是他们的研究暗示,得到理解或保持无知有着诸多情境性的原因[见下文]。一些调查项目涉及了生物技术中不同研究领域之间的区分。调查发现,人们是能够分别对待不同的风险、收益和其他含义的,而不是依据某种复合的、不加区别的“生物技术”概念。公众对“能源”的理解也是如此[比如赫奇,1991;肯普顿,1987;肯普顿和蒙奇马利,1982]。

总之,有关公众的科学态度和公众理解科学的大型调查项目都不可避免地基于某些规范性的预设——关于公众的预设、关于科学和科学知识的含义的预设,以及关于理解的预设。因此,这些调查往往加重了前边提到过的综合症——在PUS研究中只有公众被问题化,而科学或科学文化和制度则不成其为问题。这些调查还使得应答者脱离其社会情境,因此本质上不可能通过分析来考察或控制潜在的变量——关键词汇之于社会行动者的、根植于社会的意义。任何调查方法就其本性而言,都将导致知识和理解的去情境化,都将强加这样的预设,即它们的意义独立于在社会互动关系中存在的人类主体。调查数据内在的连贯性不足以证明它具有更大范围的有效性——而只能证明它具有内在的一致性,后者常常被误认为前者。

分享到: