人类如果没有种族、性别、肤色的区别,是不是会更美好?

n多题提供小学语文、数学、英语、数学思维,初中语文、数学、英语、物理、化学、地理、历史、政治、生物,高中语文、数学、英语、物理、化学、地理、历史、政治、生物的试题、试卷、知识结构、学习工具等内容。

n多题():逆境给人宝贵的磨炼机会。只有经得起环境考验的人,才能算是真正的强者。——松下幸之助。最后更新时间:Sun Mar 28 :28 GMT+0800 (China Standard Time)

}

——从女权主义到女性主义的演变分析
[内容提要]:本文从多重视角试图揭示法律在建构、增强和延续对女性的偏见中扮演了怎样的角色。在从女权主义到女性主义(为行文方便,一概称之为女权主义)的演变中,人们也从着力于分析法律的工具性作用转而质疑法律本身的中立与公正,从争取法律面前男女平等转而强调女性价值应得到更多的认可,这既是女性自我意识的逐步觉醒,却也陷入了“平等”与“差别”的两难困境,而一条可能的出路也许是创造和谐的男女关系。
    天尊地卑,乾坤定矣。
    乾道成男,坤道成女。
    乾知大始,坤做成物。
    乾,天也,故称乎父。
    坤,地也,故称乎母。
           ——《易经》
  法律通常作为公平的象征而被人称为“善良与公正的艺术”。但女权主义法律理论要打破这一神话,对法所宣称的公正性和客观性进行彻底全面的批判。表面上貌似中立的法律,实质上表达了男性的意志,正如普兰·德·巴雷所说:“制定和编纂法律的人都是男人,他们袒护男人,而法理学家则把这些法律上升为原则。”1女权主义法理学在理论上的抱负就是对法律方法和现代法律秩序的实质作出一种女权主义的解释。“在方法上,它不同于传统法律理论或内在(从法律推理或法律实践本身论证与阐释法律的性质和方法)或外在(自觉地站在法律实践之外思考它们符合某些基本政治目标的限度)的进路,而采取第三种可谓解释性的视角,对法律作批判性的解释。”2(784—5)本文试图从多重视角分析在女权主义眼中,法律有什么性别偏见,即法律怎样看待男人和女人,而女权主义又怎样看待法律。
  “女权主义一词是对一种复杂现象的总称。它主要可以被理解为基于妇女因其性别遭受痛苦这种认识而对妇女在过去和现代社会中与男人的关系方面的社会作用的一种关注。”3女权主义者一般都承认性别歧视是首要的、流传最广泛的、或者说根基最深的人类压迫形式,但这并不意味着她们对这一有害偏见的性质和作用有同样看法,也不表明她们对铲除性别歧视的最好形式达成共识。法律在建构、增强和延续对女人的歧视中发挥了怎样的作用,各种女权主义给出了不同的回答。在自由主义时期因呼吁女性应享有同男子平等的法律与政治权利,可归结为一种女权主义法律思想。在激进与后现代时期由于坚持女性以一种不同于男性的方式体验世界,并且最终也以一种不同于男性的方式认识世界,而法律是一种男性化的思维方式,可归结为一种女性主义法律思想。
  但各种女权主义法律理论之间的显著差别并不甚于其他理论,这种差别也并非政治上的不团结或智识上的缺陷,作者以一种更具包容性的态度对差别作出解释并指出主要有四种区分的参照。首先是方法论与写作风格的混合。如威廉斯通常采用个人性的叙事分析,跨越抽象化到个人化写作之间的界限,使理论贴近女性的生活体验;而伊利格丽则依一种巧妙的隐喻风格写作,社会批评、乌托邦式的幻想与诗意的冥想交织在一起。作者指出这些区别不仅关涉风格还反映了法律研究的某些概念性框架本身的局限。第二个参照是各自关于性别差异的理论根据。问题集中于女人是天生的还是造就的。有人认为社会性别起根本性作用,波伏娃对此所作的经典表述是“女人并不是天生的,而是造就的。”斯玛特强调妇女的经济地位、妇女和女性气质在法律话语中的建构以及法律制度对家庭结构的影响。康乃尔局限于精神分析,韦斯特看重生理差异,更有甚者否认任何探究妇女受压迫根源的理论必要。第三个重要参照是在内容与方法上与其他法律和社会理论的联系程度。从这一点看,女权主义理论并不具有鲜明的独创性,它通常将不同的实质性问题纳入法律研究,充分借鉴自由主义、马克思主义、精神分析等研究成果。只有激进女权主义是个例外,它批判社会主义女权主义通常等于将马克思主义适用于妇女,自由主义女权主义通常等于将自由主义适用于妇女,只有自己才是真正的女权主义。(麦金侬,791)不过最明显的参照是其政治定位。作者就是依此继续阐述了几种女权主义理论。仍须说明的的是,分类只是为了分析的方便,有很多女权主义作家介于各种类别之间。
二.纵观:从女权主义到女性主义
  自由主义女权主义:法律的性别中立与形式平等
  自由主义已成为现代进步思想中主流的政治表达,但它本身却是变化的。自由主义认为人是理性的个体并拥有与生俱来的权利,假定公民的基本资格是理性。但最初女性被看作天生缺乏理性而被排斥在公民群体之外。在各种人权宣言中主体只是男人(man),女人或含蓄或明确地被排除在人的定义之外。看待自由主义思想发展的一种方式是它的普遍性标准为它自己提供了内在批评的基础。(794)自由主义女权主义将形式平等的现代理想适用于妇女,法理学上的目标就是为女性获取与男性公民平等的法律主体性。4她们认为男人和女人在本体上是一样具有理性的人,法律对女人的偏见在于女人的社会性别,即“女人并不是天生的而是造就的。”不管是男人还是女人都应当首先被看作是人。女人需要的是同男子平等的权利、同样的机会、相同的法律地位。就此而言,女性赢得了大多数立法和司法上的胜利。然而存在的问题是既然性别角色是社会建构的,那么为什么这些性别角色如其所是分别归属于男人和女人呢?这仅是一种偶然吗?
  激进女权主义:法律的性别为男
  激进女权主义宣称自己是唯一真正的女权主义。她们将生理性别当作基本的分析范畴,认为生理性别的差别与阶级差别、种族差别相比更根本。如麦金侬所言“性之于女权主义就如劳动之于马克思主义。”
  在激进女权主义内部关于生理特性对女人的价值有不同的认识。其中文化女权主义认为主张我们“首先”是个体,我们每个人在身体上与他人彼此分离对男人而言是“无关紧要的真理”,对女人却显然不真确。女人并不在本质上、必然地并永远与他人分离,其实在某种意义上至少在四种周期性的和决定性的经历中女人与生命及其它相联系。这种联系性是女人不同的道德、声音、认识方式、精神、关怀能力、养育能力的源泉、核心、根源与原因。但有的激进女权主义认为这种联系是女人受到贬低、软弱、屈服与悲惨的根源,是引起我们痛苦的原因,是阻碍我们的生命正常发展的理由。因此在制度上这部分女权主义一直更倾向于追求分离主义和抵制性政治,在意识形态上有一种强烈的乌托邦倾向。
  二者的对照与各自的问题
  奥尔森的论文《女权主义和批判法律理论》提出了一种阐明激进女权主义和自由主义女权主义区别的有用的方法。奥尔森认为自古典自由主义思想兴起以来,也许是自柏拉图时代以来,我们大多数人的思维结构就是一系列复杂的二元论:理性/非理性、思想/感觉、主动/被动、文化/自然、客观/主观、抽象/联系等。首先,二元论是性别化的,前一元被认为是男性气质,后一元被认为是女性气质;其次,二元是等级制的。一元支配与限定另一元。非理性是理性的缺失;思想比感觉更重要;第三,法律认同等级优越的男性气质。法律被要求像男人一样是理性的、客观的、抽象的和原则的,而并不被期望像女人一样是非理性的、主观的、联系的和个人化的。自由主义女权主义和激进女权主义对这种二元分析的策略回应是不同的。前者通常认同气质的等级秩序,但是试图颠倒这种二元划分的性别化,认为女人具有和男人同样的理性能力、生活于公共领域的资格、行为能力、智识力量与客观性。后者接受划分的性别化,但是试图颠倒等级评价,呼吁在社会实践中女性气质应得到更多的认可。(803—4)
  自由主义女权主义者倾向于关注对妇女不利的个别性的法,关注妇女被排除在法律职业之外,激进女权主义者认为法律推理本身增强了男人凌驾于女人之上的权力。简言之,法律所致力于的“法治”价值,如中立性和形式平等,掩盖了它本身的偏私性。因为两性并不具有(也从来没有)平等的权力,法律面前形式平等的原则将真正的无权者和有实权的人等同起来,并要求同样地、“平等地”对待两者(Mackinnon)。根据激进女权主义,在无处不在的男权之下,客观性将不可避免地体现占支配地位的亦即男性的视角。如果说客观性也意味着从有权力的一方的观点来看,支配就被掩盖与合法化了,即权力制度“在形而上学上接近完美”(Mackinnon)。既然女人并不占有这个权力位置,她们就不会从客观的角度言说,她们所说的一切都由于缺乏严格的客观性而将自动地边缘化。像激进女权主义者所相信的那样,如果男人独占了获得客观真理的机会,那么权力失衡就是隐蔽的,这种权力失衡暗含在所有他们对女人的设想中。要推翻这种权力失衡也困难重重。例如,如果男人将女人看作客体,那么这就变成了女人存在的绝对方式。由于不存在中立的基础,那么即使我们用来描绘这个世界的语言也会倾向于增强男人凌驾与女人之上的(性)权力。在麦金侬的最令人难忘的一句警句“男人占有女人,主体主宰客体”中很好的体现了这一点。(802—3)
  自由主义女权主义存在一些基本的问题。首先是它强烈的个人主义。对个人利益和资格的关注遮蔽了以妇女的从属为特征的排斥与歧视妇女的体系性方式,将妇女在众多领域的缺位解释为自由选择的结果而被合法化,忽视社会和政治制度在一定程度上塑造个人偏好、态度和性情以及对妇女可能有重要意义的集体和公共利益。所以它有可能产生个人成就的杰出模式却不大可能产生一种改变女性群体地位的计划。第二种批评主要集中于自由的消极性概念(自由被理解为不受外界的干预特别是不受国家的干预)和公私领域的划分。自由主义政治思想以假设这个世界被划分为公共性和私人性的空间与问题为特征。政府行为主要施于公共世界,而个人生活和私人空间则完全属于个人自治和消极自由。在分析上,人们质疑能否清晰地描绘出公私的界线,例如在家庭这种典型的“私人领域”也存在暴力的威胁,这种问题理应受到法律的规制。在历史上,这种划分使人们倾向于将妇女的生活与兴趣放在私人领域而将其界定在政治干涉之外。(795)公私二元论的意识形态是对私人世界的状况不负责任,对私人领域的放任是对现状的巩固,实际上支持在公私领域既有的权力关系和利益分配,而女权主义应更赞同一种更积极的自由概念。最激烈的批评来自“差别女权主义”对自由主义在法律和法律分析中关于性别中立假设的质疑(下文讨论)。自由主义没有回答男女之间是否存在重大的“本体论”差异,它无异于一种同化策略,即把女性同化进由男性为男性利益而设的标准之中,将女人等同于男人。
激进女权主义同样遭到了普遍的批评。首先是它具有“本质主义”的危险,认为两性不平等根源于男女身体之间的基本生理差异,这有过分推崇与抬高生理差异之嫌,而忽视了社会性别、经济等因素。(但也必须指出有些激进女权主义的主张建立在历史的或精神分析的论据之上,它们大体上是建构主义的。)并且因此导致了相对有限的实质性问题。其次是来自后现代主义对其所谓的“宏大理论”的批评。另外还有人认为激进女权主义的分离主义立场减少了结成政治同盟的可能性以及与阶级、种族等问题的相关性。
差别女权主义:男女有别,何谈平等?
  差别女权主义对法律的批判比自由主义女权主义更复杂更激进,成为现在女权主义法律理论的主要进路。其兴起与哲学上的后现代思潮有关,排斥自由主义女权主义和激进女权主义的形而上学理论与宏大叙事,质疑性别中立、形式平等等自由主义女权主义的“法治”理想,关注法律对先于它本身存在的性别差异的反映,关注法律在建构、增强与维持性别差异中的有力作用。
1.法律的内容:反映男性观
  基于理性人(男性)的模式建构,妇女的视角与利益并未真正地融入法律而是被更效地遮蔽。例如它将侵权法中结构性的男性偏见掩盖与合法化了。理性人原则上是利己的原子式的个人,很少被期望有利他的行为,只有在某种有对价的条件下才负有帮助他人的积极性义务,而禁止侵害他人的义务在侵权法中只是例外。(815)
  法律的主体暗含是一名男性,他是有理性的个体,受制于认知能力,生活在公共领域。而女人会发现自己是沉默的并且被巧妙地排斥。这一主体与启蒙运动中从身份到契约的政治法律思想相似,是典型的契约主体,是从对情感和身体等的依赖中抽象出来的理性主体。妇女被迫在框架内表达自己,这一框架通过假设一种特殊的有关“正常”的主体的形象,系统地将体验的特别之处和权力失衡的某些重要问题排除于法庭。抽象既是一种意识形态也是一种事实,重要的是什么被抽象以及如何被抽象,对此女权主义的策略是强调情景化。
  差别女权主义认为法律方法(推理过程)是社会性别化的,并对女人不利。法律秩序是达致/建构真理的对抗性体制。法律过程是从社会关系和身体性别中抽象出来的假定平等的个体之间的一种博弈。吉利根(Gilligan)发现男人与女人的道德推理是不同的。男性倾向于正义伦理或权利伦理,它植根于社会契约论,基本上以一种法律化的方式进行,即归纳能将价值形成等级结构的规则,然后将这些规则运用于事实之上。男性很少从与他人的联系这一角度看问题,而是更多地从一个与其他独立自我竞争的自我出发。而女性通常采取关怀伦理或责任伦理的进路,探讨联系和关系以及包容的价值,做更为复杂但是更少确定性的分析。“来自不同责任的冲突而不是来自权利之间的竞争,决定了它是一种与周围关联的叙述性的思维模式,而不是形式的抽象的思维模式。这种道德概念注重关爱的行动,道德的发展围绕着对关系的理解,正如公平道德的概念将道德的发展与对权利和规则的理解联系起来。”(820)
4.男性形象和女性形象:法律话语中的男性气质和女性气质
  差别女权主义还关注法律在积极建构性别差异和性别化的社会身份时所发挥的有力作用。不仅在法律学说而且在法律语言(由法官阐述原则时所用的结构性语言)都会发现一些强有力而带有偏见的形象,这些形象是关于“标准的”男性和女性及其性别特征的。对麦金侬而言,同一性与相似性分析本身就是歧视的一种表现,因为它要求女性符合男性的标准而不去质疑为什么男性气质首先就被确认为一种规范。康乃尔更进一步指出除非在性别差异的前提下承认女性气质的价值,否则就不能充分质疑性别等级制。(康乃尔,828)
  差别女权主义还关注在法律推理的概念体系以及在法律的实施中的性别偏见。
  在自由主义女权主义阶段,致力于法律的工具性作用,重点放在自由主义对法律面前性别中立与平等的理想上,而在由差别女权主义占支配地位的现一阶段,对中立的可能性持更大的怀疑态度,完全致力于一种更复杂的平等观念,它顺应与珍视而非固化妇女作为妇女的特殊性,  把重点放在法律的象征性与动态方面而不仅仅放在它的工具性作用上。
(四) 性别、种族、阶级——聚焦黑人妇女中的无产者(女人与女人的差别)
  女权主义者认为法律与法律实践的态度暗含为男性的,批判种族理论认为它们暗含为白种的(包括女权主义),而这一切都是无形隐蔽的。换言之,它们典型地表达了优越的白人男性的世界观。特别是黑人妇女的声音在回应形式隔离与奴隶制的历史中一直被边缘化。在这种意义上,批判种族理论的事业可以被描述为揭示法律隐含的肤色,正如女权主义的事业是要揭示法律所隐含的性别。(836)对于马克思主义女权主义而言其事业是要揭示法律所隐含的阶级性。由拥护批判种族理论的妇女提出的一个重要观点是,庞大的以性别为导向而无视肤色的女权主义理论与庞大的以种族为导向而无视性别的批判种族理论观点的结合意味着有意识地去揭示即使在智识语境中也被遮蔽的黑人妇女的特殊处境。粗略地说,它隐含这一假设,即所有的黑人都是男性的,所有的女人都是白种的。(873)批判种族理论指责女权主义对妇女持某种本质主义观点,即无视妇女的差别。“其实人们头脑中所谓的女性气质对黑人妇女来说并不准确,她们通常被看作强而有力的,被动的或脆弱的妇女形象是特别针对白人妇女的。自由主义对公私领域的划分同样不适用于黑人妇女,她们并没有象白人妇女那样被限制在家庭中,也没有被禁止从事繁重的“男性化”的体力劳动。”5社会主义女权主义试图通过建构一个想象的“二元制”理论来扩展和修正马克思主义的观点,即把父权制和资本主义同样看作压迫妇女的制度,将经济生产制度中的剥削与人类再生产过程中的剥削联系起来,也就是说,妇女在再生育中的付出被男人剥削正如工人阶级的生产劳动被资本家剥削一样。“显然黑人妇女受到互相连锁的压迫,种族歧视、性别歧视和阶级偏见即使在理论上可以分开,实际上也是不可分的。这些压迫形式中的任何一种都不能提前被铲除,不可能在与之相连的其他压迫形式被消灭之前寿终正寝。压迫是只多头兽,暂时砍掉其中的一只头,马上又有新的头从它臃肿的身体上长出来。想要结束其恐怖统治,必须把它的整个身体作为发起攻击的准确目标。”6 Crenshaw认为只有种族/民族和性别/社会性别之间的社会结构的相交处在法律上得到承认,平等或正义的路径对法律秩序中的少数妇女才是开放的。(838)
  “妇女的境遇有别于其他任何社会群体的境遇,因为她们并不是诸多孤立团体中的一个,而是人类这个整体的一半。恰恰是这种结合——必不可少却又被忽视——决定了她们的命运。”7但并非男性才是压迫者,女性其实也是共谋者。不想成为他者,不想成为交易中的一方,对女人来说将意味着放弃同男人这个优越等级结盟所带来的好处。男君主会为女臣仆提供物质保障,会为她的生存进行道德上的辩护。虽然存在被引向被动、迷惘和毁灭的危险,但这条路也容易走。她们散居在男人中间,由于居住、家务和经济条件及社会地位等原因,而紧紧依附于某个男人——父亲或丈夫,其程度甚于对其他女人的依附。假如她们属于资产阶级,就会认为自己同本阶级的男人利益,而不是同无产阶级的女人利益息息相关。假如是白人,她们就会忠于白种男人,而不会忠于黑人妇女。我们由此可以发现女人的基本特性:她在整体中是他者,而整体中的两部分是相互不可或缺的。
三.展望:困境与可能的出路——和谐
  自由主义女权主义认为女人和男人在本体上是一样具有理性的人,关注法律形式上的平等,由于在思想上远没有对世界的组织方式引起实质性的再思考,并无多大建树;但在现实的斗争中却是激进的,最终成为思想上的贫乏者而行动中的积极者。其困境是如果平等准则是男性的规范,那么它还是应该追求的平等吗?激进女权主义和差别女权主义强调女人和男人在本体上是不同的人,推崇女性的价值和思维模式,而在思想上是激进的;但由于声称男女有别应履行不同的社会责任,将女性气质浪漫化可能在现实中是保守的,恰似建造一座麻醉自己的空中楼阁,最终成为思想上的高贵者而行动中的无能者。其问题是如果差别是值得珍视的,平等又是如何可能的?“女权主义理论家面临着一个选择:将公民身份看作女人应当获得的或者推翻或解构这个理想本身,将其作为一项把女人排除出去的机制。在一定程度上,这是一个修辞上或战术上的选择,因此在哲学上庸俗平常。但在其背后确实存在着概念上的困境。”8
  马克思说:“人和人之间的直接的、自然的必然的关系是男女之间的关系…… 这种关系表明人的自然的行为在何种程度上成了人的行为,或人的本质在何种程度上对他来说成了自然。”9女权主义思想家正是因为忽略了男女之间的复杂关系才陷入了非此即彼的两难困境:或者试图让法律成为中立客观的标准,男女因在本体上同样为人而应受到同样的待遇,但这有把女人同化为男人的嫌疑,且本身就是歧视妇女的一种表现;或者强调女性有不同于男性的差异,法律的性质就是男性化的,法治的理想就是排斥妇女的一种策略从而完全拒绝法律。如果说从前的法律不把女性看作主体,忽略她的存在,调整的只是男人之间的矛盾、冲突的话,那么女权主义法理学也仅仅或者提高女性在法律上的地位,或者拒绝法律本身的所谓的男性气质,最终女权主义成为仅仅是女人的事业而少有男性的参与。这固然与男性维护自己在法律上的既得利益有关,但根本原因在于女权主义者无视问题的关键在于平衡男女之间的和谐关系。自由主义与其他政治传统的区别在于它坚持一个人的生活与他人的分离,每一个生命的同等的重要性,把生命看作它本身的目的而不是一个更大的组织或整体的部分。每个人都应被看作目的而不是实现他人目的的手段。鉴于女人至今仍过于经常地作为生育者和施爱者成为有价值的来源,而不是凭本身拥有权利,所以自由主义对妇女而言是应当接受的很好的观点。不过激进、差别女权主义和批判种族理论对其所做的批判也都不是无的放失。但事物的发展都是辨证的,必须经过自由主义女权主义对现今法律及法律思想的批判,才能有其他理论对它的批判,这是否定之否定的过程。不过最终法律应该朝向完善男女关系来发展。尽管和谐的男女关系并不是仅靠法律来形成的,法律不能沦为排斥妇女仅调整男人之间关系的工具,女权主义法理学也并非仅是女人为女人鼓与呼的声音。女权主义法理学的出路既不能从平等或差异的两极选择中去寻找,也不能靠彻底打碎法律的平等、中立的价值理想来获得,而只能在法律上男女之间完善的和谐关系中发现。
*吉林大学理论法学研究中心硕士研究生
1转引自 [法]西蒙娜·德·波伏娃:《第二性》, 陶铁柱译 ,中国书籍出版社1997年版,第18页。
2本文中凡引用到翻译文本中的内容,直接在正文中加括号根据英文页码注明出处,不再另行加注。
3《布莱克维尔政治学百科全书》 戴维·米勒等英文版主编,邓正来中文版主编,中国政法大学出版社2002年版第272页。
4 [英]莫里森 《法理学:从古希腊到后现代》,李桂林译,武汉大学出版社2000年版,第515页。
5 [美] 约瑟芬·多诺万:《女权主义的知识分子传统》,赵育春译,江苏人民出版社2003年版,第34页。
6 [美]罗斯玛丽·帕特南·童:《女性主义思潮导论》,艾晓明译,华中师范大学出版社2002年版,第320页。
7 [英] 朱丽叶·米切尔:《妇女:最漫长的革命》,陈小兰等译,生活·读书·新知三联书店1997年版,第9 页。
8 波考克《古典时期以降的公民理想》,吴冠军译。
9 转引自 [法]西蒙娜·德·波伏娃:《第二性》, 陶铁柱译 ,中国书籍出版社1997年版,第4页。


}

2018年7月18日,斯坦福大学生物医学数据科学教授James Zou 和斯坦福大学科学史教授 Londa Schiebinger在英国《自然》评论上撰文,以AI can be sexist and racist — it’s time to make it fair为标题,提出计算机科学家必须弄清偏差的来源,去除训练数据中的偏差,开发出能够应对数据偏差的人工智能算法。

谷歌翻译(Google Translate)在将西班牙语新闻翻译成英语时,通常将提及女人的句子翻译成“他说”或“他写道”。

尼康相机中用来提醒拍照者照片中的人有没有眨眼的软件有时会把亚洲人识别为总在眨眼。

单词嵌入——一个用来处理和分析大量自然语言数据的流行算法——会把欧裔美国人的姓名识别为“正面”词汇,而非裔美国人的姓名识别为“负面”词汇。

▲在有偏差的数据集上训练出的算法通常只能将左边的图片识别为“新娘”。

在这三个例子之外,人们还发现了其他很多人工智能(AI)系统性地歧视特定人群的例证。

决策偏见并不是AI独有的问题。但正如很多研究者所指出的,由于AI的应用范围越来越大,因此解决AI偏见至关重要。考虑到该问题普遍存在,我们需要一种系统性的解决方案。我们在此列举出几种可能的策略。

无论是在学术界还是产业界,计算机科学家都会在训练出更复杂的算法时获得赞誉(从发表论文到媒体报道均是如此)。相对而言,很少有人关注数据是如何收集、处理和归类的。

导致AI产生偏见的一个主要因素是训练数据。大多数机器学习任务都是使用大型、带标注的数据集来训练的。例如,用于图像分类的深度神经网络通常会使用ImageNet进行训练,其中包含了逾1400万张带标签的图片。在自然语言处理领域,标准算法是在包含上亿单词的语料库上训练的。

研究者们通常会利用网站来构建数据集,例如使用特定的单词搜索Google Images或Google News,或是从维基百科等易于访问的信息网站上收集。这些数据集接下来会被标注出来——通常由研究生来做,或是通过Amazon Mechanical Turk这样的众包网站进行。

这种方法会在无意中产生出包含了性别、种族和文化偏见的数据集。

通常来说,会有一些人群被代表过度,而另一些则代表不足。ImageNet推动了计算机视觉研究,但是其中超过45%的数据来源于美国,而美国人只占世界人口的4%。相反,中国和印度加起来只占其中3%的数据量,而两国人口却占了世界人口的36%。

缺乏地理上的多样性可以在一定程度上解释为什么计算机视觉算法会把传统的身着白色婚纱的美国新娘标注为“新娘”、“礼服”、“女人”、“婚礼”,而北印度新娘的照片则会被标注为“表演”和“戏服”。

在医学领域,机器学习的预测特别易受训练数据集中的偏差影响,因为医学数据的生成和标注都相当昂贵。去年,研究者使用深度学习从照片中识别皮肤癌。他们在包含129450张图片的数据集上训练了算法模型,其中60%是从Google Images上搜索而来。但是其中只有5%的图片是深肤色人群,而算法没有在深肤色人群中测试过。因此该算法在不同人群中的表现可能相差极大。

偏见的另一个来源可以归于算法本身。

一个常见的机器学习程序会试图最大化训练数据集的整体预测准确率。如果训练数据集中某类人群的出现频率远多于另一人群,那么程序就会为占比更多的人群进行优化,这样才可以提高整体的准确率。计算机科学家会在“测试”集上评估算法效果,而这些通常也是原始训练数据集的一个随机子集,因此很可能会包含同样的偏见。

有缺陷的算法还会造成恶性循环,使偏见越发严重。举例来说,使用统计方法训练出的系统,例如谷歌翻译,会默认使用男性代词。这是因为英语语料库中男性代词对女性代词的比例为2:1。

更糟糕的是,每次翻译程序默认翻出“他说”,就会提高网络上男性代词的比例——这可能会逆转女性在性别平等上所获得的艰难胜利。事实上,20世纪60年代男性代词对女性代词的比例高达4:1,之后因为大规模的社会变革才降到了目前的水平。

数据集中的偏差常常体现出了制度基础和社会权力关系中更深、更隐蔽的不均衡。例如,维基百科看起来是一个丰富多样的数据源,但是该网站上的人物页面里只有18%是女性。在关于女性的条目中,链接到男性条目的数量远比男性条目链接到女性条目的数量要多,因此搜索引擎里就更容易找到关于男性的条目。女性条目里还包含了更多的伴侣和家人信息。

因此,在构建训练数据集时必须进行技术处理,并将社会因素纳入考虑范围。具体说来,应当采取措施来保证数据集的多元化,不要使特定人群代表不足。也就是说,我们不能局限于方便的分类方式——“女人/男人”,“黑人/白人”等——这些分类方式无法捕捉到性别和种族认同上的复杂性。

一些研究者已经开始这方面的工作了。计算机科学家最近发现,商用的面部识别系统在识别深肤色女性时,错误率达到了35%,而识别浅肤色男性的错误率仅为0.8%。为了解决这一问题,研究者们筛选出了一组新的图片数据集,其中包含了在性别和种族上保持均衡的1270人。用这组数据重新训练已有的面部分类算法并调整参数后,应可以提高其准确率。

为了帮助鉴定偏见的来源,我们推荐标注者使用标准化的元数据,系统性地标注训练数据集的内容。有几个研究组已经在着手设计“数据表”,表中包含了机器学习数据集的元数据和“营养成分标签”。

所有训练数据集均应说明数据是如何收集和标注的。如果数据包含了有关人类的信息,那就应当提供地域、性别、种族和其他人口学信息(见下图“图片的力量”)。如果数据标注是通过众包完成的,那就应当列出众包参与者的基本信息,另外也要列出向众包参与者提出的确切要求或指示。

数据管理者应当尽可能提供与数据相关的描述语的精确定义。例如,在犯罪司法数据里,阐明训练算法模型时所使用的“犯罪”类型可以使该模型的应用范围和解释方式更加明确。

很多期刊已经要求作者为实验数据提供这类信息,作为发表的先决条件。例如,《自然》要求作者将DNA微阵列数据上传至可公开访问的数据库Gene Expression Omnibus,而该数据库则要求作者提交实验方法的元数据。

我们推荐机器学习会议(如国际机器学习大会)的组织者也将标准化的元数据作为论文提交和同行评议的关键组成。OpenML这样的数据库和Kaggle这样的AI竞赛平台也应当如此。

最后,计算机科学家应努力开发能够稳定应对数据中的人类偏见的算法。

目前人们已经在进行各种各样的尝试。其中一种是加入约束条件,本质上说就是调整机器学习模型,让它能够在不同的群体和相似的个体间均有相似的表现。类似的一种尝试是修改学习算法,减少它对种族、性别、收入等敏感特性以及所有与此相关的信息的依赖。

这种新出现的除偏尝试确实有潜力,但是需要在现实场景中进一步调整和评估。

但是,这类解决方案还有一个尚无解法的问题,即种族、性别和其他相关信息必须被准确记录下来。除非数据集中已经包含了适当的分类,否则就很难确定到底应该给模型加入什么样的约束条件,或是做出什么样的修正。这种解决方案还要求算法设计者预先决定好他们想要避免的偏见类型。

一个互补的方法是使用机器学习本身来识别并量化算法和数据中的偏见。这叫做“执行AI审计”,其中“审计员”是一个会系统性监测原始机器学习模型的算法,以便识别模型和训练数据集中的偏见。

例如,我们最近的工作是使用单词嵌入这一流行的机器学习算法来量化美国历史上的刻板印象。单词嵌入会把每个英语单词映射到空间中的一个点(即一个几何向量),向量之间的距离表示单词间语义上的相似性。它可以捕捉到类比关系:例如“男人”对“国王”正如“女人”对“女王”。

我们开发了一个算法——AI审计员——来查询其他性别相关的类比关系。最后发现了“男人”对“医生”正如“女人”对“护士”;或是“男人”对“程序员”正如“女人”对“家庭主妇”的关系。

一旦审计员发现了单词嵌入和原始文本中的刻板印象,就有可能通过修改单词向量的位置来减少偏见。更重要的是,识别出刻板印象的发展趋势之后,在历史文本上训练的算法就可以相应除偏。

例如,我们对Google Books中年每十年一组的美国文章进行了嵌入,由此发现了对亚裔美国人令人震惊的态度转变。1910年,他们被描述为“怪物”和“野蛮人”,到了1990年就变成了“拘谨”和“敏感”——最大的变化发生在二战之后和上世纪80年代的移民潮时期。

当计算机科学家、伦理学家、社会科学家等人努力提高数据和AI的公平性时,我们所有人都应该思考“公平”到底应该指什么。数据是应当表现现有的世界,还是应当表现大多数人所追求的世界?

又比如,用来评估应聘者的AI工具是应当评价应聘者是否有能力,还是应聘者是否能融入工作环境?应该让谁来决定哪种“公平”才是更为优先的?

为了解决这些问题,以及评估训练数据集和算法在更大范围内的影响,机器学习的研究者应当去和社会科学家以及人文、性别、医学、环境和法律领域的专家合作。

现在已有各方在努力促成这类合作,例如我们在斯坦福大学参与的“以人为本的人工智能”项目。这种合作必须从本科生开始。学生在学习算法的时候,就应该在社会大背景下考察AI。

计算机、程序和进程塑造了我们的态度、行为和文化。AI正在改变我们的经济和社会,改变我们交流的方式,改变我们的行政和政治。不平等在我们的社会中积疾已久,不能让AI在不经意间延续甚至恶化这一问题了。

来源:微信公众号“Nature自然科研”

}

我要回帖

更多关于 蓝色皮肤的人 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信