但是,得到这种认可有个前提,就是她们必须保密自己的性别。
做这个研究的是加州州立理工大学和北卡罗来纳州立大学的计算机科学研究人员,他们在GitHub上收集信息,分析了大约400万个用户的行为,并确保这些人都是在去年四月一日才开始注册使用GitHub的用户。
GitHub并不要求用户注明性别信息,不过研究人员采用了一种他们称为“新颖性别关联”(novel gender-linking technique)的技术,识别出了其中超过35%、即约140万人的性别信息,然后将其结合他们提交的约300万个“pull request”的数据来进行分析。
GitHub总部设于旧金山,是一个大型的代码库,全球用户量超过1200万。GitHub上的软件开发者可以协作完成项目,可以检查批评其他人的工作,还可以提出自己的改进意见或解决方案。“pull request”是GitHub上的一个指标,若某人贡献的代码成功其他程序员的项目所采用,这就算一次pull request,并且这个新代码会整合进对方的项目。
研究者发现,女性程序员的代码接受率可以达到78.6%,比男性程序员的74.6%要高。然而,若女程序员对外公开自己的性别,其代码接受率便出现了大幅下降,只剩下62.5%。
研究者们试图解释这种现象,于是检验了其他影响因素,比如说女性对源代码做出的改动是否更小、女性是不是只会在某些特定的代码语言上表现更好。事实上,两个问题的答案都是否定的,女性程序员的代码接受率在各种程度、各种语言上都超过了男性。
研究者进一步排除干扰,看看这些数据是否受到“反向偏见”(reverse bias)的影响,即开发者是否会故意优先采纳女性的代码,以提高行业多样性、鼓励作为弱势群体的女性参与进来。然而,即使是将注明性别信息和未注明相关信息的实验者分开来分析,结果都是一样的。
科技行业的性别歧视早已不是新鲜事。一项2013年调查的数据显示,软件开发者中女性的比例只占11.2%。参与研究的那些学生还有点惊讶,因为结果竟然证明女性编写的代码更受认可。然而,“我们的结果显示,虽然GitHub上的女性总体来说更有竞争力,但针对她们的偏见仍然存在。”
卫报采访了几名GitHub上的女性开发者,结果呈现出了这种性别歧视更复杂的一面。
米切尔(Lorna Jane Mitchell)是一名女性软件开发者,她的工作主要都是在GitHub上完成的。她说,没有办法分辨某个pull request是否真的是由于偏见而被忽略,或者只是因为那个项目的发起者太忙而不小心忽略掉了。她在GitHub上的档案注明了自己的女性身份,她也表示自己不会因为这个研究的结果而做出改变。
“我思考过,我还是觉得在档案里明确指明性别是明智的选择,对我来说,自己的女性身份有着重要意义。”米切尔在邮件里写到。
另一位开发者弗洛姆(Isabel Drost-Fromm)在GitHub上的头像是一个女性卡通人物。她觉得,自己在GitHub上工作时从来没有受过歧视,但她一般会用GitHub来完成的工作都是跟相互熟悉、了解的团队合作的。
布莱恩(Jenny Bryan)是英属哥伦比亚大学的统计学教授,她用GitHub来帮助自己教书,也会用一种叫R的编程语言来进行开发。她也在档案里写明了自己的性别,而且她不认为自己曾经因为性别而受到过区别对待。
“我最多这么说,不认识我的男性有时会跟我解释一些事情,事实上我懂的比他们还多,”她写到,“但是我在R社区里有过交流的男性都了解我,如果说我的性别带来了什么影响的话,那就是他们其实会努力支持我的工作,一起学习并给社区做贡献。”