标题
机器学习放不下的偏见,我们可以(吗?)
从机器学习看人为什么放不下偏见
从机器学习看人怎么放下偏见
向AI学习如何放下偏见
AI都放不下的偏见,我们可以(吗?)
机器学习都放不下的偏见,我们可以(吗?)
大脑也有「偏差-方差权衡」?
描述
为什么我们、乃至连人工智能都摆脱不了刻板印象?
从大脑的演化到神经网络的偏差-方差权衡,我想探讨下偏见的必要性与可塑性
你会发现:偏见是是信息压缩时的一种代价——但也正因为如此,我们才有能力去反思和优化它
本视频为频道首作,感谢收看与支持!
参考
- 果蝇气味记忆力实验:Tully, T., & Quinn, W.G. (1985). Classical conditioning and retention in normal and mutant Drosophila melanogaster. J. Comp. Physiol. A.
- 刻板印象让人决策更快、更有自信,但往往牺牲了客观准确率:Sherman et al. (1998)
- 在有负荷时,人们更容易使用偏见处理信息:Macrae, Milne, & Bodenhausen (1994)
- 关于遗忘在归纳和学习能力中的作用:Ridley, M. (1999). Genome
引用
- 果蝇实验图片来源:Modelling Learning and Memory in Drosophila to Understand Intellectual Disabilities - Scientific Figure on ResearchGate
- 偏差-方差权衡图片来源:Deshpande, A. (2017, May 4). Understanding the bias-variance tradeoff
- LIME图片来源:C3. Ai Glossary — “LIME (Local Interpretable Model-Agnostic Explanations)”
- SHAP图片来源:Towards Data Science — “Using SHAP Values to Explain How Your Machine Learning Model Works”
- 直立人图片来源:Science Photo Library – Tribe of Homo erectus making weapons
- 封面背景图:Photo by Jr Korpa on Unsplash
- 背景音乐:‘Felicity’ by Scott Buckley; Ashot Danielyan from Pixabay
0:00 从AI聊到人脑
0:13 零偏见会怎样?
1:24 偏差 vs 方差
2:36 人脑偏见的本质
3:19 如何减少偏见
5:12 偏见之外的可能性
脚本
今天我想从AI和神经网络的角度
聊聊人脑的“偏见”——这个我们再熟悉不过的东西
想象一下,所谓刻板印象的另一个极端会是什么样的:如果你能把所有见过的细节、每个人不同的特点都记得一清二楚,会发生什么?
听起来就不会有刻板印象了,对吧?
可惜,你也失去了归纳能力
上个世纪俄罗斯,有一个叫舍雷舍夫斯基的人,他有过目不忘的记忆力,能背到圆周率一千位
结果呢?
在他的传记《记忆大师的心灵》中提到,他往往因为被过于琐碎、具体的记忆淹没,而无法提炼主旨、概括规律
这说明被太多细节挡住了视线,反而看不见整体
甚至,连苍蝇都逃不过这个道理
神经科学家 Tim Tully 在 90 年代做过一个实验:通过电击果蝇训练他们学会建立条件反射,躲避某种气味
而他基因改造果蝇,造出“超级记忆果蝇”:仅被电击一次就能学会条件反射躲避某种气味
听起好像是更聪明了?
但它们因为太快记住了单一样本,类似但不同的气味也会引起错误警报,反而失去精准性
所以带着这个视角,再去看为什么我们、甚至连我们的机器都会有偏见?
原因就在于:
偏见和刻板印象,是我们在理解复杂世界时,势必会要走的一条捷径
这里引入机器学习的一个概念:偏差与方差的权衡
偏差bias:就是用总体的规律来概括,忽视了个体差异(总体规律 > 个体差异)
方差variance:则是对个体差异过于敏感,失去了对总体规律的把握(个体差异 > 总体规律)
就像这张图里,当我们试图用一条曲线来表示数据点之间的规律时
如果你让它记住太多训练数据的细节,机器学习里我们会叫他过拟合
就好像把模拟考试的答案死记硬背,能考满分,但是实际考试题目稍微有一些变换就不会了
过拟合就像拥有超级记忆的人或果蝇一样,容易受到干扰,看不出更大的规律
但如果只是用一条直线粗糙地概括全部,那就会欠拟合
抓不住那些真实存在的变化
所以一个理想的模型,是既低偏差、又低方差
既能看见整体趋势,又能合理分辨个体差异
所以,你看——
刻板印象就像是大脑里的偏差
我们和AI在本质上都属是在做简化复杂世界这件事,而细节的丢失是信息压缩难免的结果
就像Kahneman的Thinking, Fast and Slow所说的一样
大脑天生要节省算力,会用最省力、快速的捷径,而不是慢速、理性推理
生存环境演变也同样有影响
当我们祖先处在人数不多的族群环境中,需要快速识别外敌和危险
虽然现在这个高度复杂、融合、有几乎无限多样性的社会中已经不适用
但我们的脑子还没跟上,遗留下的倾向就是更以偏概全的
那么如果说,偏见是想要理解世界必然的过程之一,难道我们就对它束手无策了吗?
也不必这么悲观
我们还可以向机器学习
学习怎样减轻刻板印象
在训练模型的时候,我们会用可解释性工具(比如LIME和SHAP)来理解AI为什么会做出某个判断
LIME 的思路是放大某一个样本的“局部”,在这个点附近建立一个简单模型,从而分析复杂模型在这一点上是如何做出决策的
而 SHAP 则是从“全局”角度出发,衡量不同因素对最终结果的贡献大小,帮我们拆解每一个因素在模型判断中的权重
所以对应地应用在生活里
采用局部、也就是LIME 的思路时:
可以试着问自己——如果对方的国籍、年龄、肤色或性别不同,我还会做出同样的判断吗?换一个局部特点,我的态度会不会随之改变?
采用全局、也就是SHAP 的思路时:
则是问自己——我为什么会这样判断?
是因为对方的内在特质,还是外在表现?
有哪些是我根据实际观察形成的看法,又有哪些是早就内化的先入为主的印象?
察觉到了自己的思考模式后
试着去挑战自己的第一反应
然后还可以刻意寻找反例
比如,你想到rapper,脑海是不是马上浮现一个浮夸、暴躁的人
但如果你看过一些节目,会发现现实中有很多反例
比如很多rapper实际上他们在歌词里探讨社会议题、抒发脆弱情绪,在采访里逻辑清晰
下次你就刻意想象反例
用这种方法,重新训练自己的大脑
机器为了减少偏见,会重采样、加权
人类也可以通过多接触不同的人群、从不同渠道获取信息,扩大自己的“样本多样性”,来一定程度打破局限
当我们已经认识到认知的倾向和局限
也已经有了很多发明
去辅助各种繁琐的工作
我们自己是不是可以试着承担更多慢而精确的判断?
况且如果连神经网络都需要我们小心监督、不断迭代
那是否说我们自己的大脑,也许同样值得被反复审视和优化?
偏见,或许永远都在
但至少,我们可以尽量,不让它定义我们与他人的可能性
谢谢大家看到这里
这是我这个频道的第一个视频
如果觉得有意思的话,谢谢你的支持
有什么想法也可以留个评论
今天就先到这儿
我们下次见