《因果论 (原书第2版)》[美] Judea Pearl | PDF下载|ePub下载
类别: 科技
作者:
[美] Judea Pearl
出版社: 机械工业出版社
副标题: 模型、推理和推断
原作名: Causality: Models, Reasoning and Inference
译者: 刘礼 / 杨矫云 / 廖军 / 李廉
出版年: 2022-4
页数: 534
装帧: 平装
丛书: 智能科学与技术丛书
ISBN: 9787111701392
出版社: 机械工业出版社
副标题: 模型、推理和推断
原作名: Causality: Models, Reasoning and Inference
译者: 刘礼 / 杨矫云 / 廖军 / 李廉
出版年: 2022-4
页数: 534
装帧: 平装
丛书: 智能科学与技术丛书
ISBN: 9787111701392
内容简介 · · · · · ·
本书第1版曾获2001年拉卡托斯奖,作者朱迪亚·珀尔是2011年图灵奖得主。本书的出版将有利于中国的广大学者、学生和各领域研究人员了解和掌握因果模型、推理和推断相关的内容,在相关领域做出优异的成果。
本书全面阐述了现代因果关系分析,展示了因果关系如何从一个模糊的概念发展成为一套数学理论,并广泛用于统计学、人工智能、经济学、哲学、认知科学、卫生科学和社会学等领域。本书提出了一个全面的因果关系理论,它统一了因果关系的概率、操作、反事实和结构方法,并提供了简单的数学工具来研究因果关系和统计关联之间的关系。本书通过融合领域知识、常识约束、文化传承的概念等来补充数据信息,为基于统计的机器学习中遇到的基本问题提供了科学的解决方案。
作者简介 · · · · · ·
朱迪亚·珀尔(Judea Pearl) 美国国家科学院院士,美国国家工程院院士,美国人工智能协会创始会士,加州大学洛杉矶分校计算机科学和统计学教授,IEEE智能系统名人堂第一批十位入选者之一,被誉为“贝叶斯网络之父”。2011年,Pearl因其在人工智能领域的基础性贡献荣获图灵奖。他提出的概率和因果性推理演算法,彻底改变了人工智能最初基于规则和逻辑的方向。Pearl曾获多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。
目录 · · · · · ·
中文版序
推荐者序
译者序
我为什么写这本书:回顾与期望
第2版前言
第1版前言
第1章 概率、图及因果模型1
1.1 概率论概述1
1.1.1 为什么学习概率1
1.1.2 概率论的基本概念2
1.1.3 预测支持与诊断支持结合7
1.1.4 随机变量与期望8
1.1.5 条件独立与图11
1.2 图与概率12
1.2.1 图的符号与术语12
1.2.2 贝叶斯网络13
1.2.3 d-分离准则17
1.2.4 贝叶斯网络推断20
1.3 因果贝叶斯网络22
1.3.1 用于干预谕言的因果网络23
1.3.2 因果关系及其稳定性25
1.4 函数因果模型27
1.4.1 结构方程28
1.4.2 因果模型中的概率预测31
1.4.3 函数模型中的干预与因果效应33
1.4.4 函数模型中的反事实34
1.5 因果与统计术语40
第2章 因果关系推断理论43
2.1 简介:基本直觉44
2.2 因果发现框架46
2.3 模型偏好(奥卡姆剃刀原则)47
2.4 稳定分布51
2.5 获取DAG结构52
2.6 重建潜在结构54
2.7 因果关系推断的局部准则57
2.8 非时间因果与统计时间61
2.9 结论63
2.9.1 关于极小性、马尔可夫性和稳定性64
第3章 因果图与因果效应识别69
3.1 简介70
3.2 马尔可夫模型中的干预72
3.2.1 作为干预模型的图72
3.2.2 干预作为变量75
3.2.3 计算干预效应76
3.2.4 因果量值的识别81
3.3 控制混杂偏差83
3.3.1 后门准则83
3.3.2 前门准则86
3.3.3 实例:吸烟与基因型理论88
3.4 干预的计算90
3.4.1 符号预备90
3.4.2 推断规则90
3.4.3 因果效应的符号推导:一个实例92
3.4.4 基于替代试验的因果推断94
3.5 可识别性的图模型检验95
3.5.1 识别模型97
3.5.2 非识别模型99
3.6 讨论100
3.6.1 要求与扩展100
3.6.2 图作为一种数学语言102
3.6.3 从图转换到潜在结果104
3.6.4 与Robins的G-估计的关系108
第4章 行动、计划和直接效应114
4.1 简介115
4.1.1 行动、动作和概率115
4.1.2 决策分析中的行动118
4.1.3 行动和反事实120
4.2 条件行动与随机策略121
4.3 什么时候行动的结果是可识别的122
4.3.1 基于图的识别条件122
4.3.2 识别效率124
4.3.3 对控制问题解析解的推导126
4.3.4 总结126
4.4 动态计划的可识别性127
4.4.1 动机127
4.4.2 识别计划:符号和假设129
4.4.3 识别计划:序贯后门准则130
4.4.4 识别计划:计算流程133
4.5 直接效应和间接效应136
4.5.1 直接效应与总效应136
4.5.2 直接效应、定义和识别137
4.5.3 案例:大学录取中的性别歧视问题138
4.5.4 自然直接效应141
4.5.5 间接效应与中介公式142
第5章 社会学和经济学中的因果关系与结构模型144
5.1 简介145
5.1.1 寻找因果语言145
5.1.2 SEM:它的意义怎么变模糊了146
5.1.3 图作为一种数学语言150
5.2 图与模型检验151
5.2.1 结构模型的可检验性含义152
5.2.2 检验可检验性156
5.2.3 模型等价性157
5.3 图与可识别性161
5.3.1 线性模型中的参数识别161
5.3.2 与非参数识别的比较167
5.3.3 因果效应:SEM的干预解释169
5.4 部分概念基础172
5.4.1 结构参数真实意味着什么172
5.4.2 效应分解的解释177
5.4.3 外生性、超外生性及其他话题178
5.5 结论183
5.6 第2版附言184
5.6.1 计量经济学的觉醒184
5.6.2 线性模型的识别问题185
5.6.3 因果论断的鲁棒性185
第6章 辛普森悖论、混杂与可压缩性187
6.1 剖析辛普森悖论188
6.1.1 一个有关悖论的示例188
6.1.2 统计学中苦恼的事情190
6.1.3 因果关系与可交换性192
6.1.4 悖论已解决(或者,人是什么类型的机器)195
6.2 为什么没有关于混杂的统计检验,为什么许多人认为应该有,为什么他们是正确的197
6.2.1 简介197
6.2.2 因果定义和关联定义199
6.3 关联性准则如何失效200
6.3.1 凭借边缘化使充分性失效200
6.3.2 凭借封闭世界假定使充分性失效201
6.3.3 凭借无益代理使必要性失效201
6.3.4 凭借偶然抵消使必要性失效203
6.4 稳定无偏与偶然无偏204
6.4.1 动机204
6.4.2 形式化定义206
6.4.3 稳定无混杂的运算检验207
6.5 混杂、可压缩性和可交换性208
6.5.1 混杂与可压缩性208
6.5.2 混杂与混杂因子210
6.5.3 可交换性与混杂结构分析212
6.6 结论215
第7章 结构化反事实的逻辑217
7.1 结构模型语义学218
7.1.1 定义:因果模型、行动与反事实219
7.1.2 评估反事实:确定性分析223
7.1.3 评估反事实:概率分析228
7.1.4 孪生网络法230
7.2 结构模型的应用与解释231
7.2.1 线性经济计量模型政策分析:示例231
7.2.2 反事实的实证性内容 234
7.2.3 因果解释、表达及其理解238
7.2.4 从机制到行动再到因果240
7.2.5 Simon因果顺序243
7.3 公理刻画246
7.3.1 结构反事实的公理246
7.3.2 反事实逻辑中的因果效应:示例249
7.3.3 因果相关性公理252
7.4 基于结构化和相似性的反事实256
7.4.1 与Lewis反事实的关系256
7.4.2 公理系统的比较258
7.4.3 成像与条件260
7.4.4 与Neyman-Rubin框架的关系262
7.4.5 外生性和工具变量:反事实定义和图模型定义264
7.5 结构因果与概率因果267
7.5.1 对时序的依赖性268
7.5.2 死循环风险269
7.5.3 与孩子们一起挑战封闭世界假定271
7.5.4 特例因果与一般因果272
7.5.5 总结275
第8章 不完美实验:边界效应和反事实277
8.1 简介278
8.1.1 不完美与间接实验278
8.1.2 不依从性与治疗意愿279
8.2 利用工具变量界定因果效应的范围280
8.2.1 问题的形式化表述:约束优化280
8.2.2 正则划分:有限响应变量的演化282
8.2.3 线性规划公式284
8.2.4 自然边界286
8.2.5 对于处理(治疗)者的处理效应(ETT)287
8.2.6 示例:消胆胺的作用288
8.3 反事实和法律责任289
8.4 工具变量测试291
8.5 解决不依从性的一种贝叶斯方法293
8.5.1 贝叶斯方法和吉布斯采样293
8.5.2 样本量和先验分布的效应295
8.5.3 从不完全依从的临床数据中估计因果效应296
8.5.4 特例事件因果关系的贝叶斯估计298
8.6 结论299
第9章 因果关系概率:解释和识别300
9.1 简介301
9.2 充分必要原因:识别条件303
9.2.1 定义、符号和基本关系303
9.2.2 外生性下的界限与基本关系306
9.2.3 单调性和外生性下的可识别性309
9.2.4 单调性和非外生性下的可识别性311
9.3 实例与应用314
9.3.1 实例1:公平硬币下注314
9.3.2 实例2:刑法执行316
9.3.3 实例3:辐射对白血病的影响317
9.3.4 实例4:来自实验数据和非实验数据的法律责任320
9.3.5 结果总结321
9.4 非单调模型的可识别性322
9.5 结论325
第10章 实际原因327
10.1 引言:必要因果关系的不充分性328
10.1.1 重新探讨特例原因 328
10.1.2 抢占和结构信息的作用329
10.1.3 过度确定和准依赖性331
10.1.4 Mackie的INUS条件332
10.2 产生、依赖和维持334
10.3 因果束和基于维持的因果关系337
10.3.1 因果束:定义及其含义337
10.3.2 实例:从析取式到通用公式340
10.3.3 束、抢占以及特例事件因果关系的概率342
10.3.4 路径切换因果关系344
10.3.5 时序抢占345
10.4 结论347
第11章 对读者的回应、阐述和讨论351
11.1 因果、统计和图的术语351
11.1.1 区分因果和统计是必要的吗351
11.1.2 无须担心的d-分离(第1章)355
11.2 逆转统计时间(第2章)358
11.3 估计因果效应359
11.3.1 后门准则背后的直观理解(第3章)359
11.3.2 揭开神秘的“强可忽略性”362
11.3.3 后门准则的另一种证明365
11.3.4 协变量选择中的数据与知识368
11.3.5 理解倾向得分370
11.3.6 do-算子背后的直观性374
11.3.7 G-估计的有效性374
11.4 策略评估与do-操作376
11.4.1 识别附条件计划(4.2节)376
11.4.2 间接效应的意义378
11.4.3 do(x)能够表示实际实验吗380
11.4.4 do(x)操作是通用的吗381
11.4.5 没有操纵的因果关系384
11.4.6 与Cartwright一起追猎原因385
11.4.7 非模块化的错觉387
11.5 线性结构模型中的因果分析389
11.5.1 参数识别的一般准则(第5章)389
11.5.2 结构系数的因果解释390
11.5.3 为SEM(或者SEM救生包)的因果解释辩护392
11.5.4 今天的经济学模型在哪里—与Heckman一起追求原因398
11.5.5 外部变化与外科手术401
11.6 决策与混杂(第6章)405
11.6.1 辛普森悖论与决策树405
11.6.2 时间信息对于决策树是充分的吗407
11.6.3 Lindley关于因果性、决策树和贝叶斯主义的理解409
11.6.4 为什么混杂不是一个统计学概念412
11.7 反事实的演算414
11.7.1 线性系统中的反事实414
11.7.2 反事实的意义417
11.7.3 反事实的d-分离420
11.8 工具变量与不依从性421
11.9 更多关于因果关系的概率422
11.9.1 “有罪的概率为1”有可能吗422
11.9.2 收紧因果关系的概率界限424
后记:因果的艺术与科学427
参考文献462
索引488
· · · · · ·
推荐者序
译者序
我为什么写这本书:回顾与期望
第2版前言
第1版前言
第1章 概率、图及因果模型1
1.1 概率论概述1
1.1.1 为什么学习概率1
1.1.2 概率论的基本概念2
1.1.3 预测支持与诊断支持结合7
1.1.4 随机变量与期望8
1.1.5 条件独立与图11
1.2 图与概率12
1.2.1 图的符号与术语12
1.2.2 贝叶斯网络13
1.2.3 d-分离准则17
1.2.4 贝叶斯网络推断20
1.3 因果贝叶斯网络22
1.3.1 用于干预谕言的因果网络23
1.3.2 因果关系及其稳定性25
1.4 函数因果模型27
1.4.1 结构方程28
1.4.2 因果模型中的概率预测31
1.4.3 函数模型中的干预与因果效应33
1.4.4 函数模型中的反事实34
1.5 因果与统计术语40
第2章 因果关系推断理论43
2.1 简介:基本直觉44
2.2 因果发现框架46
2.3 模型偏好(奥卡姆剃刀原则)47
2.4 稳定分布51
2.5 获取DAG结构52
2.6 重建潜在结构54
2.7 因果关系推断的局部准则57
2.8 非时间因果与统计时间61
2.9 结论63
2.9.1 关于极小性、马尔可夫性和稳定性64
第3章 因果图与因果效应识别69
3.1 简介70
3.2 马尔可夫模型中的干预72
3.2.1 作为干预模型的图72
3.2.2 干预作为变量75
3.2.3 计算干预效应76
3.2.4 因果量值的识别81
3.3 控制混杂偏差83
3.3.1 后门准则83
3.3.2 前门准则86
3.3.3 实例:吸烟与基因型理论88
3.4 干预的计算90
3.4.1 符号预备90
3.4.2 推断规则90
3.4.3 因果效应的符号推导:一个实例92
3.4.4 基于替代试验的因果推断94
3.5 可识别性的图模型检验95
3.5.1 识别模型97
3.5.2 非识别模型99
3.6 讨论100
3.6.1 要求与扩展100
3.6.2 图作为一种数学语言102
3.6.3 从图转换到潜在结果104
3.6.4 与Robins的G-估计的关系108
第4章 行动、计划和直接效应114
4.1 简介115
4.1.1 行动、动作和概率115
4.1.2 决策分析中的行动118
4.1.3 行动和反事实120
4.2 条件行动与随机策略121
4.3 什么时候行动的结果是可识别的122
4.3.1 基于图的识别条件122
4.3.2 识别效率124
4.3.3 对控制问题解析解的推导126
4.3.4 总结126
4.4 动态计划的可识别性127
4.4.1 动机127
4.4.2 识别计划:符号和假设129
4.4.3 识别计划:序贯后门准则130
4.4.4 识别计划:计算流程133
4.5 直接效应和间接效应136
4.5.1 直接效应与总效应136
4.5.2 直接效应、定义和识别137
4.5.3 案例:大学录取中的性别歧视问题138
4.5.4 自然直接效应141
4.5.5 间接效应与中介公式142
第5章 社会学和经济学中的因果关系与结构模型144
5.1 简介145
5.1.1 寻找因果语言145
5.1.2 SEM:它的意义怎么变模糊了146
5.1.3 图作为一种数学语言150
5.2 图与模型检验151
5.2.1 结构模型的可检验性含义152
5.2.2 检验可检验性156
5.2.3 模型等价性157
5.3 图与可识别性161
5.3.1 线性模型中的参数识别161
5.3.2 与非参数识别的比较167
5.3.3 因果效应:SEM的干预解释169
5.4 部分概念基础172
5.4.1 结构参数真实意味着什么172
5.4.2 效应分解的解释177
5.4.3 外生性、超外生性及其他话题178
5.5 结论183
5.6 第2版附言184
5.6.1 计量经济学的觉醒184
5.6.2 线性模型的识别问题185
5.6.3 因果论断的鲁棒性185
第6章 辛普森悖论、混杂与可压缩性187
6.1 剖析辛普森悖论188
6.1.1 一个有关悖论的示例188
6.1.2 统计学中苦恼的事情190
6.1.3 因果关系与可交换性192
6.1.4 悖论已解决(或者,人是什么类型的机器)195
6.2 为什么没有关于混杂的统计检验,为什么许多人认为应该有,为什么他们是正确的197
6.2.1 简介197
6.2.2 因果定义和关联定义199
6.3 关联性准则如何失效200
6.3.1 凭借边缘化使充分性失效200
6.3.2 凭借封闭世界假定使充分性失效201
6.3.3 凭借无益代理使必要性失效201
6.3.4 凭借偶然抵消使必要性失效203
6.4 稳定无偏与偶然无偏204
6.4.1 动机204
6.4.2 形式化定义206
6.4.3 稳定无混杂的运算检验207
6.5 混杂、可压缩性和可交换性208
6.5.1 混杂与可压缩性208
6.5.2 混杂与混杂因子210
6.5.3 可交换性与混杂结构分析212
6.6 结论215
第7章 结构化反事实的逻辑217
7.1 结构模型语义学218
7.1.1 定义:因果模型、行动与反事实219
7.1.2 评估反事实:确定性分析223
7.1.3 评估反事实:概率分析228
7.1.4 孪生网络法230
7.2 结构模型的应用与解释231
7.2.1 线性经济计量模型政策分析:示例231
7.2.2 反事实的实证性内容 234
7.2.3 因果解释、表达及其理解238
7.2.4 从机制到行动再到因果240
7.2.5 Simon因果顺序243
7.3 公理刻画246
7.3.1 结构反事实的公理246
7.3.2 反事实逻辑中的因果效应:示例249
7.3.3 因果相关性公理252
7.4 基于结构化和相似性的反事实256
7.4.1 与Lewis反事实的关系256
7.4.2 公理系统的比较258
7.4.3 成像与条件260
7.4.4 与Neyman-Rubin框架的关系262
7.4.5 外生性和工具变量:反事实定义和图模型定义264
7.5 结构因果与概率因果267
7.5.1 对时序的依赖性268
7.5.2 死循环风险269
7.5.3 与孩子们一起挑战封闭世界假定271
7.5.4 特例因果与一般因果272
7.5.5 总结275
第8章 不完美实验:边界效应和反事实277
8.1 简介278
8.1.1 不完美与间接实验278
8.1.2 不依从性与治疗意愿279
8.2 利用工具变量界定因果效应的范围280
8.2.1 问题的形式化表述:约束优化280
8.2.2 正则划分:有限响应变量的演化282
8.2.3 线性规划公式284
8.2.4 自然边界286
8.2.5 对于处理(治疗)者的处理效应(ETT)287
8.2.6 示例:消胆胺的作用288
8.3 反事实和法律责任289
8.4 工具变量测试291
8.5 解决不依从性的一种贝叶斯方法293
8.5.1 贝叶斯方法和吉布斯采样293
8.5.2 样本量和先验分布的效应295
8.5.3 从不完全依从的临床数据中估计因果效应296
8.5.4 特例事件因果关系的贝叶斯估计298
8.6 结论299
第9章 因果关系概率:解释和识别300
9.1 简介301
9.2 充分必要原因:识别条件303
9.2.1 定义、符号和基本关系303
9.2.2 外生性下的界限与基本关系306
9.2.3 单调性和外生性下的可识别性309
9.2.4 单调性和非外生性下的可识别性311
9.3 实例与应用314
9.3.1 实例1:公平硬币下注314
9.3.2 实例2:刑法执行316
9.3.3 实例3:辐射对白血病的影响317
9.3.4 实例4:来自实验数据和非实验数据的法律责任320
9.3.5 结果总结321
9.4 非单调模型的可识别性322
9.5 结论325
第10章 实际原因327
10.1 引言:必要因果关系的不充分性328
10.1.1 重新探讨特例原因 328
10.1.2 抢占和结构信息的作用329
10.1.3 过度确定和准依赖性331
10.1.4 Mackie的INUS条件332
10.2 产生、依赖和维持334
10.3 因果束和基于维持的因果关系337
10.3.1 因果束:定义及其含义337
10.3.2 实例:从析取式到通用公式340
10.3.3 束、抢占以及特例事件因果关系的概率342
10.3.4 路径切换因果关系344
10.3.5 时序抢占345
10.4 结论347
第11章 对读者的回应、阐述和讨论351
11.1 因果、统计和图的术语351
11.1.1 区分因果和统计是必要的吗351
11.1.2 无须担心的d-分离(第1章)355
11.2 逆转统计时间(第2章)358
11.3 估计因果效应359
11.3.1 后门准则背后的直观理解(第3章)359
11.3.2 揭开神秘的“强可忽略性”362
11.3.3 后门准则的另一种证明365
11.3.4 协变量选择中的数据与知识368
11.3.5 理解倾向得分370
11.3.6 do-算子背后的直观性374
11.3.7 G-估计的有效性374
11.4 策略评估与do-操作376
11.4.1 识别附条件计划(4.2节)376
11.4.2 间接效应的意义378
11.4.3 do(x)能够表示实际实验吗380
11.4.4 do(x)操作是通用的吗381
11.4.5 没有操纵的因果关系384
11.4.6 与Cartwright一起追猎原因385
11.4.7 非模块化的错觉387
11.5 线性结构模型中的因果分析389
11.5.1 参数识别的一般准则(第5章)389
11.5.2 结构系数的因果解释390
11.5.3 为SEM(或者SEM救生包)的因果解释辩护392
11.5.4 今天的经济学模型在哪里—与Heckman一起追求原因398
11.5.5 外部变化与外科手术401
11.6 决策与混杂(第6章)405
11.6.1 辛普森悖论与决策树405
11.6.2 时间信息对于决策树是充分的吗407
11.6.3 Lindley关于因果性、决策树和贝叶斯主义的理解409
11.6.4 为什么混杂不是一个统计学概念412
11.7 反事实的演算414
11.7.1 线性系统中的反事实414
11.7.2 反事实的意义417
11.7.3 反事实的d-分离420
11.8 工具变量与不依从性421
11.9 更多关于因果关系的概率422
11.9.1 “有罪的概率为1”有可能吗422
11.9.2 收紧因果关系的概率界限424
后记:因果的艺术与科学427
参考文献462
索引488
· · · · · ·
发表回复
要发表评论,您必须先登录。