因果推断并不特殊:为什么它只是另一个预测问题-计算机科学-建模.pdfVIP

因果推断并不特殊:为什么它只是另一个预测问题-计算机科学-建模.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

因果推断并不特殊:为什么它只是另一个预测问题

CARLOSFERNÁNDEZ-LORÍA,HongKongUniversityofScienceandTechnology,Hong

Kong

因果推断通常被认为与预测建模根本不同。它引入了新的术语、新的估计量,以及看似完全不

同的目标:不是预测将会发生会发生什么,而是预测在替代方案下将会会发生什么。这种反事

实框架——尽管至关重要——已经让因果推断获得了方法论上奇特和哲学上复杂难解的声誉。

然而,从建模的角度来看,差异并没有看起来那么大。在这两种情况下,我们都是从源域

中抽取的有标签数据开始——即那些已知结果的观测值——并寻求推广到目标域,在那里结果

本是未知的。在预测中,目标可能是未来的行为。在因果推断中,它可能是未接受某种治疗条件

译下的结果。在这两种情况下的目标都是一样的:估计我们没有观察到的结果。

中而在两种情况下,解决方案都建立在同一个基础上:需要假设来证明一般化。一旦这个共

同结构变得清晰,因果推断就不再被视为一个根本不同的问题类别。它变成了它的本质:一种

3结构化的预测形式。

v

0这一视角并不低估因果推断的复杂性。它是特殊——预测的一种特殊情况。为此,我们受

2

3益于特殊工具:因果图、潜在结果、识别策略[2,3]。这些工具利用问题结构来澄清何时泛化

4是合理的。实际上,正是这种从观察到的处理-结果配对到反事实的有效性允许我们将统计估

0

4.计解释为因果关系。然而,在方法论差异之下隐藏着与预测建模相同的挑战核心:我们如何从

0一个领域中的观测结果转移到另一个领域的未观测结果?

5

2

:1预测与泛化:通常的游戏

v

i在监督学习中,我们通过将模型拟合到标记数据上来构建模型——即输入和输出都被观察到的

x

r情况。然而,最终目标并不是在这些训练数据上表现良好,而是泛化到新的、未见过的数据,

a

在这些新数据中,结果是未知的。这可能涉及到对未来事件的预测,但更广泛地说,这意味着

利用从过去观测中学到的模式来估计我们之前未曾见过的情况下的结果。无论是预测下个月的

销售额还是判断一笔交易是否欺诈,我们在做的事情是一样的:使用在已知结果上训练好的模

型来推断未知的结果。

从训练领域到部署领域的飞跃总是依赖于一个关键假设:即从标记案例中学习到的关系在

未标记的案例中也同样成立。这个假设很少能得到保证。输入与结果之间的关系往往会在训练

环境和模型应用的真实世界环境中发生变化。无论是由于时间、地理位置、行为还是其他情境

Author’sContactInformation:CarlosFernández-Loría,imcarlos@ust.hk,HongKongUniversityofScienceandTechnology,ClearWaterBay,

NewTerritories,HongKong.

1

2Fernández-Loría

变化引起的转变,这种情况都是真实的。即使是在训练数据上具有完美准确性的模型,如果部

署条件在细微但重要的方面有所不同,也可能完全失败。

尽管存在这种脆弱性,预测仍然有用,因为我们通常有充分的理由相信泛化是可能的。在

某些情况下,我们假设输入和输出之间的关系足够稳定,使模型能够进行迁移。在其他情况

下,我们采取措施来校正源域和目标域之间的差异——通过重新加权、领域适应或纳入领域知

识[5]。但逻辑是相同的:我们在一个域中学习模式,并根据关于泛化的假设将其应用到另一

个域中。

2进入因果推理:相同游戏,不同标签

因果推断通常围绕潜在结果展开:个体在接受治疗()和不接受治疗()情况下会产生的1

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档