- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
因果推断并不特殊:为什么它只是另一个预测问题
CARLOSFERNÁNDEZ-LORÍA,HongKongUniversityofScienceandTechnology,Hong
Kong
因果推断通常被认为与预测建模根本不同。它引入了新的术语、新的估计量,以及看似完全不
同的目标:不是预测将会发生会发生什么,而是预测在替代方案下将会会发生什么。这种反事
实框架——尽管至关重要——已经让因果推断获得了方法论上奇特和哲学上复杂难解的声誉。
然而,从建模的角度来看,差异并没有看起来那么大。在这两种情况下,我们都是从源域
中抽取的有标签数据开始——即那些已知结果的观测值——并寻求推广到目标域,在那里结果
本是未知的。在预测中,目标可能是未来的行为。在因果推断中,它可能是未接受某种治疗条件
译下的结果。在这两种情况下的目标都是一样的:估计我们没有观察到的结果。
中而在两种情况下,解决方案都建立在同一个基础上:需要假设来证明一般化。一旦这个共
同结构变得清晰,因果推断就不再被视为一个根本不同的问题类别。它变成了它的本质:一种
3结构化的预测形式。
v
0这一视角并不低估因果推断的复杂性。它是特殊——预测的一种特殊情况。为此,我们受
2
3益于特殊工具:因果图、潜在结果、识别策略[2,3]。这些工具利用问题结构来澄清何时泛化
4是合理的。实际上,正是这种从观察到的处理-结果配对到反事实的有效性允许我们将统计估
0
4.计解释为因果关系。然而,在方法论差异之下隐藏着与预测建模相同的挑战核心:我们如何从
0一个领域中的观测结果转移到另一个领域的未观测结果?
5
2
:1预测与泛化:通常的游戏
v
i在监督学习中,我们通过将模型拟合到标记数据上来构建模型——即输入和输出都被观察到的
x
r情况。然而,最终目标并不是在这些训练数据上表现良好,而是泛化到新的、未见过的数据,
a
在这些新数据中,结果是未知的。这可能涉及到对未来事件的预测,但更广泛地说,这意味着
利用从过去观测中学到的模式来估计我们之前未曾见过的情况下的结果。无论是预测下个月的
销售额还是判断一笔交易是否欺诈,我们在做的事情是一样的:使用在已知结果上训练好的模
型来推断未知的结果。
从训练领域到部署领域的飞跃总是依赖于一个关键假设:即从标记案例中学习到的关系在
未标记的案例中也同样成立。这个假设很少能得到保证。输入与结果之间的关系往往会在训练
环境和模型应用的真实世界环境中发生变化。无论是由于时间、地理位置、行为还是其他情境
Author’sContactInformation:CarlosFernández-Loría,imcarlos@ust.hk,HongKongUniversityofScienceandTechnology,ClearWaterBay,
NewTerritories,HongKong.
1
2Fernández-Loría
变化引起的转变,这种情况都是真实的。即使是在训练数据上具有完美准确性的模型,如果部
署条件在细微但重要的方面有所不同,也可能完全失败。
尽管存在这种脆弱性,预测仍然有用,因为我们通常有充分的理由相信泛化是可能的。在
某些情况下,我们假设输入和输出之间的关系足够稳定,使模型能够进行迁移。在其他情况
下,我们采取措施来校正源域和目标域之间的差异——通过重新加权、领域适应或纳入领域知
识[5]。但逻辑是相同的:我们在一个域中学习模式,并根据关于泛化的假设将其应用到另一
个域中。
2进入因果推理:相同游戏,不同标签
因果推断通常围绕潜在结果展开:个体在接受治疗()和不接受治疗()情况下会产生的1
您可能关注的文档
- 医疗格兰纳: 基于大语言模型生成的医学指导以支持医生进行诊断-计算机科学-大语言模型-医学决策.pdf
- 有损共同信息的互信息界限-计算机科学-机器学习-信息论-算法.pdf
- 联邦乳腺癌检测通过合成超声图像增强-计算机科学-联邦学习-乳腺超声-医学图像分类.pdf
- 超参数优化的 LLM 代理-计算机科学-大语言模型-无人驾驶飞机-自动超参数调整.pdf
- Q2SAR: 一种用于药物发现的量子多核学习方法-计算机科学-药物发现-量子机器学习-支持向量机.pdf
- MedSyn:通过人机协作提升诊断能力-计算机科学-医疗决策制定-混合智能-临床自然语言处理.pdf
- 大型语言模型评估:通过迭代成对比较使用大型语言模型进行评价-计算机科学-大语言模型-淘汰赛评估法.pdf
- 面向企业应用的计算机使用通才代理-计算机科学-代理人工智能技术.pdf
- 迁移学习在瞬变分类中的应用:从模拟数据到真实数据及从 ZTF 到 LSST-计算机科学-机器学习-天文学瞬变自动分类.pdf
- 基于 LLM 的推荐系统用户档案管理-计算机科学-大语言模型-推荐系统-个性化.pdf
- 2025至2030中国婴儿拉式蚊帐行业发展现状及发展趋势与投资风险报告.docx
- 2025至2030中国半导体陶瓷靶行业项目调研及市场前景预测评估报告.docx
- 2025至2030中国果汁行业供需趋势及投资风险报告.docx
- 2025至2030中国双节距滚子链行业项目调研及市场前景预测评估报告.docx
- 2025至2030全球及中国电子电气中的cPDM行业项目调研及市场前景预测评估报告.docx
- 2025至2030工业风幕行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至20305G技术行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030钛合金行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国冶金工程施工总承包行业运营态势与投资前景调查研究报告.docx
- 2025至2030铁路IT支出行业产业运行态势及投资规划深度研究报告.docx
最近下载
- 2024年中国零售商调查报告—全球化视角之海外门店拓展.pdf VIP
- 八大特殊作业(八大危险作业)安全管理知识与规范培训(PPT132页).pptx VIP
- 银行会计岗位招聘笔试题(某大型集团公司)试题集解析.docx VIP
- 磅房计量考试试题及答案.doc VIP
- 绿化养护标准及收费办法.docx VIP
- 儿童闭塞性细支气管炎的诊断和治疗(2023版)专家共识解读课件.pptx VIP
- CTX-M耐药基因流行病学调查及耐药机制研究.pdf
- 中国共产党纪律处分条例测试题附答案+考试注意事项.doc VIP
- 财务会计与税务会计差异及协调探讨.doc VIP
- (高清版)DG∕TJ 08-2410-2022 文物和优秀历史建筑消防技术标准.docx VIP
文档评论(0)