- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
采样决策
121
MichaelChertkov,SungsooAhn,andHamidrezaBehjoo
1PrograminAppliedMathematicsandDepartmentofMathematics,UniversityofArizona,
Tucson,AZ,chertkov@,hamidreza.behjoo@
2GraduateSchoolofAIatKAIST,RepublicofKorea,sungsoo.ahn@kaist.ac.kr
摘要
本在本手稿中,我们介绍了一种新颖的决策流(DF)框架,用于从目标分布中采样决策,并结合来自先前
译抽样的额外指导。DF可以被视为随机最优控制中的马尔可夫决策过程(MDP)方法的一种由AI驱动的算
中法性重生。它扩展了连续空间、连续时间路径积分扩散采样技术[1]到离散时间和空间,同时也推广了生成
流网络(GFN)框架[2]。在其最基本的形式中,一种不需要神经网络(NNs)的显式公式,DF利用底层
2MDP[3]的线性可解性来调整先前抽样的转移概率。所得马尔可夫过程表示为反向时间格林函数与目标分布
v
9的卷积。我们通过一个从伊辛模型–将DF与Metropolis–Hastings进行比较以量化其效率中采样的示例
4说明了DF框架,讨论了潜在的基于NN的扩展,并概述了如何在各种应用中提升引导抽样。
5
4
1
.1设置舞台
3
0
5生成式人工智能(Gen-AI)的总体目标是从通过真实数据(GT数据)表示的概率分布中生成样本。一
2
:个典型的Gen-AI模型从GT样本建立该分布的确切表示;例如,扩散模型将得分函数编码为对GT数据的
v
i求和。近期的例子包括迭代去噪能量匹配(iDEM)[4]和谐波路径积分扩散(H-PID)[1]算法。在某些情况
x
r下,特别是H-PID,仅基于GT的得分就足以生成新的样本,而无需神经网络(NNs);而在其他情况(例
a如iDEM),则后续训练一个神经替代模型。
除了生成建模之外,iDEM和H-PID还解决了一个经典的统计任务:从目标GibbsBoltzmann分布
p(σ)∝e−E(σ),(1)
中抽取独立同分布(i.i.d.)样本σ,其中E是一个已知的能量函数,除了一个加性常数。经典的方法是马尔
可夫链蒙特卡洛(MCMC)方法。生成流网络(GFNs)[2]在离散时间设置中解决了相同的吉布斯采样目标,
自回归地在一个有向无环图上增长轨迹∅=s0→...→sT=σ,同时允许每个动作依赖于整个部分历史。
本文的简要概述。决策流(DF)保留了GFN的顺序增长直觉,同时添加了一个闭式校正,使得每条轨
迹都与任意目标分布完全一致。此外,DF可以利用启发式增长策略来引导轨迹,同时仍然能够证明性地精
确纠正策略。我们设想DF作为一款即插即用引擎,特别适用于改进现代生成AI流水线——扩散模型和自
回归变换器——这依赖于快速准确的目标分布采样。
我们的贡献:(i)我们将[3]的线性可解MDP理论扩展到随时间增长的状态空间,并推导出一个明确的
解决方案–定理1,这是我们主要结果,在第3节中陈述;(ii)我们重新解释该解决方案为一种通用的、解
您可能关注的文档
- 编队的联合旅行路线优化框架-计算机科学-机器学习-编队行驶-路线优化-算法.pdf
- 互易性感知卷积神经网络在基于地图的路径损耗预测中的应用-计算机科学-路径损耗建模-数据增强-机器学习.pdf
- 一种基于频率的最大平方检测二进制矩阵的有效方法-计算机科学-机器学习-算法.pdf
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2024陕西延长石油集团华特新材料股份有限公司社会招聘8人笔试参考题库附带答案详解.pdf
- 2023内蒙古大唐国际锡林浩特矿业有限公司采煤自营专项社会招聘32人笔试参考题库附带答案详解.pdf
- 2024年12月云南大学国际合作与交流处公开招聘(1人)笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024年12月2025海南省气象部门公开招聘应届毕业生9人(第3号)笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024年12月甘肃省科学技术情报研究所科研助理公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2025年01月黑龙江大庆市养老服务中心(市第二福利院)必威体育精装版公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)