- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
行业报告|行业专题研究
通信证券研究报告
2024年09月24日
投资评级
OpenAIo1占领后训练扩展律前沿,从快速识别走向深度思考行业评级强于大市(维持评级)
上次评级强于大市
o1模型通过强化学习训练和产生思维链,能在做出响应前花更多时间思考
问题作者
唐海清分析师
9月12日,OpenAI发布一系列新大语言模型o1,经过强化学习SAC执业证书编号:S1110517030002
(ReinforcementLearning)训练,可以执行复杂推理,该模型可以产生一tanghaiqing@
个长程思维链(ChainofThought),在做出响应前花更多时间思考问题。王奕红分析师
SAC执业证书编号:S1110517090004
新模型包括o1-preview和o1-mini两种版本,其中o1-mini更快、更具wangyihong@
成本效益,适用于需要推理但不需要广泛知识的应用程序余芳沁分析师
SAC执业证书编号:S1110521080006
o1-mini是一个较小的模型,针对预训练期间的STEM推理进行了优化。yufangqin@
速度方面,在单词推理问题回答中o1-mini找到答案的速度比o1-preview
大约快了3~5倍;成本方面,OpenAI向第五梯队API用户开放的o1-mini行业走势图
成本端比o1-preview便宜80%。
通信沪深300
o1通用性不及GPT-4o,高推理能力伴随高成本0%
-4%
作为早期模型,o1并不具备浏览网页、上传文件和图像等功能,通用性尚-8%
不及GPT-4o。但相较于GPT-4o多模态、反应快等特点,o1-preview更加-12%
注重推理能力,输入、输出tokens成本分别是GPT-4o的3、4倍。-16%
-20%
o1在数理化复杂问题推理中的性能明显优于GPT-4o,在物理和生物学专-24%
2023-092024-012024-05
业知识基准上的表现超越人类博士
资料来源:聚源数据
o1在竞争性编程问题(Codeforces)中拿到89%的百分位,GPT-4o仅为
11%;在国际数学奥林匹克竞赛(IMO)的资格考试中,o1解答正确率为相关报告
83%,而GPT-
文档评论(0)