通信行业专题研究:OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考.pdfVIP

通信行业专题研究:OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

行业报告|行业专题研究

通信证券研究报告

2024年09月24日

投资评级

OpenAIo1占领后训练扩展律前沿,从快速识别走向深度思考行业评级强于大市(维持评级)

上次评级强于大市

o1模型通过强化学习训练和产生思维链,能在做出响应前花更多时间思考

问题作者

唐海清分析师

9月12日,OpenAI发布一系列新大语言模型o1,经过强化学习SAC执业证书编号:S1110517030002

(ReinforcementLearning)训练,可以执行复杂推理,该模型可以产生一tanghaiqing@

个长程思维链(ChainofThought),在做出响应前花更多时间思考问题。王奕红分析师

SAC执业证书编号:S1110517090004

新模型包括o1-preview和o1-mini两种版本,其中o1-mini更快、更具wangyihong@

成本效益,适用于需要推理但不需要广泛知识的应用程序余芳沁分析师

SAC执业证书编号:S1110521080006

o1-mini是一个较小的模型,针对预训练期间的STEM推理进行了优化。yufangqin@

速度方面,在单词推理问题回答中o1-mini找到答案的速度比o1-preview

大约快了3~5倍;成本方面,OpenAI向第五梯队API用户开放的o1-mini行业走势图

成本端比o1-preview便宜80%。

通信沪深300

o1通用性不及GPT-4o,高推理能力伴随高成本0%

-4%

作为早期模型,o1并不具备浏览网页、上传文件和图像等功能,通用性尚-8%

不及GPT-4o。但相较于GPT-4o多模态、反应快等特点,o1-preview更加-12%

注重推理能力,输入、输出tokens成本分别是GPT-4o的3、4倍。-16%

-20%

o1在数理化复杂问题推理中的性能明显优于GPT-4o,在物理和生物学专-24%

2023-092024-012024-05

业知识基准上的表现超越人类博士

资料来源:聚源数据

o1在竞争性编程问题(Codeforces)中拿到89%的百分位,GPT-4o仅为

11%;在国际数学奥林匹克竞赛(IMO)的资格考试中,o1解答正确率为相关报告

83%,而GPT-

文档评论(0)

bookuser001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档