- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OpenAI在2022年11月30日发布了ChatGPT,它是一个基于大模型技术实现的通用聊天 机器人,它可以用来写作、翻译、润色句子、做事实性问答、执行文本分类/实体抽取/阅 读理解/文本摘要等各类NLP任务,甚至可以写SQL、写代码,几乎无所不能。 ChatGPT自发布之后一直大火至今,引起行业震动,我们也持续在跟进ChatGPT,体验 其功能,了解其技术原理,并基于爬虫技术封装了ChatGPT API,在实际NLP应用场景 下对比了ChatGPT和自研技术的效果。本文从应用角度出发,给出一些对ChatGPT的思 考。 一、 GPT 到 ChatGPT 的演进 Google于2017年在《Attention Is All You Need》一文中发布了Transformer,此后对 NLP、语音、 CV等AI领域产生了深远影响。 2018年6月, OpenAI发布了GPT ( Generative Pre-Training) [1]——基于Transformer Decoder结构和无监督预训练方法 实现的生成式预训练语言模型,也即GPT-1。 2018年10月, Google发布了BERT ( Bidirectional Encoder Representation from Transformers) [2], BERT是基于Transformer Encoder结构的预训练语言模型,在多项 NLP任务上取得SOTA效果,开启了自然语言处理「预训练+微调」的新范式,是自然语 言处理发展史上的里程碑。 BERT自发布之后在学术界和工业界均产生了重大影响,大量 论文和应用基于BERT实现,谷歌学术上BERT的论文引用数也远超GPT,近几年大模型 技术火热,国内外发布的大部分大模型也是基于BERT技术路线来实现。 OpenAI持续升级优化GPT,于2019年2月发布了GPT-2[3],于2020年6月发布了拥有 1750亿参数的超大模型GPT-3[4] ,轰动一时, GPT-3不需要像BERT那样针对特定任务做 微调(Fine-tune),一个大模型即可在一系列自然语言处理任务上取得优秀的效果,结 合Few-Shot少样本学习能力,在部分任务上甚至接近或者达到当时的SOTA效果。 使用BERT执行某个具体场景下的NLP任务如文本分类时,需要人工标注该场景下的一定 量数据,然后微调得到一个文本分类模型应用于分类,即重新更新了模型,对于不同的 任务均要这样做。而使用GPT-3执行NLP任务时,不需要重新更新模型,只需要向其发 从 GPT 到 ChatGPT 的演进与应用思考 送一句提示(Prompt)例如「请给这段文字分类,类别标签有A、B、 C」即可完成分 类,或者可以使用少量标注数据作为例子告诉模型,能够取得更优的效果,在这一点上 GPT-3要比BERT更加易用。值得说明的是,自GPT-3开始, OpenAI没有像GPT-1、 GPT-2那样发布开源代码,而是以API的形式提供商业化服务,具体 见/api。 BERT和ChatGPT执行任务的区别 ChatGPT是从GPT-3发展而来的,符尧等人在《拆解追溯 GPT-3.5 各项能力的起源》一 文[10]中总结了GPT-3到GPT-3.5的进化树, GPT-3在OpenAI API中的模型名称为Davinci (达芬奇),之后经历在代码上训练、指令微调、 RLHF ( Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)等过程,进化成ChatGPT,详细内容可 参见文章[10],这里不再赘述。 2022年11月, OpenAI除了发布ChatGPT之外,还发布了 text-davinci-003模型,两者都是在text-davinci-002模型的基础上使用RLHF方法训练得 到的, ChatGPT实际上不仅是一个单独的模型,而是一个完整的Web聊天机器人产品, 其内部调用的模型假设也称作ChatGPT。 GPT-3到GPT-3.5的进化树. 符尧等. 2022.12.11 OpenAI当前并未公布ChatGPT论文,只在官网发布了一篇BLOG[9], BLOG中讲到「We trained this model using Reinforcement Learning from Human Feedback (RLHF), using the same methods as InstructGPT, but with slight differences
您可能关注的文档
最近下载
- LBT 339-2025 北方地区 绿色食品设施莴笋生产操作规程.pdf VIP
- 基础护理学病情观察及危重患者的抢救和护理.pptx VIP
- 八年级下册道德与法治电子课本(附2023年教材变动内容).doc VIP
- 旅游概论-旅游者.pptx VIP
- 亚龙156A电气安装-电气培训PPT(项目二).ppt VIP
- 【公开版】《2023年美年健康体检大数据蓝皮书》.pdf VIP
- 《枫桥夜泊》的教学设计一等奖 .docx VIP
- 大类资产配置新框架,比特币和黄金:新旧时代的“代货币”.pdf VIP
- 2025年冰雪旅游行业投资回报分析报告.docx
- 2025年中国国家重点实验室建设行业供需策略分析及市场供需预测报告.docx
文档评论(0)