从 GPT 到 ChatGPT 的演进与应用思考.pptx

下载文档 降价啦

0
0
约8.04千字
约 12页
2023-09-10 发布于云南
举报
版权申诉
保障服务

从 GPT 到 ChatGPT 的演进与应用思考.pptx

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

OpenAI在2022年11月30日发布了ChatGPT，它是一个基于大模型技术实现的通用聊天机器人，它可以用来写作、翻译、润色句子、做事实性问答、执行文本分类/实体抽取/阅读理解/文本摘要等各类NLP任务，甚至可以写SQL、写代码，几乎无所不能。 ChatGPT自发布之后一直大火至今，引起行业震动，我们也持续在跟进ChatGPT，体验其功能，了解其技术原理，并基于爬虫技术封装了ChatGPT API，在实际NLP应用场景下对比了ChatGPT和自研技术的效果。本文从应用角度出发，给出一些对ChatGPT的思考。一、 GPT 到 ChatGPT 的演进 Google于2017年在《Attention Is All You Need》一文中发布了Transformer，此后对 NLP、语音、 CV等AI领域产生了深远影响。 2018年6月， OpenAI发布了GPT ( Generative Pre-Training) [1]——基于Transformer Decoder结构和无监督预训练方法实现的生成式预训练语言模型，也即GPT-1。 2018年10月， Google发布了BERT ( Bidirectional Encoder Representation from Transformers) [2]， BERT是基于Transformer Encoder结构的预训练语言模型，在多项 NLP任务上取得SOTA效果，开启了自然语言处理「预训练+微调」的新范式，是自然语言处理发展史上的里程碑。 BERT自发布之后在学术界和工业界均产生了重大影响，大量论文和应用基于BERT实现，谷歌学术上BERT的论文引用数也远超GPT，近几年大模型技术火热，国内外发布的大部分大模型也是基于BERT技术路线来实现。 OpenAI持续升级优化GPT，于2019年2月发布了GPT-2[3]，于2020年6月发布了拥有 1750亿参数的超大模型GPT-3[4] ，轰动一时， GPT-3不需要像BERT那样针对特定任务做微调(Fine-tune)，一个大模型即可在一系列自然语言处理任务上取得优秀的效果，结合Few-Shot少样本学习能力，在部分任务上甚至接近或者达到当时的SOTA效果。使用BERT执行某个具体场景下的NLP任务如文本分类时，需要人工标注该场景下的一定量数据，然后微调得到一个文本分类模型应用于分类，即重新更新了模型，对于不同的任务均要这样做。而使用GPT-3执行NLP任务时，不需要重新更新模型，只需要向其发从 GPT 到 ChatGPT 的演进与应用思考送一句提示(Prompt)例如「请给这段文字分类，类别标签有A、B、 C」即可完成分类，或者可以使用少量标注数据作为例子告诉模型，能够取得更优的效果，在这一点上 GPT-3要比BERT更加易用。值得说明的是，自GPT-3开始， OpenAI没有像GPT-1、 GPT-2那样发布开源代码，而是以API的形式提供商业化服务，具体见/api。 BERT和ChatGPT执行任务的区别 ChatGPT是从GPT-3发展而来的，符尧等人在《拆解追溯 GPT-3.5 各项能力的起源》一文[10]中总结了GPT-3到GPT-3.5的进化树， GPT-3在OpenAI API中的模型名称为Davinci (达芬奇)，之后经历在代码上训练、指令微调、 RLHF ( Reinforcement Learning from Human Feedback，基于人类反馈的强化学习)等过程，进化成ChatGPT，详细内容可参见文章[10]，这里不再赘述。 2022年11月， OpenAI除了发布ChatGPT之外，还发布了 text-davinci-003模型，两者都是在text-davinci-002模型的基础上使用RLHF方法训练得到的， ChatGPT实际上不仅是一个单独的模型，而是一个完整的Web聊天机器人产品，其内部调用的模型假设也称作ChatGPT。 GPT-3到GPT-3.5的进化树. 符尧等. 2022.12.11 OpenAI当前并未公布ChatGPT论文，只在官网发布了一篇BLOG[9]， BLOG中讲到「We trained this model using Reinforcement Learning from Human Feedback (RLHF), using the same methods as InstructGPT, but with slight differences