- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大语言模型入门
GettingStartedwithLargeLanguageModelsABeginnersGuideandLiveDemo
议程概述Agenda
。引言与自我介绍Introduction
。理解大语言模型UnderstandingLLM
。实际应用PracticalApplications
。演示:在GoogleColab上部署Llama3.1
Demo:DeployingLlama3.1onGoogleColab
。伦理考量与LLM的未来EthicalConsiderationsandFutureofLLMs。总结与问答SummaryandQA
啥是大语言模型WhatisLargeLanguageModel(LLM)
。大语言模型(LargeLanguageModel,LLM)。通过大量文本数据训练的一种人工智能模型。专门用于理解、生成和处理自然语言
训练数据输入中国的首都是?
训练数据
输入
中国的首都是?
输出
中国的首都是北京
LLM
如何理解大语言模型
○大规模
大量文本数据训练
大量参数的AI模型
GPT4(noto?cial)
●1.8Tparameters●120layers
●13Ttokens
CommonCrawlWebText2
Books1,Books2Wikipedia
网络爬虫公开数据集Reddit论坛网页文本互联网书籍语料库
维基百科知识库
如何理解大语言模型
○大规模
■大量参数的AI模型
■大量文本数据训练○语言
■基于自然语言处理(NatureLanguageProcessing/NLP)
■能够理解、生成和处理人类语言
如何理解大语言模型
○大规模
■大量参数的AI模型
■大量文本数据训练
○语言
■基于自然语言处理(NatureLanguageProcessing/NLP)
■能够理解、生成和处理人类语言○模型
■模拟语言规则和模式的数学框架
■训练的模型可以预测语言中的下一个词或者句子
LLM的简史与演变
○早期发展
■早期的NLP主要依赖于规则系统和基本的统计模型
■神经网络的引入极大地改变了NLP领域
○LLM的崛起:
■Attentionisallyouneed(2017)
■2022年11月30日ChatGPT发布
常见的大语言模型
OpenAIChatGPT/o1GoogleGemini
MetaLlama
AnthropicClaude
MistralMistral/Mixtral
百度文心一言
阿里云通义千问
华为盘古
腾讯混元
科大讯飞星火零一万物Yi
大模型是如何炼成的HowLLMisTrained
Step1:Pre-training(unsupervised)BaseLLM文字接龙机
Step2:SupervisedFine-tuning(SFT)InstructLLM初级客服
Step3:ReinforcementLearningfromHumanFeedback(RLHF)
ChatLLM专业顾问
大语言模型如何工作
LLMTransformer中国的首都是
LLM
Transformer
FeedForward
Feed
Forward
综合思考
北京
……
Tokenization
Tokenization
文字转成token
Embedding
Embedding
理解语义/位置
Attention
Attention
考虑上(下)文
Output
Output
输出
反复思考中国的首都是
反复思考
中国的首都是
RAG
RAG/PAL/ReAct
借助外部数据/工具
人要是行,干一行,行一行。一行行,行行行;
人要是行,干一行,行一行。一行行,行行行;要是不行,干行,不行行。
大语言模型和AI/ChatGPT的关系
●LLM是基础技术
●ChatGPT是LLM技术的一种应用实现
实际应用PracticalApplications
○内容生成ContentGeneration
○知识库问答KnowledgeBaseAnswering
○文本分类TextClassi?cation
○情感分析SentimentAnalysis
○有哪些信誉好的足球投注网站Searc
您可能关注的文档
- 2024年大语言模型入门报告.pptx
- 2024年大语言模型入门报告.pdf
- 生成式人工智能在跨区域小学语文教研协作中的实践研究教学研究课题报告.docx
- 高中英语读写结合教学中的阅读教学与写作教学互动模式案例分析教学研究课题报告.docx
- 《中医针灸治疗偏头痛的疗效与患者脑内神经生长因子表达关系研究》教学研究课题报告.docx
- 中学化学教学中数字化实验探究对学生数字素养的影响研究教学研究课题报告.docx
- 小学数学课堂的G智慧校园互动教学策略分析教学研究课题报告.docx
- 初中生物课堂中激发学生关爱生态环境的策略研究教学研究课题报告.docx
- 《5S管理在制造业企业生产现场现场改善中的创新实践与效果评价》教学研究课题报告.docx
- 初中跨学科教学评价创新:人工智能辅助下的评价策略探讨教学研究课题报告.docx
- 初中英语教学中非智力因素对学生学习效果的影响分析教学研究课题报告.docx
- 4 基于深度学习的医学影像识别算法在影像病理诊断中的准确性评估教学研究课题报告.docx
- 《制造业企业生产现场5S管理实施对人力资源管理的提升研究》教学研究课题报告.docx
- 初中物理实验:自动驾驶路径规划算法在物理实验设计中的应用与优化教学研究课题报告.docx
- 2017-2018学年北京市平谷区北京版小学三年级下册英语期末试题及答案.doc
- 基于小学英语戏剧的课堂活动设计策略研究教学研究课题报告.docx
- 小学美术教学中创意思维与表达能力培养的实践探索教学研究课题报告.docx
- 小学生故事大王比赛中的心理素质培养与教学策略教学研究课题报告.docx
- 中学生非智力因素与物理学科素养培养的关系研究教学研究课题报告.docx
- 高中校园环境对学生学习策略与学习成效的关联性分析教学研究课题报告.docx
文档评论(0)