- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
CONTENTS
目录
02训练和评估
01技术背景
03应用框架
04应用案例
法律大语言模型的相关背景
2020年前后,OpenAI发布
了包含1750亿参数的GPT-3模型,展现了卓越的能力
FOUR
2017年前后,
Transformer架构的发布成了BERT、GPT等许多预训
练模型的基础
THREE
20世纪中叶开始发展,在
七八十年代达到鼎盛
ONE
20世纪末自神经网络发展
以来不断发展,包括RNN以及LSTM
TWO
1.法律大模型|语言模型发展阶段
大规模语言模型
预训练语言模型
统计语言模型
神经语言模型
第三阶段
第四阶段
第二阶段
第一阶段
1.法律大模型|语言模型发展阶段
预训练语言模型
神经语言模型
统计语言模型
RNN
•这是文
这是文字这是文字
THREE
ONETW
ChatGPT在两项试题达到了合格率,
其中一项还跟人类水平持平。
GPT-4表现“可与人类相媲美”,其在律师资格考试(UBE)分数超过90%考生。
1.法律大模型|大语言模型在法律领域的表现
1.法律大模型|法律大语言模型
2023年8月,浙江大学、阿里巴巴达摩院和华院计算联合发布了法律大模型。
1.法律大模型|挑战
领域知识融合
知识图谱关联
知识检索增强
法律大语言模型的训练和评估
2.训练与评估|领域数据收集
•收集了多源异构知识数据,不仅包含6种类型的知识:法条类、案例类、
模板类、书籍类、法律考试类、法律日常问答类,我们还以法条和案件为中心节点构建了它们的关系图谱数据。
内容过滤
敏感信息
人工审查
文本抽取
2.训练与评估|
角色扮演
上下文信息
数据筛选数据改造
罪名法条
刑期预测
法院意见
案件事实摘要
领域数据清洗
01
数据去重
02
多轮对话
02
质量管控
03
结构化
多样化指令
标准规范化
法考题解释
庭审问答
规则去重
语义去重
01
2.训练与评估|领域知识融入模型训练
冻结部分参数
增加部分参数
•提升模型性能和泛化能力
•缓解模型的灾难性遗忘
2.训练与评估|参数调优和资源需求
C为Decoder类模型所需计算量,N为模型参数量,D为数据量
资源需求平衡
高效参数微调
重新参数化
•找到资源需求的平衡点
•获得最佳模型性能和资源利用效率
•微调训练需要大量计算资源
•合理规划资源提升训练效率
质量指标
2.训练与评估|法律大语言模型评测指标体系
结构化文书生成
办案报告生成
案情分析
司法决策推理
法律文书摘要
法律要素抽取
法律文书检查
法律法规问答
案件咨询问答
司法程序问答
法律文书生成
证据链分析
法律大模型评估指标体系
处理效率
并发路数
相关度
首字响应时间
F1
完整度
正确性
有效性
可靠性
可维护性
功能指标
性能指标
2.训练与评估|法律大语言模型能力体系
01语言理解
l法律文书检查
l案件要素抽取
l法律文书摘要
02内容生成
l法律文书生成
l办案报告生成
l结构化文本生成
04逻辑推理
l证据链分析
l案情分析
l司法决策推理
法律咨询
法律法规问答案件咨询问答司法程序问答
03
lll
法律大语言模型的应用框架
3.应用框架|系统架构
应用
场景
场景
适配
知识
管理
模型
协同
模型配置
响应策略设定
业务全流程智慧赋能助手
AI律师
AI调解员
AI政务顾问
-特定领域
UniLaw大模型
-通用领域
6-72B大模型
问答对问法拓展
层次化知识管理
40种格式解析
图片摘要汇总
语义文本切分
问答对自动抽取
政策文件
法条法规
法律书籍
司法案件
知识图谱解读
复杂表格处理
国内主流大模型
关键词检索
意图识别
多模态图片检索
agent插件
表格识别
ReRank模型
知识库配置
GPT4-API
多模态理解模型
语义检索
版面分析
调度编排
图文多模态摘要
prompt场景设定
关键词召回模型
BGE向量模型
层次检索
NL2SQL
文字识别
党群
服务
中心
-社会
治理
中心
法院
文档解析模型
场景逻辑设定
检索召回模型
大语言模型
文档解析
检索设定
业务插件
业务协同
知识组织
群众端
业务端
3.应用框架|华院RAG平台——本地专有知识融合
模块化
数据处理模块、模型推理模块、知识管理模块、用户交互模块等。以确保系统的可扩展性
您可能关注的文档
- 职场关怀趋势洞察与策略指引白皮书.pptx
- 数据跨境流动、个人信息保护与数字韧性建设 2024.pptx
- 基于大数据中台的数智园区建设方案.pptx
- 第三代半导体产业发展报告 2023.pptx
- 百度大模型原生安全构建之路-36页.pptx
- 阿里云AI有哪些信誉好的足球投注网站RAG大模型优化实践-32页.pptx
- SZSD 0062—2024智慧社区 基础设施分类指南.pptx
- Focussend许可邮件10问10答 -解码邮件营销新玩法.pptx
- Al市场趋势洞察分析-31页.pptx
- AI辅助编程真实测评与企业落地实践-42页.pptx
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
最近下载
- 糖尿病视网膜病变临床诊疗指南(2022)解读.pptx
- 300T汽车吊性能说明书-XCA300_1全地面起重机技术规格书+[主臂风电臂加超起].pdf
- 读书分享《教育的细节》PPT课件.pptx
- 新冠病毒及新冠肺炎.pptx VIP
- 第9课 改变世界的工业革命【课件】--2023-2024学年中职高一下学期高教版(2023)世界历史全一册.pptx
- 【精】新人教版七年级历史上册第一、二、三单元分单元测试题(带答案).docx VIP
- 普通中小学校建设标准DGTJ08—12—2004.pdf
- 灯泡的亮度问题.ppt
- 文华财经指标公式源码大全期货多空趋势指标源码顶底买卖点.doc
- 幼儿园每月食品安全调度会议纪要.doc
文档评论(0)