人工智能研发运营体系(MLOps)实践指南.docx

人工智能研发运营体系(MLOps)实践指南.docx

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
目 录 一、 MLOps 概述 1 (一)AI 生产过程管理问题凸显 1 (二)MLOps 概念与意义 2 (三)MLOps 实施原则 3 二、 MLOps 发展现状与挑战 6 (一)MLOps 发展过程 6 (二)MLOps 落地挑战 11 三、 MLOps 框架体系 13 (一)机器学习项目生命周期 13 (二)MLOps 流程架构 14 (三)MLOps 相关角色 19 四、 MLOps 关键能力与技术实践 22 (一)数据处理 22 (二)模型训练 25 (三)构建集成 27 (四)模型服务 30 (五)运营监控 35 (六)模型重训 38 (七)实验管理 40 (八)流水线管理 43 (九)特征管理 45 (十)模型管理 47 (十一)仓库管理 50 (十二)模型安全 53 五、 MLOps 总结与展望 57 (一)总结 57 (二)展望 58 图 目 录 图 1 MLOps 示意图 2 图 2 MLOps 实施原则 4 图 3 机器学习技术债示意图 6 图 4 Gartner 数据科学和机器学习技术成熟曲线 8 图 5 MLOps 工具分类一览 9 图 6 机器学习项目生命周期示意图 13 图 7 基于 MLOps 框架的机器学习项目生命周期示意图 14 图 8 MLOps 流程架构示意图 14 图 9 MLOps 相关角色分工示意图 19 图 10 MLOps 关键能力示意图 22 图 11 广东移动的数据处理能力示意图 23 图 12 格物钛的数据处理能力示意图 24 图 13 云测数据的数据处理能力架构图 25 图 14 百度的模型训练架构图 27 图 15 马上消费的构建集成流程图 29 图 16 腾讯的 MLOps 平台示意图 30 图 17 浦发银行模型服务示意图 32 图 18 建行模型服务架构图 33 图 19 中移在线中心 Polaris MLOps 平台模型部署流程 34 图 20 星环科技 MLOps 流程图 35 图 21 联通软件研究院模型成效闭环运营分析示意图 37 图 22 蚂蚁的持续训练能力示意图 39 图 23 蚂蚁的持续训练流程图 40 图 24 百度的实验管理流程图 41 图 25 华为终端云的实验管理界面 42 图 26 农行的流水线管理示意图 44 图 27 华为终端云的流水线编排可视化能力示意图 44 图 28 华为终端云的特征实验流程图 46 图 29 浦发银行的特征工程流程图 47 图 30 河南移动的模型管理示意图 48 图 31 百度的模型管理流程图 49 图 32 九章云极 DataCanvas 模型管理功能示意图 50 图 33 中信证券的机器学习生命周期示意图 52 图 34 绿盟的模型安全防御策略示意图 54 图 35 蚂蚁的 AntSecMLOps 架构图 55 图 36 蚂蚁的蚁鉴-AI 安全检测平台 56 表 目 录 表 1 MLOps 相关角色职责要求 20 附 表 1 MLOps 工具链清单 63 一、MLOps 概述 MLOps 是通过构建和运行机器学习流水线(Pipeline),统一机器学习(ML)项目研发(Dev)和运营(Ops)过程的一种方法,目的是为了提高 AI 模型生产质效,推动 AI 从满足基本需求的“能用”变为满足高效率、高性能的“好用”。本章首先阐述组织在 AI 大规模生产过程中凸显的管理问题,然后梳理 MLOps 概念和意义,并分析落地 MLOps 所遵循的原则。 (一)AI 生产过程管理问题凸显 Gartner 调查发现,只有 53%的项目能够从 AI 原型转化为生产1。 AI 生产转化率低的主要原因在于模型全链路生命周期管理存在问题,包括跨团队协作难度大、过程和资产管理欠缺、生产和交付周期长等。 第一,跨团队协作难度大。机器学习项目生命周期中涉及业务、数据、算法、研发、运维等多团队,团队间缺乏相同的技术和业务背景知识作为协作基础,从而带来沟通屏障。同时每个团队的协作工具不尽相同,从数据和算法转化为推理服务的整个过程漫长而复杂,从而增大协作难度。 第二,过程和资产管理欠缺。模型生产过程无标准化管理,导致 AI 资产的价值无法有效发挥。原因在于以下几方面:一是生产过程冗长难管理,AI 模型生产过程涉及的环境、流程复杂,各部门习惯于小作坊的生产模

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档