• 文档
  • 控制台
  • 登录
  • 立即注册
    目前不支持用户自主注册,如需注册账号,请联系400-080-1100
人工智能开发平台AISpace
下载PDF

3 操作指南

3.1 资源管理

3.1.1 概述

1.简介

在使用AISpace之前,需要购买资源包以满足任务实例的运行。


2.资源包属性

根据资源包类型,将资源包分为计算资源、存储资源。

• 计算资源:用于实例运行所需要的CPU、内存、GPU资源。

• 存储资源:用于存储实例所需的数据集、镜像、模型文件等。

专属资源:用于实例运行所需要的CPU、内存、GPU资源,购买后会锁定所购买的资源。


3.资源包使用说明

表3-1资源包使用说明

WX20241019-111736@2x.png

3.1.2 资源包购买

1. 简介

您可以在使用AISpace平台前按需购买资源包。

2.操作步骤

(1)在AISpace总览页面,单击右上角“资源购买”,跳转到资源包购买页面。

根据页面提示和参数说明配置。


WX20241019-163024@2x.png

(3)单击“下一步”,进入确认配置页面。

(4)确认信息无误后,单击“立即购买”,跳转到(公共资源池或存储资源或专属资源池)资源包列表页面。

待资源包状态变为“正常”,即表示资源包购买成功。


3.1.3 资源包关联项目

1.简介

在使用资源包申请实例前,需要将资源包关联到具体的项目上。

2.操作步骤

(1)在AISpace总览页面,单击“全局管理 > 项目空间”,选中项目,单击“关联资源”,跳转到资源关联页面。

(2)在待关联资源列表中选中资源包,单击“关联”,跳转到确认页面。。

(3)单击“确定”,即可成功将资源包关联到项目。


3.1.4 资源包续费

1.简介

资源包即将到期前,您可以通过资源包续费,延长资源包使用时间。

2.操作步骤

(1)在AISpace总览页面,单击右上角“已购买资源”,跳转到资源包列表页面。

(2)选中资源包,单击“续费”,跳转到资源续费页面。

(3)配置续费时长,单击确定,即可成功续费。


3.2 项目空间

3.2.1 概述

1.简介

所有的资源基于项目空间隔离。您可以使用不同的项目空间来管理项目资源和项目成员。

2.项目空间使用说明

表3-2项目空间使用说明

WX20241019-163548@2x.png

3.2.2 创建项目空间

1.简介

您可以在使用AISpace前先创建项目空间来管理资源。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“全局管理 > 项目空间”,进入项目空间列表。

(2)单击右上角的“新建项目空间”,跳转至新建项目空间页面。

WX20241019-163640@2x.png


3.3 数据服务

3.3.1 简介

支持数据集的分类创建、版本管理等,数据源支持本地上传,数据集存储支持并行文件存储和对象存储,创建的数据集可用于Notebook、可视化建模、大模型训练调优等任务。目前仅支持从本地上传数据集到平台。

3.3.2 操作步骤

(1)在AISpace总览页面,单击左侧导航栏“数据服务 > 数据集管理”,进入数据集列表。

(2)单击右上角的“创建数据集”,跳转至创建数据集页面。

(3)选择一个数据集文件夹,使用平台的上传功能将数据集上传到OSS存储。

(4)访问OSS管理界面,查看已上传的数据集。

(5)从数据集管理界面下载该数据集。


3.4 模型开发

3.4.1 可视化建模

1.简介

支持通过拖拉拽的方式进行模型训练流程构建,预置pytorch、tensorflow、paddlepaddle、XGBoost、deepspeed、mpi、megatron、colossal-ai等主流算法开发框架。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“模型开发 > 可视化建模”,进入任务流列表。

(2)添加任务流 > 填写表单信息 > 单击进入可视化建模界面。

(3)添加任务流 > 填写表单信息 > 单击进入可视化建模界面。


3.4.2 Notebook

1.简介

支持jupyter和vscode两种编码环境。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“模型开发 > Notebook”,进入notebook列表。

(2)单击右上角的“添加notebook”,跳转到notebook创建页面。

根据页面提示和参数说明配置。

WX20241019-163932@2x.png

(4)单击“确定”,跳转到notebook列表页面。

(5)待notebook状态变为“运行中”,即表示notebook创建成功


3.4.2.2 Notebook使用

(1)在AISpace总览页面,单击左侧导航栏“模型开发 > Notebook”,进入notebook列表。

(2)单击右上角的“添加notebook”,填写表单信息,创建notebook。

(3)单击运行中的Notebook>进入Jupyter编辑界面>运行准备好的训练脚本。

(4)切换pro版本的Jupyter,切换到运行目录后创建Tensorboard组件,查看神经网络结构并展示训练曲线。


3.4.2.3 使用自定义镜像环境

(1)在AISpace总览页面,单击左侧导航栏“模型开发 > Notebook”,进入notebook列表。

(2)进入Notebook,编辑自定义任务运行脚本。

(3)进入任务流,设置运行文件夹和启动命令。

(4)单击运行任务流,查看运行状态。

切换到Notebook,查看训练输出结果。


3.5 大模型服务

3.5.1 大模型预训练

1.简介

支持大模型的预训练过程,包括Llama2、Baichuan2、ChatGLM2等主流大语言模型。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务 > 大模型预训练”,进入预训练任务列表。

(2)单击右上角的“新建任务”,跳转到预训练分类创建页面。

(3)根据页面提示和参数说明配置。

WX20241019-164123@2x.png

(4)选择已创建的训练分类,进行详情页面,创建训练任务。

(5)单击右上角的“创建训练任务”,跳转到预训练任务创建页面。

(6)根据页面提示和参数说明配置。

WX20241019-164218@2x.png

(7)确认号配置后,单击“确定”,跳转到运行任务列表。

(8)执行预训练任务。 


3.5.2 大模型调优

3.5.2.1 指令微调

1.简介

支持大模型的有监督调优过程,包括全参全参和LoRa两种方式,包括Llama2、Baichuan2、ChatGLM2等主流大语言模型。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务 > 大模型调优 > SFT”,进入SFT任务列表。

(2)创建指令微调分类。

(3)选择已创建的训练分类,进行详情页面。

(4)创建指令微调训练任务。

(5)执行指令微调训练任务。 

3.5.2.2 奖励训练

1.简介

支持基于人类反馈的大模型调优过程,包括Llama2、Baichuan2、ChatGLM2等主流大语言模型。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务 > 大模型调优 > RLHF > 奖励模型训练”,进入奖励模型训练任务列表。

(2)创建奖励模型分类。

(3)选择已创建的训练分类,进行详情页面。

(4)创建奖励模型训练任务。

(5)执行奖励模型训练任务。

3.5.2.3 强化学习

1.简介

支持在奖励模型的基础上进一步对大模型进行调优,包括Llama2、Baichuan2、ChatGLM2等主流大语言模型。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务 > 大模型调优 > RLHF > 强化学习训练”,进入强化学习训练任务列表。

(2)创建强化学习分类。

(3)选择已创建的训练分类,进行详情页面。

(4)创建强化学习训练任务。

(5)执行强化学习训练任务。


3.5.3 大模型训练日志

1.简介

支持在大模型训练过程中实时查看大模型训练任务的日志。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务 > 大模型调优 > SFT”,进入SFT任务列表。

(2)执行已创建的指令微调训练任务。

查看模型训练期间任务的日志。


3.5.4 大模型损失曲线可视化

1.简介

支持展示大模型训练过程中实时的参数变化,包括Perplexity、Training Loss。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“大模型服务> 大模型调优>SFT”,进入SFT任务列表。

选择已训练的任务实例,单击评估报告。


3.5.5 大模型推理服务

1.简介

支持大模型训练成功后,离线部署成在线服务,包括服务调试、部署测试、部署生产、服务清除。

2.操作步骤

(1)在AISpace总览页面,单击左侧导航栏“服务管理>在线服务”,进入在线服务列表。

(2)使用已训练好的模型,创建一个新的在线服务。

(3)在线服务页面检查已经部署的服务。

调用接口验证服务部署成功。


3.6 模型市场

3.6.1 简介

支持CV、NLP、AIGC等多场景主流模型的预置,可一键部署体验和调优训练。

3.6.2 操作步骤

(1)在AISpace总览页面,单击左侧导航栏“模型市场”,进入模型列表。

(2)选择DAMOYOLO-高性能通用检测模型 > 单击部署,将其部署为在线体验服务。

(3)单击体验 > 进入在线体验服务界面。

(4)单击推理 > 填写表单信息 > 部署在线推理服务。

(5)单击调优 > 跳转至可视化建模编辑界面。


3.7 服务管理

3.7.1 简介

支持模型的在线部署与管理,包括服务调试、部署测试、部署生产、服务清除及服务监控。

3.7.2 操作步骤

(1)在AISpace总览页面,单击左侧导航栏“服务管理 > 在线服务”,进入在线服务列表。

(2)单击右上角的“添加在线服务”,跳转至创建在线服务页面。

(3)填写推理服务信息,推理服务镜像选择为: 

image.cestc.cn/iaas_pub/target-detection:0930;模型路径为yolo模型保存路径;选择专用网络VPC、弹性公网EIP。

(4)单击部署生产,将服务转为在线服务,使用IP进行访问。


意见反馈

文档内容是否对您有帮助?

如您有其他疑问,您也可以通过在线客服来与我们联系探讨 在线客服

联系我们
回到顶部