MANTA主网矿机部署文档

2023/02/17

一、 MANTA部署简介

MANTA是依托于matrix主链的分布式自动机器学习平台,这个平台是一个基于分布式技术加速的自动机器学习(AutoML)应用及其部署系统,通过AutoML网络搜索算法搜索一个高精度、低延迟的深度模型,并利用分布式计算技术进行搜索加速。

当前MANTA可以部署到matrix矿机上,也可以单独部署。服务部署好后通过公网IP地址加端口8502访问软件中训练的web服务。当MANTA开发商业运营时,MANTA服务平台会登记用户的公网IP和钱包地址,并分配一定的学习任务,然后根据完成的任务按照钱包地址进行奖励发放。

二、 矿机硬件配置要求

CPU:Intel Xeon 系列,2.0GHz 以上主频,核心数目 8 个以上

GPU:Nvidia Pascal 或以上架构,显存不小于 12GB

网络:内网带宽大于 10Gbps,外网带宽大于 10Gbps

硬盘:至少 700G SSD 硬盘,500G用于存储Matrix主网数据,200G用以存储模型和训练日志

内存:32GB 以上

网络配置:服务器允许被公网访问,访问地址示例:http://{IP}:8052,其中 IP 为部署服务器的对公可访问地址。

三、分布式自动机器学习 Web 服务配置

1. 训练数据集准备

该项目主要会用到两个数据集,分别用于图像分类和双目视差估计模型的训练。

• 图像分类:ImageNet

网络连接(https://www.image-net.org/challenges/LSVRC/2012/)

(参考链接:https://blog.csdn.net/Yuan_mingyu/article/details/123940228)

(1) 数据集下载

数据集官网:https://www.image-net.org/challenges/LSVRC/index.php

如果是图像识别任务的话,下载这两个就可以了。

Training images (Task 1 & 2)

(https://image-net.org/data/ILSVRC/2012/ILSVRC2012_img_train.tar)

Validation images (all tasks)

(https://image-net.org/data/ILSVRC/2012/ILSVRC2012_img_val.tar)

(2) 数据集处理

已经下载了两个数据集,一个是训练集,一个是验证集,现在就要把这数据集整理成可以供模型直接加载的形式。

首先解压 ILSVRC2012_img_train.tar 到 train,里边包含 1000 个小的 tar 压缩包,每一个对应一类的图片(压缩包的名称就代表这一类,不要修改),所以再将他们都解压成文件夹就好了。

先解压

mkdir train tar xvf ILSVRC2012_img_train.tar -C ./train

“ 因为数量多,写个脚本 unzip.sh 如下

添加可执行权限,执行一下

chmod +x ./unzip.sh

./unzip.sh

由于压缩包 ILSVRC2012_img_train.tar 比较大,处理后可以删除了。可以直接把 train.tar 先移动到 train 中,再进行操作。

最终训练集形式:

验证集比较简单,只有 50000 张图片,直接解压 ILSVRC2012_img_val.tar 就可以。但是为了后续的使用,也需要把这些图片分成 1000 类(创建 1000 个文件夹,把对应类的图片放进去,与训练集结构保持一致)。

先解压

mkdir val tar xvf ILSVRC2012_img_val.tar -C ./val

进入 val,下载脚本,执行

cd val

wget -qO-

https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh chmod +x ./valprep.sh

./valprep.sh rm valprep.sh

最终验证集形式:

数据集处理后格式:

• 双目视差估计:SceneFlow

网络链接:(https://lmb.informatik.uni-freiburg.de/resources/datasets/SceneFlowDatasets.en.html)

下载页面中这六个数据集并解压:

下载完数据后,分别按照以下方式修改路径,以便于被 Web 服务识别到

(1) ImageNet

/mnt/imagenet

|

|--train

|--val

(2) SceneFlow

/mnt/SceneFlow

|

|--FlyingThings3D

|--Monkaa

|--Driving

2. 训练 Web 服务启动

Ø 下载dist-automl,下载链接如下:

https://www.matrix.io/assets/dropdown/dist-automl1.1.zip

Ø 解压dist-automl

命令:Unzip -d dist-automl

Ø 进入 dist-automl 目录

命令:cd dist-automl

Ø 安装项目依赖的 python 库

命令:pip install -r requirements.txt

Ø 运行服务启动命令

命令:streamlit run training_manager.py 终端显示如下内容:

表明服务已经运行成功,将图中红框部分替换成部署服务器的公网 IP,即可通过该地址访问到该软件中的训练 Web 服务。

同时可以将部署好的服务提供到主网络分布式自动机器学习服务。

MANTA加入MAN钱包的说明

下载最新版dist_automl1.1.zip,

下载链接:https://www.matrix.io/assets/dropdown/dist-automl1.1.zip

一、 生成自己MANTA钱包

通过官网钱包生成钱包,自己妥协保存私钥或者keystore+密码或者足记词。

二、 MANTA服务器运行加密钱包程序

(1)将钱包地址复制到输入框,点击加密

(2)记录生成的密码和密文,并通过邮件密码和密文发送到**@matrix.io邮箱

三、 将密文复制到项目目录的Wallet_info.md中

四、启动web_service查看钱包

启动服务:streamlit run web_service.py

输入密码,查看钱包信息

Last updated