
上QQ阅读APP看书,第一时间看更新
1.2 开发机器学习工作流的方式
1.2.1 数据导入
以上述手写识别为例,我们利用mnist数据集来建立工作流。如图1-1所示,首先点击1处导入数据,然后点击2处新建数据集,在弹出的页面中点击导入图像。

图1-1 mnist数据集:导入数据
之后会跳转到选择数据的页面,按照图1-2所示解释预处理数据并上传,然后设定文件夹名为label。点击完成后,等待一定时间即可成功上传数据。

图1-2 mnist数据集:上传数据
重新回到图1-1界面,可以在图中央找到上传的数据,点击数据所在行即可预览。
如图1-3所示,数据特征有name、imageBytes两个属性,后者是由Sophon读出的可以预览的图片数据。label属性是string类型的子文件夹名。

图1-3 mnist数据集:数据预览