本文作者:23568Noct-Cp
本文分类:电脑使用技巧 浏览:1414
阅读时间:1095字, 约1-2分钟
近日,小编在van深度学习项目MockingBird时遇到了一个大问题啊,那就是我由于家境贫寒,我的核显不支持cuda。
终于,多亏了B站UP主@什么都懂一点的奶糖 介绍了“colab”这个名词,在项目的issue里面,我看到了详细的解决方法。
但是啊但是,colab这个项目就两点不好:
1、是Google项目,必须要魔法
2、数据先上传Google Drive,由于预训练数据为数量庞大的小文件,所以极容易上传丢(我5026个中传丢了435个……)
那这篇文章,我先带大家解决上传的问题。
你需要:
1、一个谷歌账号
2、魔法
1、本地内容
我建议大家,不要浪费时间在colab上预处理,现在本地预处理完罢。
预处理完之后,进入SV2TTS/synthesizer/,里面有三个文件夹:audio,mels,embeds
分别进入三个文件夹,ctrl a全选,压缩为zip
2、上传至谷歌云端硬盘
连上魔法,打开Google Drive,上传,不必多说,上传到哪个目录都没问题,记得住找得到就没问题
3、解压缩
毕竟MockingBird是没法直接读取压缩文件的(Python大佬可自行改源代码)
那么久需要我们能够解压缩
怎么办呢?
诶嘿。
打开colaboratory,登录后新建一个笔记本,输入以下代码
from google.colab import drive
drive.mount('/content/drive')
!unzip '<input direction>.zip' -d '<output direction>'
将<input direction>改成您的输入文件路径,<output direction>改为您的输出目录
Google Drive的位置在content/drive/MyDrive
比如我的就是:
!unzip '/content/drive/MyDrive/colab/datasets/Snow/SV2TTS/synthesizer/audio.zip' -d '/content/drive/MyDrive/colab/datasets/Snow/SV2TTS/synthesizer/audio/'
注意一点:如果大家是直接压缩的文件夹而不是进入文件夹Ctrl a选择,那么久直接解压到上一级目录,如我的synthesizer文件夹
总之上传完了之后再同一文件夹下应当这样:
每个文件夹打开来都应该是一堆npy(好奇怪的扩展名……就是564想要的那个的首字母诶……)(虽然应该是指numpy)
这样就能解决传送大量小文件速度慢且易丢失的问题,希望能帮到大家
下期预告:喜大普奔!小编居然用上了GPU训练深度学习!背后真相令人暖心……
关于作者23568Noct-Cp
- 一个当之无愧的菜鸡
- Email: syc071122@163.com
- 注册于: 2020-04-17 07:22:11