捡漏!用谷歌图片搜索自制深度学习数据集 教程

2018-10-31 16:30:38  A+ A-

  就怕前脚刚立志搞个新研究,后脚就发现没有合适的数据集可用。AI工程师从入门到放弃,可能就是这么一会的功夫。

  在这份教程中,来自fast.ai的小哥哥Francisco Ingham就想手把手教你,如何利用谷歌图片搜索,DIY一份自己的深度学习数据集出来,还不会违反谷歌服务条例。

  非常简单,就像平时在谷歌图片中查找图像一样,输入关键词,搜索你感兴趣的图像。

  谷歌图像最多显示700张图像,所以一页到底再点击“显示更多”,直到加载完毕。

  上一步的成果,现在可以拿来用了。不过先得创建一个项目目录。作者将其命名为mkdir MyProject,不过“MyProject”可以替换成你喜欢的项目名字。

  只需要指定URL文件名和目标文件,就能自动下载保存,在本地就能打开图像了。

  查看新鲜出炉的图像,可能会发现一些不需要的图像,此时就需要你手动去筛选和删除它们了。

  和数据集的众多兄弟姐妹一样,在开始使用它前,最好还是把里面的图片分成训练、验证和测试集。

  过完这道坎,你就拥有了一个DIY的深度学习数据集了,此时有没有感觉赞赞的?

  此外,Francisco Ingham还将教程搬到了fast.ai的课程仓库中,是用Jupyter Notebooks写成的。不过刚量子位看时还没有搬完。如果原地址找不到了,不妨来这里看看:

分享到:
足球交流论坛 足球直播,足球新闻 网址:www.y0008.com 版权所有 广告qq:1969339740 @2009-2017