跳转至

前言

这里记录一下学习CV过程中一些比较好的书籍,常用的数据集,标注工具,学习路线等的整理,持续更新中。

书籍

  • 学习数字图像处理:推荐冈萨雷斯《数字图像处理》第三版。下载地址?没有,还是买吧。如果是简单学习的话我推荐大学教材,
  • 学习Pytorch: 推荐李沐大神的《动手学深度学习》,这本书有2个版本,第一个是Pytorch版本,下载地址如下:点这里下载 ,第二个是mxnet版本,下载地址如下:点这里下载
  • 学习Tensorflow:这个东西还真不好推荐,如果是入门级别的学习,我看过《Tensorflow实战Google深度学习框架》这个确实不错。
  • 学习Caffe,推荐赵永科的《21天实战Caffe》,书籍封面长这样,地址暂时找不到了我找到了分享上来: 在这里插入图片描述
  • 深度学习需要的数学知识学习书籍,给大家推荐基本豆瓣评分很高的书: 在这里插入图片描述在这里插入图片描述在这里插入图片描述 那么是不是说所有的东西都需要掌握呢?在我看来不全是这样,我觉得掌握下面的基本上对于面试和工作够用了。 1、标量,向量,特征向量,张量,点积,叉积,线性回归,矩阵,秩,线性无关与 线性相关,范数, 奇异值分解,行列式,主成分分析,欧氏空间,希尔伯特空间。 2、不确定性,随机变量,大数定律,联合分布,边缘分布,条件概率,贝叶斯公式, 概率密度,墒与交叉墒,期望,最大似然估计,正态分布/高斯分布,伯努利分布,泊 松分布,概率论与统计推断,马尔可夫链,判别模型,生成模型。

  • 机器学习:给大家推荐《周志华机器学习》,下载地址为:这里。还有李航《统计学习方法》下载地址为:这里,这两本书分别长这个样子: 在这里插入图片描述在这里插入图片描述 然后其他朋友推荐的口碑不错的《机器学习实战》也不错,下载地址为:点这里,封面长这样: 在这里插入图片描述

  • 深度学习:推荐花书,找不到下载地址,封面如下: 在这里插入图片描述

数据集

## 目标检测 - PASCAL VOC数据集。 - MSCOCO数据集。 - Google Open Image数据集。 - ImageNet数据集。 - DOTA数据集。这5个数据集都可以在我的推文中看详细介绍,地址如下:https://mp.weixin.qq.com/s/Q5iicpLzHQ1EmUdWI1tcSg

语义分割

  • PASCAL VOC数据集。
  • MS COCO数据集。
  • Cityscapes数据集。Cityscapes 是驾驶领域进行效果和性能测试的图像分割数据集,它包含了5000张精细标注的图像和20000张粗略标注的图像,这些图像包含50个城市的不同场景、不同背景、不同街景,以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注。Cityscapes评测集有两项任务:像素级(Pixel-level)图像场景分割(以下简称语义分割)与实例级(Instance-level)图像场景分割(以下简称实例分割)。

标注工具

  • LabelImg LabelImg 是一款开源的图像标注工具,标签可用于分类和目标检测,它是用 Python 编写的,并使用Qt作为其图形界面,简单好用。注释以 PASCAL VOC 格式保存为 XML 文件,这是 ImageNet 使用的格式。 此外,它还支持 COCO 数据集格式。
  • labelme: labelme 是一款开源的图像/视频标注工具,标签可用于目标检测、分割和分类。灵感是来自于 MIT 开源的一款标注工具 LabelMe。labelme支持图像的标注的组件有:矩形框,多边形,圆,线,点(rectangle, polygons, circle, lines, points),支持导出 VOC 格式用于 semantic/instance segmentation和导出 COCO 格式用于 instance segmentation。同时还支持视频标注。

学习路线

Opencv图像处理算法->机器学习基础 算法->深度学习入门+经典网络->深入到如果检测/分割/人脸识别等方面(学习经典算法包括训练/测试/损失函数等)->考虑部署和算法优化,学习模型裁枝,量化,蒸馏等trick->参加比赛如AI研习社/Kaggle等->发论文,看论文,肝顶会等。如果考虑面试加上刷LeetCode,我自己虽然有很多还没有开始做也有很多没有做好,但是基本是按照这个流程来尝试的,仅仅供参考。