前言¶

这里记录一下学习CV过程中一些比较好的书籍，常用的数据集，标注工具，学习路线等的整理，持续更新中。

书籍¶

学习数字图像处理：推荐冈萨雷斯《数字图像处理》第三版。下载地址？没有，还是买吧。如果是简单学习的话我推荐大学教材，
学习Pytorch: 推荐李沐大神的《动手学深度学习》，这本书有2个版本，第一个是Pytorch版本，下载地址如下：点这里下载，第二个是mxnet版本，下载地址如下：点这里下载
学习Tensorflow：这个东西还真不好推荐，如果是入门级别的学习，我看过《Tensorflow实战Google深度学习框架》这个确实不错。
学习Caffe，推荐赵永科的《21天实战Caffe》，书籍封面长这样，地址暂时找不到了我找到了分享上来：
深度学习需要的数学知识学习书籍，给大家推荐基本豆瓣评分很高的书：那么是不是说所有的东西都需要掌握呢？在我看来不全是这样，我觉得掌握下面的基本上对于面试和工作够用了。 1、标量，向量，特征向量，张量，点积，叉积，线性回归，矩阵，秩，线性无关与线性相关，范数，奇异值分解，行列式，主成分分析，欧氏空间，希尔伯特空间。 2、不确定性，随机变量，大数定律，联合分布，边缘分布，条件概率，贝叶斯公式，概率密度，墒与交叉墒，期望，最大似然估计，正态分布/高斯分布，伯努利分布，泊松分布，概率论与统计推断，马尔可夫链，判别模型，生成模型。
机器学习：给大家推荐《周志华机器学习》，下载地址为：这里。还有李航《统计学习方法》下载地址为：这里，这两本书分别长这个样子：然后其他朋友推荐的口碑不错的《机器学习实战》也不错，下载地址为：点这里，封面长这样：
深度学习：推荐花书，找不到下载地址，封面如下：

数据集¶

## 目标检测 - PASCAL VOC数据集。 - MSCOCO数据集。 - Google Open Image数据集。 - ImageNet数据集。 - DOTA数据集。这5个数据集都可以在我的推文中看详细介绍，地址如下：https://mp.weixin.qq.com/s/Q5iicpLzHQ1EmUdWI1tcSg

语义分割¶

PASCAL VOC数据集。
MS COCO数据集。
Cityscapes数据集。Cityscapes 是驾驶领域进行效果和性能测试的图像分割数据集，它包含了5000张精细标注的图像和20000张粗略标注的图像，这些图像包含50个城市的不同场景、不同背景、不同街景，以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注。Cityscapes评测集有两项任务：像素级（Pixel-level）图像场景分割（以下简称语义分割）与实例级（Instance-level）图像场景分割（以下简称实例分割）。

标注工具¶

LabelImg LabelImg 是一款开源的图像标注工具，标签可用于分类和目标检测，它是用 Python 编写的，并使用Qt作为其图形界面，简单好用。注释以 PASCAL VOC 格式保存为 XML 文件，这是 ImageNet 使用的格式。此外，它还支持 COCO 数据集格式。
labelme： labelme 是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于 MIT 开源的一款标注工具 LabelMe。labelme支持图像的标注的组件有：矩形框，多边形，圆，线，点（rectangle, polygons, circle, lines, points），支持导出 VOC 格式用于 semantic/instance segmentation和导出 COCO 格式用于 instance segmentation。同时还支持视频标注。

学习路线¶

Opencv图像处理算法->机器学习基础算法->深度学习入门+经典网络->深入到如果检测/分割/人脸识别等方面（学习经典算法包括训练/测试/损失函数等）->考虑部署和算法优化，学习模型裁枝，量化，蒸馏等trick->参加比赛如AI研习社/Kaggle等->发论文，看论文，肝顶会等。如果考虑面试加上刷LeetCode，我自己虽然有很多还没有开始做也有很多没有做好，但是基本是按照这个流程来尝试的，仅仅供参考。

本文总阅读量次