电子书《计算机视觉入门必修手册》
作者刘新伟
地址:网页链接
主要分为四大篇章:
“基础篇”主要介绍如何搭建机器学习乃至深度学习环境,如何使用 Markdown 编写一份的项目说明文档,后简要的介绍了 Python 基础。
“数据篇”首先介绍了如何定制属于自己的数据集,并将MINIST、FASHION-MNIST、Cifar10 与 Cifar100 打包为 HDF5 文件,统一调用接口。接着讨论了如何处理 CASIA 中文手写汉字,提供了编码与解码工具。后,介绍了 COCO API 的使用,同时提供了 对压缩文件的调用接口(即无需解压数据,直接通过 API 获取您想要的数据)。
“工具篇”首先介绍了分布式项目管理工具 Git 的基础知识。然后介绍如何在 Github 构建属于自己的计算机视觉开源项目,同时提供了一份设计开源项目的模板,并告知如何创建属于自己的社区。后,介绍如何从零开始设计计算机视觉软件,提供了一种设计软件的思路,同时介绍了 SymPy 为数值计算提供解决方案。
“案例篇”首先介绍了使用 MXNet 实现猫狗分类器, 利用GluonCV学习Faster RCNN。接着介绍如何利用 Git Submodule 自制一个集数据与API于一身的项目。后介绍了 TensorFlow2 的基础,同时讨论了 TensorFlow2、MXNet 与 Pytorch 之间的区别与联系。