推荐!计算机视觉最适合入门的 8 本教程,算法与实战兼备
點擊上方“AI有道”,選擇“星標”公眾號
重磅干貨,第一時間送達
計算機視覺是人工智能的一個分支,涉及理解數字圖像的內容,如照片和視頻。深度學習在挑戰性的計算機視覺任務上取得了令人印象深刻的進展,并有望取得進一步的進展。
快速熟悉這個領域的最好方法之一就是找一本關于這個主題的書。在這篇文章中,你將發現關于計算機視覺的頂級教科書和編程書籍。
我們開始吧。
Top5?計算機視覺教材
這里的 Top5 教材主要關注一般方法和理論(數學),而不是實際問題和方法(代碼)的應用。我根據在頂尖學校(如麻省理工學院等)的大學課程中的使用情況以及在討論網站(如Quora等)上的建議,收集了一份排名前五的教科書。計算機視覺五大教材如下(排名不分先后):
1. 《Computer Vision: Algorithms and Applications》
作者:Richard Szeliski
出版時間:2010?年
教材主頁:http://szeliski.org/Book/
我喜歡這本書。它為計算機視覺技術的初學者(本科生)提供了廣泛的標準計算機視覺問題的堅實基礎。這本書是由理查德根據他多年在華盛頓大學教授這一課題的經驗編寫的。
目錄:
1. Introduction
2. Image formation
3. Image processing
3. Feature detection and matching
5. Segmentation
6. Feature-based alignment
7. Structure from motion
8. Dense motion estimation
9. Image stitching
10. Computational photography
11. Stereo correspondence
12. 3D reconstruction
13. Image-based rendering
14. Recognition
2. 《Computer Vision: Models, Learning, and Inference》
作者:Simon Prince
出版時間:2012 年
教材主頁:http://www.computervisionmodels.com/
目錄:
1. Introduction
2. Introduction to probability
3. Common probability distributions
4. Fitting probability models
5. The normal distribution
6. Learning and inference in vision
7. Modeling complex data densities
8. Regression models
9. Classification models
10. Graphical models
11. Models for chains and trees
12. Models for grids
13. Image preprocessing and feature extraction
14. The pinhole camera
15. Models for transformations
16. Multiple cameras
17. Models for shape
18. Models for style and identity
19. Temporal models
20. Models for visual words
3. 《Computer Vision: A Modern Approach》
作者:David Forsyth、Jean Ponce
出版時間:2011 年
教材主頁:http://luthuli.cs.uiuc.edu/~daf/CV2E-site/cv2eindex.html
目錄:
Part I. Image Formation
1. Radiometry – Measuring Light
2. Sources, Shadows and Shading
3. Colour
Part II. Image Models
4. Geometric Image Features
5. Analytical Image Features
6. An introduction to Probability
Part III. Early Vision: One Image
7. Linear Filters
8. Edge Detection
9. Filters and Features
10. Texture
Part IV. Early Vision: Multiple Images
11. The Geometry of Multiple Views
12. Stereopsis
13. Affine Structure from Motion
14. Projective Structure from Motion
Part V. Mid-Level Vision
15. Segmentation Using Clustering Methods
16. Fitting
17. Segmentation and Fitting Using Probabilistic Methods
18. Tracking
Part VI. High-Level Vision
19. Correspondence and Pose Consistency
20. Finding Templates Using Classifiers
21. Recognition by Relations Between Templates
22. Aspect Graphs
Part VII. Applications and Topics
23. Range Data
24. Applications: Finding in Digital Libraries
25. Application: Image-Based Rendering
4. 《Introductory Techniques for 3-D Computer Vision》
作者:Emanuele Trucco、Alessandro Verri
出版時間:1998年
目錄:
1. Introduction
2. Digital snapshots
3. Dealing with Image Noise
4. Image Features
5. More Image Features
6. Camera Calibration
7. Stereopsis
8. Motion
9. Shape from Single-image Cues
10. Recognition
11. Locating Objects in Space
A. Appendix
5. 《Multiple View Geometry in Computer Vision》
作者:Richard Hartley、Andrew Zisserman
出版時間:2004年
教材主頁:http://www.robots.ox.ac.uk/~vgg/hzbook/
這是一本相當先進的書(研究生水平)關于計算機視覺的一個專門的主題,特別是關于從多個圖像推斷幾何的問題和方法。
目錄:
1. Introduction
PART 0. The Background: Projective Geometry, Transformations and Estimation
2. Projective Geometry and Transformations of 2D
3. Projective Geometry and Transformations of 3D
4. Estimation – 2D Projective Transformations
5. Algorithm Evaluation and Error Analysis
PART I. Camera Geometry and Single View Geometry
6. Camera Models
7. Computation of the Camera Matrix P
8. More Single View Geometry
PART II. Two-View Geometry
9. Epipolar Geometry and the Fundamental Matrix
10. 3D Reconstruction of Cameras and Structure
11. Computation of the Fundamental Matrix F
12. Structure Computation
13. Scene Planes and Homographies
14. Affine Epipolar Geometry
PART III. Three-View Geometry
15. The Trifocal Tensor
16. Computation of the Trifocal Tensor T
PART IV. N-View Geometry
17. N-Linearities and Multiple View Tensors
18. N-View Computational Methods
19. Auto-Calibration
20. Duality
21. Cheirality
22. Degenerate Configurations
PART V. Appendices
Top3?計算機視覺編程書籍
我已經收集了一個前三大 CV 編程實戰書籍,來自它們在頂級計算機視覺書籍列表中的排名順序和討論網站上的推薦。計算機視覺前三名教材如下(排名不分先后):
6.?《Learning OpenCV 3》
作者:Adrian Kaehler、Gary Bradski
出版時間:2017年
教材源碼:https://github.com/oreillymedia/Learning-OpenCV-3_examples
這本書的重點是教你如何使用opencv庫,也許是首屈一指的開源計算機視覺庫。所有的代碼示例都在C++中,這表明目標受眾是專業的開發人員,他們想學習如何將計算機視覺應用到他們的項目中。
目錄:
1. Overview
2. Introduction to OpenCV
3. Getting to Know OpenCV Data Types
4. Images and Large Array Types
5. Array Operations
6. Drawing and Annotating
7. Functions in OpenCV
8. Image, Video and Data Files
9. Cross-Platform and Native Windows
10. Filters and Convolutions
11. General Image Transforms
12. Image Analysis
13. Histograms and Templates
14. Contours
15. Background Subtraction
16. Keypoints and Descriptors
17. Tracking
18. Camera Models and CAlibration
19. Projection and Three-Dimensional Vision
20. The Basics of Machine Learning in OpenCV
21. StatModel: The Standard Model for Learning in OpenCV
22. Object Detection
23. Future of OpenCV
7.?《Programming Computer Vision with Python》
作者:Jan Erik Solem
出版時間:2012年
教材主頁:http://programmingcomputervision.com/
這是一本實踐性的書,重點是教你如何在python中執行基本的計算機視覺任務,主要是使用PIL庫,盡管也有opencv的基本介紹。
目錄:
1. Basic Image Handling and Processing
2. Local Image Descriptors
3. Image to Image Mappings
4. Camera Models and Augmented Reality
5. Multiple View Geometry
6. Clustering Images
7. Searching Images
8. Classifying Image Content
9. Image Segmentation
10. OpenCV
8.?《Practical Computer Vision With SimpleCV》
作者:Kurt DeMaagd, Anthony Oliver, Nathan Oostendorp, and Katherine Scott
出版時間:2012年
教材主頁:http://simplecv.org/book/
這本書教你如何使用python中的simplecv庫執行基本的計算機視覺操作。
目錄:
1. Introduction
2. Getting to Know the SimpleCV Framework
3. Image Sources
4. Pixels and Images
5. The Impact of Light
6. Image Arithmetic
7. Drawing on Images
8. Basic Feature Detection
9. FeatureSet Manipulation
10. Advanced Features
推薦
最后,從算法理論和代碼實戰兩個角度來說,個人推薦:《Computer Vision: Algorithms and Applications》、《Programming Computer Vision with Python》這兩本書。當然,讀者可以根據自己的實際情況自行選擇。
原文鏈接:
https://machinelearningmastery.com/computer-vision-books/
推薦閱讀
(點擊標題可跳轉閱讀)
完備的 AI 學習路線,最詳細的資源整理!
干貨 | 公眾號歷史文章精選
我的深度學習入門路線
我的機器學習入門路線圖
重磅!AI 有道學術交流群成立啦
掃描下方二維碼,添加?AI有道小助手微信,可申請入林軒田機器學習群(數字?1)、吳恩達 deeplearning.ai 學習群(數字?2)。一定要備注:入哪個群(1 或 2 或 1+2)+ 地點 + 學校/公司 + 昵稱。例如:1+上海+復旦+小牛。?
長按掃碼,申請入群
(添加人數較多,請耐心等待)
?
最新 AI 干貨,我在看?
總結
以上是生活随笔為你收集整理的推荐!计算机视觉最适合入门的 8 本教程,算法与实战兼备的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python开发工程师常见的面试题及答案
- 下一篇: 实现标题条的显示与隐藏