當前位置：首頁 > 人文社科 > 生活经验 >内容正文

生活经验

DSO论文

發布時間：2023/11/27 生活经验 45 豆豆

生活随笔收集整理的這篇文章主要介紹了 DSO论文小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

DSO（Direct Sparse Odometry），是慕尼黑工業大學（Technical University of Munich, TUM）計算機視覺實驗室的雅各布.恩格爾（Jakob Engel）博士，于2016年發布的一個視覺里程計方法（期刊論文見[1]，實驗室主頁見Computer Vision Group）。在SLAM領域，DSO屬于稀疏直接法，據論文稱能達到傳統特征點法的五倍速度（需要降低圖像分辨率），并保持同等或更高精度，代碼見：JakobEngel/dso。然而，由于某些歷史和個人的原因，DSO的代碼清晰度和可讀性，明顯弱于其他SLAM方案如ORB、SVO、okvis等，使得研究人員很難以它為基礎，展開后續的研究工作。因此，本文希望從理論和實現層面解讀DSO，嘗試為其他對DSO感興趣的研究人員提供一些有益的思路和觀點。第2節介紹DSO基本框架和流程。第3節介紹滑動窗口內的最小二乘問題、雅可比、邊緣化。第4節介紹光度標定。第5節會給出我個人對DSO的一些評述。最后列出參考文獻。DSO相關的實驗、比較結果，請參見作者原始論文，在此不作敘述。
以下是本文的提綱：

提綱

概述
流程框架
滑動窗口
光度標定
評述

概述

DSO屬于稀疏直接法的視覺里程計。它不是完整的SLAM，因為它不包含回環檢測、地圖復用的功能。因此，它不可避免地會出現累計誤差，盡管很小，但不能消除。DSO目前開源了單目實現，雙目DSO的論文已被ICCV接收，但目前未知是否開源。

DSO是少數使用純直接法（Fully direct）計算視覺里程計的系統之一。相比之下，SVO[2]屬于半直接法，僅在前端的Sparse model-based Image Alignment部分使用了直接法，之后的位姿估計、bundle adjustment，則仍舊使用傳統的最小化重投影誤差的方式。而ORB-SLAM2[3]，則屬于純特征法，計算結果完全依賴特征匹配。從方法上來說，DSO是新穎、獨樹一幟的。

直接法相比于特征點法，有兩個非常不同的地方：

特征點法通過最小化重投影誤差來計算相機位姿與地圖點的位置，而直接法則最小化光度誤差（photometric error）。所謂光度誤差是說，最小化的目標函數，通常由圖像之間的誤差來決定，而非重投影之后的幾何誤差。
直接法將數據關聯（data association）與位姿估計（pose estimation）放在了一個統一的非線性優化問題中，而特征點法則分步求解，即，先通過匹配特征點求出數據之間關聯，再根據關聯來估計位姿。這兩步通常是獨立的，在第二步中，可以通過重投影誤差來判斷數據關聯中的外點，也可以用于修正匹配結果（例如[4]中提到的類EM的方法）。

由于這個原因，DSO一直求解一個比較復雜的優化問題，我們很難將它劃分為像特征點法那樣一步一步的過程。DSO甚至沒有“匹配點”這個概念。每一個三維點，從某個主導幀（host frame）出發，乘上深度值之后投影至另一個目標幀（target frame），從而建立一個投影殘差（residual）。只要殘差在合理范圍內，就可以認為這些點是由同一個點投影的。從數據關聯角度看，在這個過程中并沒有a1-b1, a2-b2這樣的關系，也可能存在a1-b1, a2-b1, a3-b1這樣的情況。但是DSO并不在意這些，只要殘差不大，我們就看成是同一個點。這是很重要的一點。在特征點法中，我們可以找到一個地圖點分別在哪些幀中被看到，乃至找到各幀中的圖像描述子是什么；但在DSO中，我們會嘗試把每個點投影到所有幀中，計算它在各幀中的殘差，而并不在意點和點之間的一一對應關系。

從后端來看，DSO使用一個由若干個關鍵幀組成的滑動窗口作為它的后端。這個窗口在整個VO過程中一直存在，并有一套方法來管理新數據的加入以及老數據的去除。具體來說，這個窗口通常保持5到7個關鍵幀。前端追蹤部分，會通過一定的條件，來判斷新來的幀是否可作為新的關鍵幀插入后端。同時，如果后端發現關鍵幀數已經大于窗口大小，也會通過特定的方法，選擇其中一個幀進行去除。請注意被去除的幀并不一定是時間線上最舊的那個幀，而是會有一些復雜條件的。

后端除了維護這個窗口中的關鍵幀與地圖點外，還會維護與優化相關的結構。特別地，這里指Gauss-Newton或Levenburg-Marquardt方法中的Hessian矩陣和b向量（僅先驗部分）。當我們增加新的關鍵幀時，就必須擴展H和b的維度；反之，如果需要去掉某個關鍵幀（以及它攜帶的地圖點）時，也需要降低H和b的維度。這個過程還需要將被刪掉幀和點的信息，轉移到窗口內剩余幀當中，這一步被稱為邊緣化（Marginalization）。

由于直接法需要比較圖像信息，其結果容易受光照干擾。于是，DSO提出了光度標定，認為對相機的曝光時間、暗角、伽馬響應等參數進行標定后，能夠讓直接法更加魯棒。對于未進行光度標定的相機，DSO也會在優化中動態估計光度參數（具體來說，是一個仿射變化的參數，記作a和b）。這個過程建模了相機的成像過程，因此對于由相機曝光不同引起的圖像明暗變化，會有更好的表現。但是，如果由于環境光源發生變化，光度標定也是無能為力的。

2. 框架流程

2.1 代碼框架與數據表示

現在我們來看DSO的大體框架。我去除了一些不重要的類和結構，方便讀者閱讀。

DSO整體代碼由四個部分組成：系統與各算法集成于src/FullSystem，后端優化位于src/OptimizationBackend，這二者組成了DSO大部分核心內容。src/utils和src/IOWrapper為一些去畸變、數據集讀寫和可視化UI代碼。先來看核心部分的FullSystem和OptimizationBackend。

如上圖上半部分所示，在FullSystem里，DSO致力于維護一個滑動窗口內部的關鍵幀序列。每個幀的數據存儲于FrameHessian結構體中，FrameHessian即是一個帶著狀態變量與Hessian信息的幀。然后，每個幀亦攜帶一些地圖點的信息，包括：

pointHessians是所有活躍點的信息。所謂活躍點，是指它們在相機的視野中，其殘差項仍在參與優化部分的計算；
pointHessiansMarginalized是已經邊緣化的地圖點。
pointHessiansOut是被判為外點（outlier）的地圖點。
以及immaturePoints為未成熟地圖點的信息。

在單目SLAM中，所有地圖點在一開始被觀測到時，都只有一個2D的像素坐標，其深度是未知的。這種點在DSO中稱為未成熟的地圖點：Immature Points。隨著相機的運動，DSO會在每張圖像上追蹤這些未成熟的地圖點，這個過程稱為trace——實際上是一個沿著極線搜索（2D-2D可得到點的深度坐標哦）的過程，十分類似于svo的depth filter。Trace的過程會確定每個Immature Point的逆深度和它的變化范圍。如果Immature Point的深度（實際中為深度的倒數，即逆深度）在這個過程中收斂，那么我們就可以確定這個未成熟地圖點的三維坐標，形成了一個正常的地圖點。具有三維坐標的地圖點，在DSO中稱為PointHessian。與FrameHessian相對，PointHessian亦記錄了這個點的三維坐標，以及Hessian信息。與很多其他SLAM方案不同，DSO使用單個參數描述一個地圖點，即它的逆深度。而ORB-SLAM等多數方案，則會記錄地圖點的x,y,z三個坐標。逆深度參數化形式具有形式簡單、類似高斯分布、對遠處場景更為魯棒等優點[5]，但基于逆深度參數化的Bundle adjustment，每個殘差項需要比通常的BA多計算一個雅可比矩陣。為了使用逆深度，每個PointHessian必須擁有一個主導幀（host frame），說明這個點是由該幀反投影得到的。

于是，滑動窗口的所有信息（策略的改進也是作者想法中比較經典的處理方式），可以由若干個FrameHessian，加上每個幀帶有的PointHessian來描述。所有的PointHessian又可以在除主導幀外的任意一幀中進行投影，形成一個殘差項，記錄于PointHessian::residuals中。所有的殘差加起來，就構成了DSO需要求解的優化問題。當然，由于運動、遮擋的原因，并非每個點都可以成功地投影到其余任意一幀中去，于是我們還需要設置每個點的狀態：有效的/被邊緣化的/無效的。不同狀態的點，被存儲于它主導幀的pointHessians/pointHessianMarginalized/PointHessiansOut三個容器內。

除此之外，DSO將相機的內參、曝光參數等信息，亦作為優化變量考慮在內。相機內參由針孔相機參數fx, fy, cx, cy表達，曝光參數則由兩個參數a,b描述。這部分內容在光度標定一節內。

后端優化部分單獨具有獨立的Frame, Point, Residual結構。由于DSO的優化目標是最小化能量（energy，和誤差類似），所以有關后端的類均以EF開頭，且與FullSystem中存儲的實例一一對應，互相持有對方的指針。優化部分由EnergyFunctional類統一管理（具有全局優化的功能）。它從FullSystem中獲取所有幀和點的數據，進行優化后，再將優化結果返回。它也包含整個滑動窗口內的所有幀和點信息，負責處理實際的非線性優化矩陣運算。

2.2 VO流程

每當新的圖像到來時，DSO將處理此圖像的信息，流程如下：

盡管沒有解釋每一步的具體用意，但可以看出DSO的大致流程。從上圖可以簡單總結出DSO的行為：

對于非關鍵幀（主要用于跟蹤），DSO僅計算它的位姿，并用該幀圖像更新每個未成熟點的深度估計；
后端僅處理關鍵幀部分的優化。除去一些內存維護操作（內存的調用在并行運算中是很重要的一個問題Hash列表的引入可以很大程度的提高搜索的效率，從而加快計算的速度，數據的關聯與出棧入棧，語義的加入與詞包的使用可以使得效率得到本質上的提升），對每個關鍵幀主要做的處理有：增加新的殘差項、去除錯誤的殘差項、提取新未成熟點。
整個流程在一個線程內，但內部可能有多線程的操作。

3. DSO詳細介紹

3.1 殘差的構成與雅可比

在VO過程中，DSO會維護一個滑動窗口（里面有一個全局優化的思想，使得結果兼顧效率與速度，策略的不同使得架構有了本質提升），通常由5-7個關鍵幀組成，流程如前所述。DSO試圖將每個先前關鍵幀中的地圖點投影到新關鍵幀中，形成殘差項。同時，會在新關鍵幀中提取未成熟點，并希望它們演變成正常地圖點。在實際當中，由于運動、遮擋的原因，部分殘差項會被當作outlier，最終剔除；也有部分未成熟地圖點無法演化成正常地圖點，最終被剔除。

滑動窗口內部構成了一個非線性最小二乘問題。表示成因子圖（或圖優化）的形式，如下所示：

每一個關鍵幀的狀態為八維：六自由度的運動位姿加上兩個描述光度的參數；每個地圖點的狀態變量為一維，即該點在主導幀（Host）里的逆深度。于是，每個殘差項（或能量項E），將關聯兩個關鍵幀與一個逆深度。事實上，還有一個全局的相機內參數亦參與了優化，但未在此圖中表示。

現在我們來考慮如何計算殘差。這部分推導和LSD-SLAM的會議論文[6]，以及我的書[7]是類似的。如果讀者覺得有困難，可以參照它們。

設相機模型由針孔模型描述，那么內參矩陣為：

設有兩個幀，一個稱為Host，一個稱Target，它們各自到世界坐標的變換矩陣記為?，這二者又可以拆開為旋轉和平移。考慮Host幀中一個像素點：

其中??為該點的像素坐標，這里使用了齊次坐標以方便矩陣運算。同時，該點的逆深度為：

其中??為該點的深度值。那么，這個點在Target幀中的投影為：

注：(i). 為方便起見，我們略去了此公式中的齊次坐標至非齊次的轉換，默認它們是自動轉換的；(ii). 我們定義了中間變量?，即點的世界坐標，以及Host至Target的相對變換。

由此可以定義該點的殘差。設Host和Target的圖像分別是??，那么殘差為：

但是在實現中，DSO會同時估計圖像的光度參數a,b，所以在計算誤差時，會用到去掉光度參數之后的那個值。但是這里我們先不談光度標定部分，所以暫時把?看成原始圖像。

接下來我們要談論雅可比。在完整DSO中，雅可比由三部分組成：

圖像雅可比，即圖像梯度；
幾何雅可比，描述各量相對幾何量，例如旋轉和平移的變化率；
光度雅可比，描述各個量相對光度參數的雅可比；

作者認為，幾何和光度的雅可比，相對自變量來說通常是光滑函數；而圖像雅可比則依賴圖像數據，不夠光滑；所以，在優化過程中，幾何和光度的雅可比僅在迭代開始時計算一次，此后固定不變[1]。而圖像雅可比則隨著迭代更新。這種做法稱為First-Estimate-Jacobian（FEJ），在VIO中也會經常用到[8]。它可以減小計算量、防止優化往錯誤的地方走太多，也可以在邊緣化過程中保證零空間的維度不會降低，后者我們還要在后文繼續談。

下面來看幾何雅可比的具體計算。記??為李代數表示的?，并定義：

根據[7]的推導加一些變化，可知：

再考慮對于Host幀中的逆深度??之雅可比：

顯然：

對于后者，首先記：

那么：

其中下標1表示取第一行，3表示第三行。于是

最后的式子中我們重新把??代回去，使得式子更加簡潔。同理有：

于是得：

接下來考慮殘差相對于相機內參的雅可比，這部分相對于其余部分稍為復雜，我們僅展示殘差對?之導數，其余部分類似可得，因此留給讀者。由于：

該式略去了??的下標，以保持行文簡潔。展開后式，有：

于是：

現在想要求第一行關于??之導數，由鏈式法則：

而

第一項中，由前述，有：

于是

第二項：

因此：

于是，得到了投影點關于??的導數。關于?的結論可類似推出，不再贅述。以上計算均實現于PointFrameResidual::linearize函數。

值得一提的是，在DSO中，每個投影點，除了自身的位置之外，一共提供八維殘差，這是為了更好利用該點的信息。這八維殘差由這個點與周圍幾個點組成的Pattern定義，如下圖所示：

選八個點是為了方便SSE（Super Strong Erection），其實在settings.cpp中還有許多別的Pattern。所以，在DSO的直接法中，我們實際上假設了這八個點在不同圖像中保持灰度不變。并且，它們在優化中共享中間點的深度，所以也不能簡單地看成八個獨立的點。（文中作者用實驗的方法探索出最合適的模版類型，也就是上面這個了）

3.2 滑動窗口的維護與邊緣化

若干和關鍵幀，與它們關聯的地圖點組成的殘差項，構成了整個滑動窗口中的內容。為了優化這些幀和點，我們會利用Gauss-Newton或Levernberg-Marquardt方法進行迭代。在迭代中，所有的殘差項可以拼成一個大型的線性方程：

其中??分別為拼接后的雅可比、權重和殘差，?為整體的優化更新量。左側可以記成：?，即Hessian矩陣。這個矩陣在整個優化過程中都會一直維護于內存中。注意這種做法和ORB-SLAM2是不同的。在ORB-SLAM2的后端中，我們會不停地重構整個優化問題，求解，然后存儲優化后的結果，但這個H矩陣是不會一直存在的。而在DSO中，由于H是一直維護的，所以之后的優化可以利用先前的結果，或者說，先前的優化為下一步提供了先驗（Prior）。但是，為了維護這個H信息，DSO必須手動地增加/刪除每一個幀和點，而不像ORB-SLAM2那樣，可以無視幀和點的變化。

我們知道，H實際上有一個特殊的形狀（箭頭形矩陣，Arrow-like Matrix）[1,7,9]，如下圖所示：

眾所周知，這個形狀是由BA本身的結構導致的。把它的分塊記為：

那么右下角的??是一個對角塊矩陣（因為沒有結構的先驗，即點——點的殘差）。塊的大小取決于地圖點的參數化維度，在DSO中是一維，在ORB-SLAM2中是三維。接下來，在傳統BA中（類似于ORB-SLAM2）的做法是這樣的：

通過圖優化構建這個H；
用高斯消元法（即舒爾補（這個又很復雜的數學推到，簡單的說就是一個補集））將右下角部分消元：

即：

此時方程解耦，于是先解左上部分（維度很小）；再用左上部分的結果解右下部分。

這個過程也稱為邊緣化（Marginalization），此時我們邊緣化掉了所有的點，將他們的信息歸到了位姿部分中，形成了相機位姿部分的先驗。這部分知識，對于每位SLAM研究者來說應當是熟知的。

那么在DSO中，有哪些地方用了邊緣化？

首先，DSO的BA，也和傳統BA一樣，有上述步驟。因此DSO在解BA時，邊緣化了所有點的信息，計算優化的更新量。然而，與傳統BA不同的是，DSO的左上角部分，即公式中的?，并非為對角塊，而是有先驗的。傳統BA中，這部分為對角塊，主要原因是不知道相機運動的先驗，而DSO的滑動窗口，則通過一定手段計算了這個先驗。這里的先驗主要來自兩個部分：

邊緣化某個點時，這個點的共視幀之間產生先驗；
邊緣化某個幀時，在窗口內其他幀之間產生先驗；

這里的“邊緣化”，具體的操作和上面講的邊緣化，是一樣的。也就是說，通過舒爾補，用矩陣的一部分去消元另一部分。然而實際操作的含義卻有所不同。在BA的邊緣化中，我們希望用邊緣化加速整個問題的求解，但是解完問題后，這些幀和點仍舊是存在于窗口中的！而滑動窗口中的邊緣化，是指我們不再需要這個點/這個幀。當它被邊緣化時，我們將它的信息傳遞到了之后的先驗中，而不會再利用這個點/這個幀了！請讀者務必理清這層區別，否則在理解過程中會遇到問題。我們不妨將后者稱為“永久邊緣化”，以示區分。

那么DSO如何永久邊緣化某個幀或點？它遵循以下幾個準則：

如果一個點已經不在相機視野內，就邊緣化這個點；
如果滑動窗口內的幀數量已經超過設定閾值，那么選擇其中一個幀進行邊緣化；
當某個幀被邊緣化時，以它為主導的地圖點將被移除，不再參與以后的計算。否則這個點將與其他點形成結構先驗，破壞BA中的稀疏結構[10]。

在邊緣化的過程，DSO維護了幀與幀間的先驗信息（見EnergyFunctional::HM和bM），并將這些信息利用到BA的求解中去。

3.3 零空間，FEJ

在SLAM中，GN或LM優化過程中，狀態變量事實上是存在零空間（nullspace）的。所謂零空間，就是說，如果在這個子空間內改變狀態變量的值，不會影響到優化的目標函數取值。在純視覺SLAM中，典型的零空間就是場景的絕對尺度，以及相機的絕對位姿。可以想象，如果將相機和地圖同時擴大一個尺度，或者同時作一次旋轉和平移，整個目標函數應該不發生改變。零空間的存在也會導致在優化過程中，線性方程的解不唯一。盡管每次迭代的步長都很小，但是時間長了，也容易讓整個系統在這個零空間中游蕩，令尺度發生漂移。

另一方面，由于邊緣化的存在，如果一個點被邊緣化，那它的雅可比等矩陣就要被固定于被邊緣化之時刻，而其他點的雅可比還會隨著時間更新，就使得整個系統中不同變量被線性化的時刻是不同的。這會導致零空間的降維——本應存在的零空間，由于線性化時刻的不同，反而消失了！而我們的估計也會變得過于樂觀。

DSO作者提出了一個很好的例子以展現這件事情。見下圖。

在這個例子中，我們最小化??，那么顯然??這條曲線就是優化問題的最優解，正好是一維的零空間。但是，如果?和?在不同點上線性化，那么求得的?可能會讓這一維的零空間消失（如圖例），這時最優解變成了一個點。

因此，在DSO實際使用時，僅在優化的初始時刻計算幾何和光度的雅可比，并讓它們在隨后的迭代過程中保持不變，即First-Estimate-Jacobian。FEJ強制讓每個點在同一個時刻線性化，從而回避了零空間降維的問題，同時可以降低很多計算量。DSO中的每個地圖點，由前面定義的pattern產生8個殘差項，這些殘差項也會共享FEJ。由于幾何和光度函數都比較光滑，實踐當中FEJ近似是十分好用的。

3.4 其他零散的模塊和算法

除去上述主干以外，DSO還有一些枝節上的算法，例如：

DSO是怎么初始化的？
DSO的CoarseTracker如何估計新幀的位姿？
未成熟點是如何轉換到正常地圖點的？

4. 光度標定

我發現已經有一些文章介紹DSO的光度標定了[11]，所以我考慮不再重復介紹一遍了。如果需要的話我會補上。

5. 評述

DSO的出現將直接法推進到一個相當成熟可用的地位，許多實驗已表明它的精度與魯棒性均優于現在的ORB-SLAM2，而相比之下LSD-SLAM則顯然沒有那么成熟。在我自己的實物相機實驗中，我發現LSD-SLAM很難一次上手即通，而DSO則魯棒的多。

在大部分數據集上，DSO均有較好的表現。雖然DSO要求全局曝光相機，但即使是卷簾快門的相機，只要運動不快，模糊不明顯，DSO也能順利工作。但是，如果出現明顯的模糊、失真，DSO也會丟失。

直接法相比傳統特征點法，最大的貢獻在于，直接法以更整體、更優雅的方式處理了數據關聯問題。特征點法需要依賴重復性較強的特征提取器，以及正確的特征匹配，才能得正確地計算相機運動。在環境紋理較好，角點較多時，這當然是可行的——不過直接法在這種環境下也能正常工作。然而，如果環境中出現了下列情況，對特征點法就不那么友善：

環境中存在許多重復紋理；
環境中缺乏角點，出現許多邊緣或光線變量不明顯區域；

這在實際圖像中很常見，我們以道路環境為例（取自kitti）：

顯然，路面上角點甚少，僅有車道線的起始/終止處存在角點，其他地方紋理不足；天空通常也沒有紋理；路旁欄桿和障礙物重復紋理非常明顯。這些都是特征點法必須面對的問題，所以特征點法通常只能依賴一些車輛、行人、交通告示板來確定明顯的特征匹配，這會影響整個SLAM系統的穩定性。其根本原因在于：無法找到有用的匹配點、或者容易找到錯誤的匹配點。例如，車道線邊緣上的點外觀都非常相似，欄桿附近的點則由于欄桿本身紋理重復，容易出現錯配。

而直接法，如前所示，則并不要求一一對應的匹配。只要先前的點在當前圖像當中具有合理的投影殘差，我們就認為這次投影是成功的。而成功與否，主要取決于我們對地圖點深度以及相機位姿的判斷，并不在于圖像局部看起來是什么樣子。舉個例子，如果用特征法或光流法追蹤某個位于邊緣的像素，由于沿著邊緣方向圖像局部很相似，所以這個匹配或追蹤的結果，可能被計算成此邊緣方向的另一個點——這主要是因為圖像局部的相似性；而直接法的約束則來自更為整體的相機位姿，所以即使單個點無法給出足夠的信息，還可以靠其他點來修正它的投影關系，從而找到正確的投影點。

這是一把雙刃劍。直接法給予我們追蹤邊緣、平滑區塊的能力，但同時也要付出代價——正確的直接法追蹤需要有一個相當不錯的初始估計，還需要一個質量較好的圖像。由于DSO嚴重依賴于使用梯度下降的優化問題求解，而它成功的前提，是目標函數從初始值到最優值之間一直是下降的。在圖像質量不佳或者相機初始位姿給的不對的情況下，這件事情往往無法得到保證，所以DSO也會丟失。

這種做法一個顯而易見的后果是，除非存儲所有的關鍵幀圖像，否則很難利用先前建好的地圖。退一步說，即使有辦法存儲所有關鍵幀的圖像，那么在重用地圖時，我們還需要對位姿有一個比較準確的初始估計——這通常是困難的，因為你不知道誤差已經累計到了多大的程度（所以該法對于重定位與跟蹤丟失具有較差的魯棒性）。而在特征點法中，地圖重用則相對簡單。我們只需存儲空間中所有的特征點和它們的特征描述，然后匹配當前圖像中看到的特征，計算位姿即可。

我們看到，數據關聯和位姿估計，在直接法中是耦合的，而在特征點法中則是解耦的。耦合的好處，在于能夠更整體性地處理數據關聯；而解耦的好處，在于能夠在位姿不確定的情況下，僅利用圖像信息去解數據關聯問題。所以直接法理應更擅長求解連續圖像的定位，而特征點法則更適和全局的匹配與回環檢測。讀者應該明了二者優缺點的來由。

當然DSO也不是萬能的。最容易看到的缺點，就是它不是個完整的SLAM——它沒有回環檢測、地圖重用、丟失后的重定位，而這些在實際場景中往往又是必不可少的功能。DSO的初始化部分也比較慢，當然雙目或RGBD相機會容易很多。如果你想要拓展DSO的功能，首先你需要十分了解DSO的代碼結構。

資料與參考文獻：

[1]. Engel J, Koltun V, Cremers D. Direct sparse odometry[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017.

[2]. Forster, C.; Pizzoli, M. & Scaramuzza, D., SVO: Fast semi-direct monocular visual odometry,Robotics and Automation (ICRA), 2014 IEEE International Conference on,2014, 15-22.

[3]. Mur-Artal, R.; Montiel, J. & Tardós, J. D. ORB-slam: a versatile and accurate monocular slam system,IEEE Transactions on Robotics, IEEE,2015, 31, 1147-1163.

[4]. Bowman, S. L.; Atanasov, N.; Daniilidis, K. & Pappas, G. J. Probabilistic data association for semantic SLAMRobotics and Automation (ICRA), 2017 IEEE International Conference on,2017, 1722-1729.

[5]. Civera, J.; Davison, A. J. & Montiel, J. M. Inverse depth parametrization for monocular SLAM,IEEE transactions on robotics, IEEE,2008, 24, 932-945.

[6]. Engel, J.; Sturm, J. & Cremers, D. Semi-dense visual odometry for a monocular cameraProceedings of the IEEE international conference on computer vision,2013, 1449-1456

[7]. 高翔, 張濤, 劉毅, 顏沁睿, 視覺SLAM十四講：從理論與實踐,電子工業出版社, 2017

[8]. Leutenegger, S.; Lynen, S.; Bosse, M.; Siegwart, R. & Furgale, P. Keyframe-based visual-inertial odometry using nonlinear optimizationINTERNATIONAL JOURNAL OF ROBOTICS RESEARCH,2015, 34:314-334

[9]. Barfoot, T. State Estimation for Robotics: A Matrix Lie Group Approach,Cambridge University Press,2017

[10].?SLAM中的marginalization 和 Schur complement

[11].?DSO之光度標定 - 路游俠 - 博客園

[12]高翔,知乎:半閑居士?

[13]dso詳解 :https://zhuanlan.zhihu.com/p/29177540

[14]:https://zhuanlan.zhihu.com/p/29177540?.

總結

以上是生活随笔為你收集整理的DSO论文的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

论文
DSO

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

生活经验

DSO论文

總結