tensorflow源码编译教程_极简入门TensorFlow C++源码
前一段時間,一直在忙框架方面的工作,偶爾也會幫業(yè)務同學去優(yōu)化優(yōu)化使用TensorFlow的代碼,也加上之前看了dmlc/relay,nnvm的代碼,覺得蠻有意思,也想分別看下TensorFlow的Graph IR、PaddlePaddle的Graph IR,上周五,看代碼看的正津津有味的時候,看到某個數據競賽群里面討論東西,不記得具體內容,大概說的是框架的代碼實現, 有幾位算法大佬說看底層源碼比較麻煩,因為比較早從框架,這塊代碼通常都還能看,問題都不大,和群里小伙伴吹水了半天之后,感覺是可以寫篇如何看TensorFlow或者其他框架底層源碼的勸退文了。
利其器
首先,一定是要找個好工作來看源碼,很多人推薦vs code、sublime,我試過vs code+bazel的,好像也不錯,但是后面做c++適應了clion之后,除了資源要求比較多,還是蠻不錯的,使用c++一般推薦使用cmake來看編譯項目,但是TensorFlow是bazel的,無法直接支持,最開始,這邊是自己寫簡單的cmake,能夠實現簡單的代碼跳轉,但是涉及到比如protobuf之類的編譯過后產生的文件無法跳轉,比較麻煩,不夠純粹,很早之前知道clion有bazel的組件,但是不知道為啥一直搞不通,上周找時間再試了試,發(fā)現竟然通了,使用之后,這才是看tf源碼的真正方式:
首先,選擇合適版本的bazel,千萬不能太高,也不能太低,這里我拉的是TF2.0的代碼,使用bazel 0.24.0剛剛好,切記千萬別太高也比太低, 千萬別太高也比太低,千萬別太高也比太低。

其次,clion上選擇bazel的插件

第三步,./configure,然后按你的意圖選擇合適的編譯配置

第四步,導入bazel項目:File=>Import Bazel Project
經過上面幾步之后,接下來就要經過比較長時間的等待,clion會導入bazel項目,然后編譯整個項目,這個耗時視你機器和網絡而定(順便提一句,最好保證比較暢通的訪問github的網絡,另外由于上面targets:all,會編譯TensorFlow所有的項目,如果你知道是什么意思,可以自己修改,如果不知道的話我先不提了,默認就好,期間會有很多Error出現,放心,問題不大,因為會默認編譯所有的模塊)
經過上面之后,我們就可以愉快的看代碼啦,連protobuf生成的文件都很開心的跳轉啦

極簡版c++入門
TensorFlow大部分人都知道,底層是c++寫的,然后外面包了一層python的api,既然底層是c++寫的,那么用c++也是可以用來訓練模型的,大部分人應該都用過c++或者java去載入frozen的模型,然后做serving應用在業(yè)務系統上,應該很少人去使用c++來訓練模型,既然我們這里要讀代碼,我們先嘗試看看用c++寫模型,文件路徑如下圖:

主要函數就那么幾個:CreateGraphDef, ConcurrentSteps, ConcurrentSessions:
CreateGraphDef 構造計算圖
GraphDef CreateGraphDef() {// TODO(jeff,opensource): This should really be a more interesting// computation. Maybe turn this into an mnist model instead?Scope root = Scope::NewRootScope();using namespace ::tensorflow::ops; // NOLINT(build/namespaces)// A = [3 2; -1 0]. Using Const<float> means the result will be a// float tensor even though the initializer has integers.auto a = Const<float>(root, {{3, 2}, {-1, 0}});// x = [1.0; 1.0]auto x = Const(root.WithOpName("x"), {{1.f}, {1.f}});// y = A * xauto y = MatMul(root.WithOpName("y"), a, x);// y2 = y.^2auto y2 = Square(root, y);// y2_sum = sum(y2). Note that you can pass constants directly as// inputs. Sum() will automatically create a Const node to hold the// 0 value.auto y2_sum = Sum(root, y2, 0);// y_norm = sqrt(y2_sum)auto y_norm = Sqrt(root, y2_sum);// y_normalized = y ./ y_normDiv(root.WithOpName("y_normalized"), y, y_norm);GraphDef def;TF_CHECK_OK(root.ToGraphDef(&def));return def; }定義graph 節(jié)點 root, 然后定義常數變量a (shape為2*2), x (shape為2* 1),然后 y = A * x, y2 = y.2, y2_sum = sum(y2), y_norm = sqrt(y2_sum), y_normlized = y ./ y_norm。代碼很簡潔, 看起來一目了然,
然后是ConcurrentSteps
新建一個session,然后設置10個線程來計算,來執(zhí)行:
std::vector<Tensor> outputs;for (int iter = 0; iter < opts->num_iterations; ++iter) {outputs.clear();TF_CHECK_OK(session->Run({{"x", x}}, {"y:0", "y_normalized:0"}, {}, &outputs));CHECK_EQ(size_t{2}, outputs.size());const Tensor& y = outputs[0];const Tensor& y_norm = outputs[1];// Print out lambda, x, and y.std::printf("%06d/%06d %sn", session_index, step,DebugString(x, y).c_str());// Copies y_normalized to x.x = y_norm;}每次計算之后,x=y_norm,這里的邏輯其實就是為了計算矩陣A的最大eigenvalue, 重復執(zhí)行x = y/y_norm; y= A*x;
編譯:
執(zhí)行結果,前面不用太care是我打印的一些調試輸出:
簡單的分析
上面簡單的c++入門實例之后,可以抽象出TensorFlow的邏輯:
GraphDef這一套,太過復雜,不適合演示如何看TF源碼,建議大家先有一定的基礎知識之后,再看,這里我們摘出一些算法同學感興趣的,比如Square這個怎么在TF當中實現以及綁定到對應操作
2.很明顯看到Square類的定義,其構造函數,接收一個scope還有一個input, 然后我們找下具體實現,如下圖:
3.同目錄下, http://math_ops.cc,看實現邏輯,我們是構造一個名為Square的op,然后往scope里更新,既然如此,肯定是預先有保存名為Square的op,接下來我們看下圖:
4.這里講functor::square注冊到"Square"下,且為UnaryOp,這個我不知道怎么解釋,相信用過eigen的人都知道,不知道的話去google下,很容易理解,且支持各種數據類型;
5.那么看起來,square的實現就在functor::square,我們再進去看看,集成base模板類,且看起來第二個模板參數為其實現的op,再跳轉看看:
 6.最后,我們到達了最終的實現邏輯:operator()和packetOp,也看到了最終的實現,是不是沒有想象的那么難。
更重要一點
看完了上面那些,基本上會知道怎么去看TensorFlow的一些基礎的代碼,如果你了解graph ir這套,可以更深入去理解下,這個過程中,如果對TensorFlow各個文件邏輯感興趣,不妨去寫寫測試用例,TensorFlow很多源碼文件都有對應的test用例,我們可以通過Build文件來查看,比如我想跑下http://client_session_test.cc這里的測試用例

我們看一下Build文件中
這里表明了對應的編譯規(guī)則,然后我們只需要
然后運行相應的測試程序即可
更更重要的一點
上面把如何看TensorFlow代碼的小經驗教給各位,但是其實這個只是真正的開始,無論TensorFlow、MXNet、PaddlePaddle異或是TVM這些,單純去看代碼,很難理解深刻其中原理,需要去找相關行業(yè)的paper,以及找到行業(yè)的精英去請教,去學習。目前網上ml system的資料還是蠻多的,有點『亂花迷人眼』的感覺,也沒有太多的課程來分享這塊的工作,十分期望這些框架的官方分享這些框架的干貨,之后我也會在學習中總結一些資料,有機會的話分享給大家。最后,這些東西確實是很復雜,作者在這塊也是還是懵懵懂懂,希望能花時間把這些內在的東西搞清楚,真的還蠻有意思的。
也歡迎大家關注我的同名微信公眾號 小石頭的碼瘋窩(xiaoshitou_ml_tech),或者通過公眾號加我的個人微信進行討論
總結
以上是生活随笔為你收集整理的tensorflow源码编译教程_极简入门TensorFlow C++源码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android 外文期刊_AndroSi
- 下一篇: 打印机更换感光鼓单元k_SOHO打印机基