《中国人工智能学会通讯》——8.25 基于演化优化的生物网络配准
8.25 基于演化優化的生物網絡配準
生物網絡配準是為了找到不同種群之間不同蛋白質網絡的相似子圖。生物網絡配準可以幫助我們預測蛋白質功能。網絡配準主要分為局部網絡配準和全局網絡配準兩種。局部網絡配準是為了匹配網絡的局部區域,而全局網絡是為了匹配網絡的所有節點。在全局網絡配準中,一個重要的問題是同時匹配網絡結構和生物信息。全局網絡配準被證明是一個 NP 完全問題。
目標函數
以前的算法主要是通過最大化網絡的拓撲相似度,實現生物網絡配準。學者提出了許多拓撲 相 似 度 函 數, 如 edge correctness、 inducedconserved structure 和 symmetric substructurescore。后來通過同時優化節點序列和拓撲相似度提高配準準確率[38] 。通常引入一個參數 α 來調節節點序列和拓撲相似度的權重,類似于下面的形式:
其中, T s 表示網絡拓撲相似度;S s 表示節點序列相似度;α 是介于 0~1 之間的權重。
傳統算法中,需要反復實驗來確定 α 的值。文獻 [39] 的作者將網絡匹配問題建模成一個多目標優化問題,其中 T s 和 S s 作為兩個目標函數。
個體表示
給定兩個網絡 和 ,使得 。網絡 G 1 中的所有節點使用序列 標記。 對于網絡G 2 ,使用一個隨機排列的序列 表示。表示匹配結果,它是由 中的前 n 1個元素組成。
遺傳算子
對于網絡匹配問題,主要有兩種交叉操作。第一種基于 knuths 正則分解和循環分解算法[40] 。這種交叉操作產生的子代可以很好地繼承它們父代大部分的性質。另外一種交叉操作是均勻部分匹配交叉。網絡匹配問題中使用的變異操作一般都非常簡單,如文獻 [39] 中隨機交換一個染色體的兩個元素。
局部搜索
作為一個被廣泛采用的局部搜索算法,爬山法也被用于網絡匹配問題[39] 。在文獻 [39] 中,作者設計了兩種基于爬山法的策略來改善匹配的種群并且增加了目標空間種群的多樣性。在文獻 [41] 中,作者設計了一種新的基于鄰域的局部搜索算法。
總結
以上是生活随笔為你收集整理的《中国人工智能学会通讯》——8.25 基于演化优化的生物网络配准的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在天气预报中应用机器学习
- 下一篇: PC如何接管手机的双因子身份验证 靠的是