python删除重复值所在的行数_python – 在last中删除具有重复值的行
我有一個制表符分隔文件,看起來像這樣
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
ATP13A2
ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
PQLC2
PQLC2
AKR7A2
PQLC2
我希望刪除重復column4值的行.
前三列是坐標,在那些坐標中列出了我們發現的任何內容(在第4欄中),并且對于每個坐標,我希望只有唯一的名稱而不是名稱的重復.
我想要這樣的輸出
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
我嘗試過的事情
sort -k 4 -u file
awk '{if($4==temp1){next;}else{print}temp1=$4}' file
什么都行不通:(
請幫忙
謝謝
總結
以上是生活随笔為你收集整理的python删除重复值所在的行数_python – 在last中删除具有重复值的行的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机无法安装网卡驱动,电脑经验遇到网卡
- 下一篇: 中文分词--词典分词--最长匹配