Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc
Atitit.論垃圾文件的識別與清理?文檔類型垃圾文件?與api概要設計pa6.doc
?
1.?倆個問題::識別垃圾文件與清理策略1
1.1.?文件類型:pic,doc,v,m?cc,isho?pose,prj,codelib,doc?mana(inputmethod,acc)1
2.?如何識別垃圾文件2
2.1.?體積過小文件2
2.2.?過大文件2
2.3.?清理非文檔類型(doc?docx?txt?html?)的文件2
2.4.?轉換文件類型以及索引html即可2
2.5.?清理重復文件(此結果不能加入指紋庫)2
2.6.?非本類別垃圾文件2
3.?誤刪除的文件專門集中放在xx_manu文件夾中,人工處理2
4.?垃圾圖片文件指紋庫3
4.1.?根據垃圾文件指紋庫(模式結果固化)3
4.2.?根據垃圾文件路徑名稱庫(加快性能比對速度,md5可能比較慢)3
5.?人工識別垃圾圖片策略3
6.?清理策略3
7.?大概每年doc文檔的規模300M3
8.?Code3
8.1.?文件去重4
8.2.?生成垃圾文件指紋庫(by?Md5)4
?
?
?
1.?倆個問題::識別垃圾文件與清理策略
?
1.1.?文件類型:pic,doc,v,m?cc,isho?pose,prj,codelib,doc?mana(inputmethod,acc)
作者::?老哇的爪子?Attilax?艾龍,??EMAIL:1466519819@qq.com
轉載請注明來源:?http://www.cnblogs.com/attilax/
?
2.?如何識別垃圾文件
2.1.?體積過小文件
2.2.?過大文件
?
2.3.?清理非文檔類型(doc?docx?txt?html?)的文件
Pic(gif,jpg,bmp,gif)
Js?
2.4.?轉換文件類型以及索引html即可
2.5.??清理重復文件(此結果不能加入指紋庫)
2.6.?非本類別垃圾文件
搜索×,按照擴展名分組排序
3.?誤刪除的文件專門集中放在xx_manu文件夾中,人工處理
?
4.?垃圾圖片文件指紋庫
4.1.?根據垃圾文件指紋庫(模式結果固化)
4.2.?根據垃圾文件路徑名稱庫(加快性能比對速度,md5可能比較慢)
?
5.?人工識別垃圾圖片策略
不好的isho
不能like的pic
誤刪除的文件專門集中放在isho_manu文件夾中,人工處理
?
?
?
6.?清理策略
生成清理腳本(或者直接java程序模式)
移動到制定文件夾(推薦)
?
?
7.?大概每年doc文檔的規模300M
8.?Code
AtibrowPrj
public?class?ClrerPicClrer?extends?ClrerAbs?{
?
?
public?static?void?main(String[]?args)?{
ClrerPicClrer?c=new?ClrerPicClrer();
c.dir="d:\\ati\\isheo";
//c.GabFileRecongers.add(new?NoPicReconer());
tooMiniPixPicClrerPartImp?ClrerPartImp?=?new?tooMiniPixPicClrerPartImp();
ClrerPartImp.dir=c.dir;
ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";
c.IClrerParts.add(ClrerPartImp);
tooMinSizePicClrerPartImp?tmsc=new?tooMinSizePicClrerPartImp();
tmsc.dir=c.dir;
tmsc.targetDir="d:/ati/tooMinSize_files";
c.IClrerParts.add(tmsc);
?
c.traveDir(c.dir);
System.out.println("--f");
}
?
?
?
8.1.?文件去重
DeduliAbs_ByMoveToNewFolder.java
?
8.2.?生成垃圾文件指紋庫(by?Md5)
?com.attilax.clr.ClrByMd5??-gene?-output_file?"d:\ati\isho_gabFileMd5.txt"?-dir?"d:\ati\gabFilesFingers"
?
?
?
總結
以上是生活随笔為你收集整理的Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 发布程序后显示:未能创建类型
- 下一篇: 2015-12-18 学习心得