火车头 采集 java 生成正文_火车头采集器使用教程–采集内容发布规则设置
火車頭采集器使用教程–采集內容發(fā)布規(guī)則設置
前面我們講了怎么尋找網站,以及采集文章鏈接和內容,下面我們就說一下內容發(fā)布相關的設置。
因為我教程里都是設置好的發(fā)布規(guī)則,所以這里我就簡單介紹下各個項目。
如下圖
第一步,我們點擊到內容發(fā)布規(guī)則這里
第二步,點擊web發(fā)布規(guī)則列表后面的加號
第三步,出現了模塊管理(教程總目錄有寫,我們的模塊文件放到火車頭程序下面的\Module\目錄里),選擇wordpress.post這個模塊
第四步,網頁編碼選擇UTF-8(wordpress程序是國外的,國際上一般都是UTF8編碼,國內的一些會是GBK的編碼,比如Discuz論壇程序就有UTF8和GBK兩種安裝包)
第五步,網站地址填入我們網頁的地址后面加上接口文件名,比如你的接口文件名是jiekou.php網站是https://www.baidu.com/那么這個地址就填入https://www.baidu.com/jiekou.php
第六步,登錄方式選擇不登陸,我們的接口文件是免登陸的。
第七步,點擊一下下面的獲取列表,正常的話會或取出來wordpress的文章分類列表。然后選擇一個列表,你選擇哪個列表,采集的文章就發(fā)到哪個列表里。
然后下面配置名隨便寫一個,保存。
然后我們把這個剛保存的發(fā)布配置勾選一下,啟用它。
然后右下角別忘了點擊一下保存,也可以點保存并退出!
總結
以上是生活随笔為你收集整理的火车头 采集 java 生成正文_火车头采集器使用教程–采集内容发布规则设置的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Beyond Compare 3 中文版
- 下一篇: AI Benchmark测试原理、v4测