對SEO人員來說,火車頭是常用的採集工具,學會熟練的使用火車頭採集器也會讓SEO人員工作起來事半功倍。下面我來詳細演示火車頭採集器的使用方法。
工具/原料
火車頭採集器(免費版)
方法/步驟
下載安裝火車頭採集器,有付費與免費版,百度查詢下載地址。(這裡不細說)
安裝後,雙擊開啟,進入程式主頁面,新建分組。
選中剛才新建的分組,然後右鍵建立任務。
編輯任務名稱,然後新增要採集的目標頁面連結。
選擇批量/多頁採集
網址採集的規則設定:
注意:採集的量根據自己的需求來改
新增採集規則
進入採集的目標頁面,點右鍵檢視原始碼。找到要採集的文章的標題,然後往上找div,逐個查詢,找到頁面中唯一的一個div,然後複製下來。
同理再找到最後一個div。
這樣做目的是縮小採集目標的範圍。
然後以第一個div開始,最後一個div結尾。
把程式碼複製到對應的選定區,然後可以儲存,先測試一次
測試成功。那麼採集的大致範圍選定了,下面來修改採集規則,讓採集的內容達到我們想要的內容。
先找到內容頁連結的規律,然後去掉不想要的其他程式碼。
然後來進行採集的第二部:內容規則的設定
設定標題替換
標題替換設定好後,測試效果
設定內容部分的替換
去頁面的後臺程式碼,找到文章內容上面唯一的一個div,和文字結尾後面唯一的一個div,然後複製程式碼放到對程式對應的設定框裡。
再設定html程式碼的過濾,留下需要的,去掉不需要的。然後點選確定,儲存,去測試一下。
以上測試成功後,進行最後一步釋出的設定。
在web釋出配置管理,裡面進行配置
主要是配置網站後臺的登陸資訊和要釋出的欄目,然後儲存配置 ,全部儲存,就OK了,可以正式批量採集文章了。
最後檢查文章標題,文章內容是否採集成功。
注意事項
仔細分析,找到前後程式碼標籤。