Editor Tools自設(shè)計(jì)初期就以提升軟件自動化水平為核心目標(biāo),為了實(shí)現(xiàn)無需人工干預(yù)、全天候自動運(yùn)行。經(jīng)實(shí)際驗(yàn)證,Editor Tools能夠長期穩(wěn)定工作,即便以年為單位持續(xù)運(yùn)行也表現(xiàn)可靠。這款免費(fèi)自動化采集工具獨(dú)立于網(wǎng)站系統(tǒng)運(yùn)行,不占用服務(wù)器寶貴的Web處理資源,就可以部署于服務(wù)器環(huán)境,也可以在管理員本地計(jì)算機(jī)上操作。

縮略圖抓取方法
在ET中,用戶就可以從列表頁抓取縮略圖,也可從內(nèi)容頁獲取縮略圖資源。
一、從列表頁獲取縮略圖
1、列表頁中的縮略圖通常用于文章預(yù)覽,可在列表分析環(huán)節(jié)通過“縮略圖標(biāo)記”進(jìn)行抓取

添加標(biāo)記后

2、隨后在“縮略圖數(shù)據(jù)項(xiàng)”中配置相關(guān)參數(shù)。需要注意的是,在ET2版本中,當(dāng)“縮略圖數(shù)據(jù)項(xiàng)”的采集規(guī)則為空時,其取值將自動采用列表分析中“縮略圖標(biāo)記”的抓取結(jié)果。ET3版本則默認(rèn)通過指定模式,選擇數(shù)據(jù)項(xiàng)“列表縮略圖”(即列表分析中“縮略圖標(biāo)記”的抓取結(jié)果)作為縮略圖來源。

由于抓取到的縮略圖一般為圖片地址,需在文件選項(xiàng)中勾選“作為文件網(wǎng)址”。
3、接著配置文件下載設(shè)置

4、最后,務(wù)必在發(fā)布設(shè)置的發(fā)布項(xiàng)窗口中通過數(shù)據(jù)項(xiàng)標(biāo)記為網(wǎng)站縮略圖參數(shù)賦值方能生效

(圖示以WordPress為例,litpic為其縮略圖參數(shù)名稱,其他系統(tǒng)參數(shù)請參閱接口文檔)
5、ET3支持多層列表結(jié)構(gòu),在多層列表中使用“縮略圖標(biāo)記”時,將以最后一次使用該標(biāo)記的抓取結(jié)果作為“縮略圖數(shù)據(jù)項(xiàng)”的最終值

二、從內(nèi)容頁獲取縮略圖
1、列表分析時不使用“縮略圖標(biāo)記”
2、需為“縮略圖數(shù)據(jù)項(xiàng)”設(shè)置采集規(guī)則

3、在采集頁設(shè)置中,將“縮略圖數(shù)據(jù)項(xiàng)”與目標(biāo)網(wǎng)頁關(guān)聯(lián)

4、其余步驟與從列表抓取方式一致
軟件功能
1、方案配置完成后即可全天候自動工作,無需人工參與
2、通過獨(dú)立開發(fā)的接口與網(wǎng)站分離,兼容各類網(wǎng)站系統(tǒng)及數(shù)據(jù)庫
3、靈活強(qiáng)大的采集規(guī)則不僅可抓取文章,還能收集各類結(jié)構(gòu)化信息
4、體積小巧、資源占用低且運(yùn)行穩(wěn)定,非常適合服務(wù)器環(huán)境部署
5、所有規(guī)則支持導(dǎo)入導(dǎo)出,方便資源靈活復(fù)用
6、采用FTP方式進(jìn)行文件傳輸,穩(wěn)定可靠
7、下載與上傳過程支持?jǐn)帱c(diǎn)續(xù)傳
8、具備高速內(nèi)容重構(gòu)能力
軟件特色
1、支持按倒序、順序及隨機(jī)方式抓取內(nèi)容
2、具備自動列表網(wǎng)址生成功能
3、可抓取數(shù)據(jù)分布在不同層級頁面的復(fù)雜網(wǎng)站
4、自由定義采集數(shù)據(jù)項(xiàng),并對每個數(shù)據(jù)項(xiàng)單獨(dú)過濾處理
5、支持分頁內(nèi)容抓取
6、兼容各種格式的文件下載(包含圖片、視頻等多媒體資源)
7、可處理防盜鏈限制的文件資源
8、支持動態(tài)文件地址解析
9、能夠抓取需要登錄才能訪問的頁面內(nèi)容
10、支持關(guān)鍵詞定向采集
11、可設(shè)置敏感詞過濾機(jī)制
12、具備圖片水印添加功能
軟件亮點(diǎn)
1、支持發(fā)布含回復(fù)內(nèi)容的文章,適用于論壇、博客等多種平臺
2、采用與采集數(shù)據(jù)分離的發(fā)布參數(shù)項(xiàng),可自由匹配采集數(shù)據(jù)或預(yù)設(shè)值,極大提升發(fā)布規(guī)則復(fù)用性
3、支持隨機(jī)選擇發(fā)布賬戶
4、支持任意發(fā)布項(xiàng)的語言翻譯功能
5、支持編碼轉(zhuǎn)換與UBB代碼處理
6、文件上傳時可自動按年月日創(chuàng)建目錄結(jié)構(gòu)
7、通過模擬發(fā)布功能可向未安裝接口的網(wǎng)站推送內(nèi)容
8、支持方案定時執(zhí)行
9、具備防HTTP劫持功能
10、支持手動單項(xiàng)目采集與發(fā)布
11、提供詳細(xì)的工作流程監(jiān)控與信息反饋,實(shí)時掌握運(yùn)行狀態(tài)
版本更新
v3.7 更新內(nèi)容
1、新增:采集配置中增加了主列表網(wǎng)址的HTTP Header請求頭設(shè)置項(xiàng)
2、優(yōu)化:采集配置中的主列表網(wǎng)址、下級網(wǎng)址、多層列表網(wǎng)址及采集頁網(wǎng)址均支持新版POST提交格式,更好地兼容POST表單參數(shù)和JSON參數(shù)。原"POST優(yōu)先模式"不再推薦使用,具體用法請參閱幫助文檔
3、優(yōu)化:恢復(fù)有道翻譯API支持(注:因該API轉(zhuǎn)為收費(fèi)服務(wù),需用戶自行注冊有道翻譯賬號)
4、優(yōu)化:增強(qiáng)采集頁兼容性,現(xiàn)可用于調(diào)用第三方網(wǎng)站的API接口