懶人采集器是一款非常實用的網(wǎng)頁信息采集工具,該工具界面整潔、操作簡單、功能強大,有了它,我們就可以采集到自己需要的網(wǎng)頁上的所有信息,零門檻,小白用戶都可使用。
軟件功能
1、零門檻:不懂網(wǎng)絡爬蟲技術,會上網(wǎng),就會采集網(wǎng)站數(shù)據(jù)。
2、多引擎,高速穩(wěn)定:內置高速瀏覽器引擎,還可以切換為HTTP引擎模式運行,采集數(shù)據(jù)更加高效。還內置了JSON引擎,無需分析JSON數(shù)據(jù)結構,可視化選取JSON內容。
3、適用各種網(wǎng)站 :能夠采集互聯(lián)網(wǎng)99%的網(wǎng)站,包括單頁應用Ajax加載等等動態(tài)類型網(wǎng)站。
軟件特色
1、軟件操作簡單,可通過鼠標點擊的方式輕松選取要抓取的內容;
2、支持三種高速引擎:瀏覽器引擎、HTTP引擎、JSON引擎,內置優(yōu)化后的火狐瀏覽器,加上獨創(chuàng)的內存優(yōu)化使瀏覽器采集也可以高速運行,甚至可以快速轉換為HTTP方式運行,享受更高的采集速度!而在抓取JSON數(shù)據(jù)時,同樣可以使用瀏覽器可視化方式,通過鼠標點選需要抓取的內容,完全不需要去分析JSON數(shù)據(jù)結構,使非網(wǎng)頁專業(yè)設計人士也可以輕松抓取需要的數(shù)據(jù);
3、不用分析網(wǎng)頁請求和源代碼,卻支持更多的網(wǎng)頁采集;
4、先進的智能算法,可以一鍵生成目標元素XPATH、自動識別網(wǎng)頁列表、自動識別分頁中的下一頁按鈕……
5、支持豐富的數(shù)據(jù)導出方式,可以導出為txt文件、html文件、csv文件、excel文件,也可以導出到已有的數(shù)據(jù)庫,如sqlite數(shù)據(jù)庫、access數(shù)據(jù)庫、sqlserver數(shù)據(jù)庫、mysql數(shù)據(jù)庫,通過向導的方式簡單映射字段,即可輕松導出到目標網(wǎng)站數(shù)據(jù)庫中。
軟件優(yōu)勢
可視化向導:所有采集元素,自動生成采集數(shù)據(jù)。
1、計劃任務:靈活定義運行時間,全自動運行。
2、多引擎支持:支持多個采集引擎,內置高速瀏覽器內核、HTTP引擎和JSON引擎。
3、智能識別:可自動識別網(wǎng)頁列表、采集字段和分頁等。
4、攔截請求:自定義攔截域名,方便過濾站外廣告,提高采集速度。
5、多種數(shù)據(jù)導出:可導出為Txt 、Excel、MySQL、SQLServer、 SQlite、Access、網(wǎng)站等。