-
當前位置:首頁 > 創(chuàng)意學院 > 短視頻 > 專題列表 > 正文
網(wǎng)頁文字抓取工具(網(wǎng)頁文字抓取工具手機版)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于網(wǎng)頁文字抓取工具的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
創(chuàng)意嶺作為行業(yè)內優(yōu)秀的企業(yè),服務客戶遍布全球各地,相關業(yè)務請撥打電話:175-8598-2043,或添加微信:1454722008
本文目錄:
一、找一中文軟件工具:可以保存復制多個網(wǎng)頁信息,一次粘貼到WORD文檔
軟件太多了:
1. WebZip 7.03 中文語言包
WebZip 把一個網(wǎng)站下載并壓縮到一個單獨的 ZIP 文件中,可以幫您將某個站臺全部或部份之資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個網(wǎng)站。且新一版的功能包括可排定時間來下載,亦加強相當漂亮的立體界面及傳輸?shù)那€圖。
2. 網(wǎng)站全額下載器 2002
“網(wǎng)站全額下載器”是一個離線瀏覽的最佳工具。只要幾分鐘就可以將一個網(wǎng)站全部下載。包括網(wǎng)站內的圖片、文字、程序、軟件.....等。所以這也是研究別人網(wǎng)站的最好幫手。
3. WebZip 7.0.3
WebZip 把一個網(wǎng)站下載并壓縮到一個單獨的 ZIP 文件中,可以幫您將某個站臺全部或部份之資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個網(wǎng)站。且新一版的功能包括可排定時間來下載,亦加強相當漂亮的立體界面及傳輸?shù)那€圖。
4. 離線瀏覽助理Webdup 0.93 Beta
Webdup能夠把您想要瀏覽的信息(如網(wǎng)頁和圖片等)預先下載下來,保存在本地硬盤,使您可以從本地進行離線瀏覽,這樣不僅可以大大減少上網(wǎng)時間,降低上網(wǎng)費用,還可以加快瀏覽速度;并且將來無須上網(wǎng)就可以很方便地查閱這些信息。不僅如此, Webdup更提供了備份歷次下載記錄和比較完善的管理功能,使您能夠方便地分類保存和管理有價值的下載信息。 Webdup的當前版本實現(xiàn)了以下功能:1.支持HTTP和FTP下載,并支持HTTP和Socks5代理服務器;2.支持多線程下載;3.支持斷點續(xù)傳;4.可按URL和文件后綴名設置過濾,只下載所需文件;5.自動識別下載過的文件是否更新過,減少重復下載;6.可設置定時下載和定時停止;7.支持自動撥號和自動掛斷;8.可導出和導入項目文件,方便用戶交換網(wǎng)上資源;9.提供與瀏覽器(IE)的整合,方便快速地創(chuàng)建項目;10.支持項目和類別的拖拽操作,方便用戶分類管理項目;11.能自動識別操作系統(tǒng)的語言,按需顯示中文或英文。
5. WebZip 7.0.0.1025 漢化版
WebZip 是把一個網(wǎng)站下載并壓縮到一個單獨的 ZIP 文件中,可以幫您將某個網(wǎng)站全部或部份資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個網(wǎng)站。且新一版的功能包括可預定時間來下載,亦加強相當漂亮的立體界面及傳輸?shù)那€圖。 此版本是直接漢化程序文件,不同于漢化語言文件,漢化較徹底,但仍然有極個別字符沒能徹底漢化,但不影響使用。因為是漢化的程序文件,在漢化中對程序界面做了大量優(yōu)化和美化工作。安裝中可選擇安裝中文版本或英文版本,并可以選擇是否注冊軟件。
6. 木馬專殺大師 2.6
本軟件采用了先進的程序行為智能判斷技術。軟件通過分析每個程序的機理來判斷木馬,不需要木馬的特征碼,可查殺未知木馬。實時掃描內存中的每個程序,一旦發(fā)現(xiàn)木馬,即時查殺。強力保障您的計算機、網(wǎng)絡游戲帳號、QQ和郵箱帳號等不被木馬侵害。 目前查殺病毒木馬的軟件基本都是采用了特征碼查殺技術,也就是說用戶要不斷的下載和更新病毒木馬庫才能查殺最新的木馬。這種方法的弊端很明顯,因為每天都有新的木馬出現(xiàn),一旦木馬庫更新不及時,用戶就面臨著危險。而且軟件的廠商也肯定不能把所有的病毒木馬庫找全。所以很多用戶雖然安裝了這些安全軟件,帳號還是經(jīng)常被木馬竊取。因此一款好的木馬查殺軟件必不可少。
7. Teleport Pro 1.40
Teleport Pro所能做的,不僅僅是離線瀏覽某個網(wǎng)頁(讓你離線快速瀏覽某個網(wǎng)頁的內容當然是它的一項重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時間自動登錄到你指定的網(wǎng)站下載你指定的內容,你還可以用它來創(chuàng)建某個網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。
8. Weblinky 1.12簡體中文版
WebSlinky可以把站點拷貝到你的計算機里,你可以在方便的時候離線讀取,不必等待下載的時間。此程序提供了一個簡單的界面,使你能夠進入你希望緩存到計算機中的站點地址(URL)中去。它還提供了WebSlinky保存站點文件的本地文件夾的路徑和名字以及用戶名和口令(如果站點要求).Name:CZY Code:1010107261
9. 網(wǎng)絡蜘蛛 1.0
網(wǎng)絡蜘蛛是一個自動搜索 HTML 頁面并下載指定文件的軟件。最初設計它是為了下載網(wǎng)站上的圖片,想想看,面對那些動輒擁有數(shù)百幅圖片的網(wǎng)站,你是否有耐心和時間一一點擊查看和下載?而且在目前上網(wǎng)費用如此高昂的年代,在網(wǎng)站上慢慢地手工瀏覽和下載圖片是不是太過奢侈了一點?如果你是一個圖片收集愛好者得話,建議你試一試網(wǎng)絡蜘蛛這個軟件。它可以從你指定的地址開始,自動搜索網(wǎng)站并下載圖片或其它軟件。聽起來似乎有點象離線瀏覽器或網(wǎng)站下載軟件是嗎?其實它們還是有些差別的,網(wǎng)絡蜘蛛的設計目標主要是針對圖片等一些比較零碎的、尺寸不是很大的文件的下載,并高度強調自動化工作和高可靠性。
10. WebCHM 2.07.7507
WebCHM(原WebSeizer測試版)是中國最強大的多線程離線瀏覽軟件,專業(yè)的下載大型網(wǎng)站的工具。可以下載整個網(wǎng)站所有的文件,也可以只下載同一個目錄的文件,還可以下載指定的層次。主要特色是可以下載超大型的網(wǎng)站(容量>10GB,文件數(shù)目>100萬的網(wǎng)站),并且內置了CHM壓縮引擎,可以靈活方便地將下載的網(wǎng)頁制作成CHM壓縮文檔。下載大型網(wǎng)站時,可以邊下載邊壓縮到CHM文檔,以節(jié)省空間;下載幾百篇文章的小說時,可以下載后再制作成可以在PDA上閱讀的CHM格式的電子書。支持斷點續(xù)傳、在線升級、分類管理等功能,操作方便,體貼用戶。
11. Offline Explorer 4.1.2347
相當方便使用的離線瀏覽工具,可排定抓取時間、設定Proxy,也可選擇抓取的項目及大小,可自設下載的存放位置、及存放的空間限制。它內置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對于抓取的網(wǎng)站更有MAP的提供、可更清楚整個網(wǎng)站的連結及目錄結構。
12. BlackWidow 5.00 Beta 19
一個非常簡單易用的離線瀏覽器,它能列出你指定的站點的全部文件,你可以選擇需要的文件下載。
13. HTTrack 3.40
一個相當容易使用的脫機閱覽軟件,能將網(wǎng)站傳送到計算機目錄里,并且會將所有相關鏈結重新組織,以方便更順利的脫機瀏覽。
14. Aeria Leech 4.3.3
Leech是一個不錯的離線瀏覽器,能夠多線程下載多個文件。系統(tǒng)要求:IE4.0或更高版本。
15. CopyWebsite 2.43
離線瀏覽工具,僅僅需要輸入需要下載網(wǎng)站的URL,所有的網(wǎng)頁就可以被下載,包括圖像和zip文件。
16. 網(wǎng)頁抓手(FileCatch) 1.07
網(wǎng)頁抓手(FileCatch)是設計來取代IE的另存為菜單的軟件,能夠嵌入到IE的右鍵菜單中后臺形式保存網(wǎng)頁,不打斷瀏覽;此外,F(xiàn)ileCatch僅僅保存網(wǎng)頁而不包括圖象,解決了一存一大堆的現(xiàn)象;FileCatch提供了自動生成一定意義名稱的功能,使你不需要為命名煩惱;FileCatch通過智能補完相對地址到網(wǎng)頁中,解決了保存的網(wǎng)頁超鏈接丟失的現(xiàn)象;FileCatch能夠將網(wǎng)頁依耐的CSS嵌入保存到html文件中,保持網(wǎng)頁的美觀,逼進在線的效果;FileCatch支持對智能選項和代理服務器,使你方便的使用定制;FileCatch是免費軟件,你可以自由的使用。
17. Offline Explorer Pro 4.1.2348
相當方便使用的離線瀏覽工具,可排定抓取時間、設定Proxy,也可選擇抓取的項目及大小,可自設下載的存放位置、及存放的空間限制。它內置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對于抓取的網(wǎng)站更有MAP的提供、可更清楚整個網(wǎng)站的連結及目錄結構。
18. Teleport Ultra 1.40 簡體中文版
Teleport Ultra 所能做的,不僅僅是離線瀏覽某個網(wǎng)頁 (讓你離線快速瀏覽某個網(wǎng)頁的內容當然是它的一項重要功能),它可以從 Internet 的任何地方抓回你想要的任何文件,它可以在你指定的時間自動登錄到你指定的網(wǎng)站下載你指定的內容,你還可以用它來創(chuàng)建某個網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個網(wǎng)頁抓回來慢慢欣賞,如果你也曾像我一樣,費盡千辛萬苦只為了重復抓取同一網(wǎng)站的文件而做一些機械性的動作,Teleport Ultra 簡直是我們的救星!它可以迅速、確實地將整個網(wǎng)站復制在你的硬盤中,為您節(jié)省大筆的上網(wǎng)費用與時間。Teleport Ultra 是著名的離線瀏覽軟件 Teleport Pro 版本的增強版!
19. Teleport Ultra 1.40
Teleport Ultra所能做的,不僅僅是離線瀏覽某個網(wǎng)頁(讓你離線快速瀏覽某個網(wǎng)頁的內容當然是它的一項重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時間自動登錄到你指定的網(wǎng)站下載你指定的內容,你還可以用它來創(chuàng)建某個網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個網(wǎng)頁捉回慢慢欣賞,如果你也曾像我一樣費盡千辛萬苦,只為了重復捉取同一網(wǎng)站的檔案而做一些機械性的動作Teleport Ultra 簡直是我們的救星!它可迅速、確實地將整個網(wǎng)站復制在你的硬碟中,為您節(jié)省大筆的連線費用與時間。Teleport Ultra 是著名的離線瀏覽軟件Teleport Pro版本的增強版!更新記錄:1.新增了一項功能,使得該軟件的Ultra, VLX, Exec, Exec/VLX版可以打開比較小的項目2.新增了可以在UNC卷上運行項目的功能3.在Exec和Exec/VLX版本中新增了API命令4.更新了所有版本的文檔5.改進了腳本,可以處理更多的腳本命令6.改進了規(guī)則引擎7.修正了會取回一些不需要的URL的bug8.重新設置了Ultra版的試用期
20. Offline Explorer Enterprise 4.1.2348
相當方便使用的離線瀏覽工具,可排定抓取時間、設定Proxy,也可選擇抓取的項目及大小,可自設下載的存放位置、及存放的空間限制。它內置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對于抓取的網(wǎng)站更有MAP的提供、可更清楚整個網(wǎng)站的連結及目錄結構。
21. WebCopier 4.3
是一個強大的離線瀏覽器,可以同時對100個文件進行下載。支持代理服務器。內置了強大的搜索功能。
22. Offline Explorer Pro 2.2 漢化版
相當方便使用的離線瀏覽工具,可排定抓取時間、設定Proxy,也可選擇抓取的項目及大小,可自設下載的存放位置、及存放的空間限制。它內置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對于抓取的網(wǎng)站更有MAP的提供、可更清楚整個網(wǎng)站的連結及目錄結構。
23. Grab-a-Site 5.0
這是一個離線瀏覽工具。你可以把喜歡的網(wǎng)站抓到本地硬盤上細細的欣賞甚至包括那些有密碼保護的站點。還有過濾指定站點的功能。
24. Black Widows 4.37
可以讓您建立Web站臺的整個目錄結構并將之儲存以便日后利用,當您下載文件時,依您的選擇進行建立下一個網(wǎng)站結構。您可以選擇下載整個或部份的文件,也提供續(xù)傳功能讓您下載中斷時使用。
25. HTTrack Website Copier for Windows 3.40 Beta 4
HTTrack是一個免費并易于使用的線下瀏覽器工具,它能夠讓你從互聯(lián)網(wǎng)上下載整個網(wǎng)站進行線下瀏覽。瀏覽線下站點和線上并沒有什么不同。HTTrack同樣可以進行線下線上站點同步,支持斷點續(xù)傳。HTTrack是一個可全面配置并包括全面的幫助系統(tǒng)的工具。
26. WebCopier 官方中文語言包
是一個強大的離線瀏覽器,可以同時對100個文件進行下載。支持代理服務器。內置了強大的搜索功能。
27. BackStreet Browser 3.1
BackStreet Browser是個離線瀏覽的好幫手。它的特性是,同時多個執(zhí)行緒對目的網(wǎng)站做存取,充分利用頻寬,不必受到網(wǎng)絡traffic狀況的延遲而拖長等待的時間。對于不想花費時間在無謂的等待的人,BackStreetBrowser是不錯的選擇。
28. SuperBot 4.5
SuperBot幫您將整個網(wǎng)站搬回家SuperBot是個全自動的離線瀏覽軟件,您不需要做太多的設定,便可以將自己想看的網(wǎng)站給整個搬回家!SuperBot與一般的離線瀏覽軟件最大的不同處在于它的操作使用相當簡單,您只要設定好想要下載的網(wǎng)站路徑以及下載網(wǎng)頁存放的路徑,SuperBot便可以自動為您進行網(wǎng)頁下載的工作了,不過這坪要注意的是,如果您想要下載存放的網(wǎng)站相當大的話,您可能要花相當長的時間等待。
29. SuperHTTP 1.0
SuperHTTP是一套離線瀏覽軟件,可以將整個網(wǎng)站按照目錄結構順序、超連結等,完整下載到硬盤離線瀏覽,也可以選擇只下載圖形文件或者其他文件,包括html、txt、pdf、doc、jpg、bmp、gif、png、mpg、mp2、mp3、avi、wav、mid、exe、zip等等,只需在設定中打勾或取消即可,不用一個一個輸入文件類型,允許同時下載多個網(wǎng)站,以及顯示下載進度功能。此外也提供搜尋引擎功能,可輸入關鍵字搜尋所下載的網(wǎng)站來找出所要的文件或資訊。
30. MemoWeb 3.3.05
離線網(wǎng)絡瀏覽器,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁。你可以選擇是下載整個站點的所有的文件,還是下載首頁,或者是某一個部分。同時它還支持下載多媒體文件,例如圖片,聲音,和視頻動畫。支持長文件名,斷點續(xù)傳,支持代理服務器。
31. eCatch 3.0
簡單實用的離線瀏覽器。由使用者設定所要觀看的網(wǎng)址及連結的層數(shù),而直接抓取并建立一個「可瀏覽的連結網(wǎng)頁」到使用者的電腦中,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁,可以監(jiān)視及下載數(shù)以千計的網(wǎng)頁以供離線觀看??勺杂喗M態(tài)抓取網(wǎng)頁中的特殊文件,像是多媒體文件及自解壓縮文件等。
32. WebStripper 2.62
是一個離線瀏覽器,可以快速、準確地將站點下載到你的硬盤中。它的使用非常簡單,而且還提供了多個過濾條件,比如:圖像文件的大小等,另外,它還可以提取新的或是升級的頁面。
33. DISCo Pump 3.1
這是一個離線瀏覽器,具有交互性的界面,獨一無二的文件樹、瀏覽向導圖、頁面圖標、預覽選項。通過它你可以速度地將網(wǎng)頁保存到本地,然后離線慢慢進行瀏覽。
34. GetBot 3.04
GetBot儲存網(wǎng)頁、抓文件兩相宜用GetBot可以很快的將網(wǎng)頁中所有的MP3文件或者圖形文件。你只要將網(wǎng)址貼進GetBot位址列中,GetBot就會完整的顯示出該網(wǎng)站的所有網(wǎng)頁以及文件。然后你只要選取要下載的網(wǎng)頁以及文件,按下get鈕,GetBot就會幫你將所有文件抓回來了。而且GetBot也有續(xù)傳的功能,不怕抓文件抓到一半斷線。GetBot的使用算是很方便,甚至不需要安裝,直接就可以執(zhí)行。
35. 帖子離線瀏覽器 1.2
1.非常靈活:帖子左邊的分類名稱和roomid是根據(jù)xml文件動態(tài)給出的,您可以隨便更改該文件從而顯示不同的內容,正因為這樣,所以他可以適應CSDN的任何改版。2.良好的兼容性:除了CSDN帖子外,通過修改xml配置文件可以適應任何的離線帖子和從網(wǎng)上收集的文章,同時導入選項也是xml個數(shù)的,非常方便擴充。3.綠色軟件,不寫注冊表。4.強大的查找功能,可以查找任何一個論壇或子論壇,而且可以遞歸。
36. 精華瀏覽器(MixBrowser) 1.7 簡體中文版
精華瀏覽器是一款精致的離線瀏覽軟件,她可以幫你保存網(wǎng)頁、圖片和flash動畫,并以網(wǎng)頁的形式瀏覽整理它們,輕松擁有自己的精華區(qū)。有了她你就可以保留那些對自己工作和生活有益的文章、原創(chuàng),精美的圖片和有趣的flash動畫在身邊,使自己從疲勞的搜索再搜索,或“我記得在哪看過一篇文章”的遺憾中解脫出來,只需鼠標一點即刻保存。作為瀏覽器,她更擁有鼠標動作、安全瀏覽和集成搜索、關鍵字加亮等特色功能,讓你的瀏覽更輕松、更舒適。
37. Power Siphon 1.9.6.0
這是個高效能的網(wǎng)絡蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁。并儲存到硬盤以便瀏覽使用。簡單的提供網(wǎng)頁的URL或任何其它開啟的頁面來下載整個網(wǎng)頁,你可以實時觀看下載進度,并且從硬盤中存取所有離線頁面。此程序還提供了一個壓縮已下載網(wǎng)頁成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁面,還包含滾動顯示模式。
38. WebCopy 99 1.7
是一個可以直接將WEB 網(wǎng)頁拷貝儲存的軟件,包括可以拷貝整個網(wǎng)頁、文字、圖像、聲音及電子郵件等等,這樣即可離線觀看網(wǎng)頁。
39. 網(wǎng)絡獵手 2.5
這是一個很好的網(wǎng)上資料收集工具,在瀏覽器中,你可以通過右鍵菜單很方便的收集資料,你可以部分選取保存,也可以全部整頁的保存,而且保存下來的頁面更原來的一樣。并且支持拖拉保存,使你可以將沒有右鍵菜單的頁面很好的進行保存。而且還提供了頁面上一些文檔鏈接(**.zip)的下載功能.下載下來的頁面可以進行分類保存和編輯,并最終可以生成eBook(CHM)和HTML文件。
40. Flash Favorite 1.4.8.5.8
FlashFavori 允許你瀏覽下載到 Internet 臨時目錄中或當前打開的網(wǎng)頁尚的 FLASH 文件。
41. NewsVampire 1.4
本軟件的主要功能是將眾多網(wǎng)站服務器上的網(wǎng)頁快速下載到本地機硬盤上以供離線瀏覽。其特點是采用了多線程循環(huán)下載技術,可自動將數(shù)百個網(wǎng)頁連同圖片自動快速下載并存盤;用戶可以一邊下載,一邊瀏覽已經(jīng)下載的網(wǎng)頁,從而最大限度地利用網(wǎng)絡資源。全中文顯示,支持HTTP代理服務器。
42. CatchTheWeb Express 1.2
CatchTheWeb Express不但是個網(wǎng)頁瀏覽器,而且它還可以讓使用者將網(wǎng)頁從Internet抓取到電腦之中,然后重新組織安排各個網(wǎng)頁的順序、添加注解,而讓這些網(wǎng)頁具有如展示簡報般的用途。只能一次抓取一個單一網(wǎng)頁,所以單單在抓取網(wǎng)頁的功能方面,并沒有離線瀏覽程序那么好用,但是對于網(wǎng)頁資訊的利用方面,卻是一個不錯的簡報輔助軟件。
43. QuadSucker Web 3.1
QuadSucker Web 是一個功能強大的離線瀏覽工具,它可以幫助你完整的將指定的網(wǎng)站中的所有文件和圖片,壓縮包,多媒體視頻或者音頻文件統(tǒng)統(tǒng)下載下來,完全自動化操作,不需要人為的干預就可以輕松完成所有的下載工作 ..
44. Website Extractor 9.30
該軟件可以下載某個網(wǎng)站中符合您指定條件,如關鍵字、文件類型、大小等的文件。
45. JOC Web Spider 3.72
離線瀏覽器, 支持 VBScript & JavaScript。
46. ImageSiteGrabber Pro 2.4.1
可以讓您直接指定要抓取的網(wǎng)頁以及網(wǎng)站位置,然后就可以輕輕松松的將這些圖形文件影像給全部帶回家。提供自動更名的功能。
47. Offline Commander 2.2
Offline Commander是一個網(wǎng)頁抓取工具,支持FILE、HTTP、HTTPS、FTP協(xié)議和Proxy,還可以對抓取回來的網(wǎng)頁資料做關鍵字、網(wǎng)址、標題、內文、文件大小、格式、文件修改日期等檢索設置。
48. NetAttache Pro 2.61
可以設定所要下載的網(wǎng)頁以及要下載的時間,NetAttache pro 會自動的撥接連接到該網(wǎng)站,將你需要的網(wǎng)頁抓回來,然后再自動斷線.它會依照你所設定的網(wǎng)頁「層數(shù)」,將網(wǎng)頁文件抓取回來.當網(wǎng)路擁塞時,它還會自動重試 10 次,并且以每次同時抓取20個文件的超快速度來下載網(wǎng)頁.在下載的文件類型方面,你可以選擇要不要下載影像文件、聲音文件、Java、ActiveX、Plugins等等,甚至你還可以依照副檔名,來設定所要下載的檔案文件。
49. RafaBot 1.5
Rafabot是一個可以協(xié)助你將某站臺復制到自己硬盤上的工具程序。它能以快速且多工的方式將一個大網(wǎng)站內的資料復制到硬盤上。你可以對它直接指定起始URL位址甚至是網(wǎng)頁搜尋引擎的搜尋結果,也可以指定外部連結讓Rafabot程序去為你將整個站臺復制下來。就算你所想復制的資料范圍超過原本網(wǎng)頁的范圍而延伸到其他的網(wǎng)頁去,Rafabot一樣可以將這種狀況處理的很好。在網(wǎng)頁復制下來后,你可以用多種條件去過濾你所找到的資料,讓你從一大堆下載下來的網(wǎng)頁資料中快速找到你所想要的資料。網(wǎng)頁一但下載到你的硬盤后,你就可以在不連接Internet的情況下去讀取這些網(wǎng)頁資料了。
50. HMView 4.04
不錯的離線瀏覽器.像是網(wǎng)頁中的Form, Frame, Image Maps等都可以被完整的抓回來.
51. NewsLook 2.01 build0320
新聞離線瀏覽器,是一個能將互聯(lián)網(wǎng)上的新聞內容快速下載到本地硬盤上,并可進行離線瀏覽的軟件.它不僅具有下載速度快,操作簡便,節(jié)省上網(wǎng)時間等特點,還具有個性化的新聞訂閱和方便的新聞收藏管理功能,她可根據(jù)個人的興趣愛好需要,訂閱自己喜歡的新聞下載類型,并可設立相應的新聞收藏夾,用于管理新聞.而且它還是免費軟件,無需注冊繳費。
52. WebCopier Pro 4.3
是一個強大的離線瀏覽器,可以同時對100個文件進行下載。支持代理服務器。內置了強大的搜索功能。
53. WebRecorder 2.0a
專為下載大文件、網(wǎng)站的一部分或者是整個網(wǎng)站而設計的,它支持斷點續(xù)傳、時間調度等。
54. Personal Internet Engine 3.0.6
離線瀏覽器,可以下載指定網(wǎng)站,并用樹型結構進行顯示,支持進行查找。
55. SurfSaver Pro 2.3
可以專門用來存取一張網(wǎng)頁,并且簡單易用。它可以完好無損地保存網(wǎng)頁,無論是圖片、文字、超級鏈接以及Frame等等的都可儲存在名為*.ask的文件中,所以一張網(wǎng)頁就是一個文件。與眾不同的是,Surfaver支持全文搜索,支持布爾方式和模糊查詢,并且你還可以為你所需要保存的網(wǎng)頁加上標題、注釋和索引,也可把該網(wǎng)頁E-mail給你的朋友,當然前提是他也必須用該軟件來閱讀。
56. SurfOffline 1.4.1
操作簡單的網(wǎng)頁離線瀏覽工具 - SurfOffline,使用它的精靈引導,輸入您所要下載的網(wǎng)站網(wǎng)址,告訴它您所要下載的深度,這個站臺就會下載回來在您的計算機中,下次要瀏覽時,不用聯(lián)機,開啟您所儲存的項目,便可以離線瀏覽,唯一的缺點:不支持 Flash。
57. WebMirror 1.40
WebMirror 可以將網(wǎng)站快速下載到本地,以供脫機瀏覽。它可以提供頁面大小和時間的信息。
58. Site-Thief 1.8.0
一款可以將整個網(wǎng)站內容都下載下來的工具,為用戶提供了下載某個網(wǎng)站的選定部分或全部內容的能力,并將下載的內容儲存在本地硬盤,從而可以離線使用.
59. HTML Converter 2.0
該軟件可以把 IE4、IE5、Netscape 或 Opera 的 Cache 轉換為離線的、可以瀏覽的網(wǎng)頁。
60. HyperMaker HTML Viewer 3000.27
與HyperMaker HTML配套使用的HTML文本查看工具。
61. Power Siphon 1.9.1 Build 24
這是個高效能的網(wǎng)絡蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁。并儲存到硬盤以便瀏覽使用。簡單的提供網(wǎng)頁的URL或任何其它開啟的頁面來下載整個網(wǎng)頁,你可以實時觀看下載進度,并且從硬盤中存取所有離線頁面。此程序還提供了一個壓縮已下載網(wǎng)頁成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁面,還包含滾動顯示模式。
62. WebCapture 1.0
一款 Internet 網(wǎng)絡工具??捎糜跒g覽網(wǎng)頁、生成鏡像網(wǎng)站、下載文件、管理internet鏈接等等??蓪⒄麄€網(wǎng)站備份到本地硬盤的工具,也可根據(jù)需要將網(wǎng)絡鏈接改為指向備份后的本地文件,這樣可以離線時瀏覽備份后的網(wǎng)站。還可以將要發(fā)布的整個網(wǎng)站整合到一個可執(zhí)行文件,這樣就可以在一個整合的瀏覽器里瀏覽你的網(wǎng)頁。
63. WebSlinky 1.13 Build 105
WebSlinky 是一款非常小巧的離線瀏覽的軟件,簡單易用,它可以將你訪問站點的結構復制到你的計算機上。
64. Zip Up The Web Lite 2.0.1
可以把整個網(wǎng)頁完整的儲存起來,含圖及文字部分,又能把抓下來的文件儲存成exe檔,也就是把抓取回來的網(wǎng)頁壓縮成一個exe執(zhí)行檔。所以他比其他的類似軟件更容易傳遞,也比較容易使用。
65. WebVCR 2.16
如同家中的VCR般的離線瀏覽程序,它有一個強大的程序向導帶您如何錄制您所要關看的網(wǎng)頁內容,它并可讓您同時使用多個網(wǎng)站的錄制,完全不受限制。它支援IE2.0及Netscape 2.0以上版本的瀏覽器。
66. Website Extractor 9.30 漢化版
該軟件可以下載某個網(wǎng)站中符合您指定條件,如關鍵字、文件類型、大小等的文件。 Website Extractor 幫你把整個網(wǎng)站搬搬搬…搬回家! 需要離線瀏覽時,你會怎么做?打開 IE,選「儲存完整網(wǎng)頁」的功能?若是需要一個有一千頁的網(wǎng)站呢?儲存一千次嗎?Website Extractor 可以讓你輸入一次網(wǎng)頁 URL,就等著所有的網(wǎng)頁通通下載到硬盤中吧! 推薦人評價 ========== Website Extractor 讓你下載整個網(wǎng)站或是連結。你可以設定下載的條件,免得下載過多的文件: · 包含/不包含特定的關鍵詞 · 指定網(wǎng)域、目錄 · 文件大小、型式、名稱 · 要不要下載圖片等等。 Website Extractor 可以讓你同時下載最多 100 個文件,大幅節(jié)省上網(wǎng)的時間、費用。因為線路品質不好有文件傳不下來嗎?Website Extractor 提供續(xù)傳的功能讓你把沒抓到的文件補回來。 最棒的是,Website Extractor 是完全免費的,沒有討厭的廣告在旁邊煩你! ---------------------------------------------------------------- 漢化說明 ======== 該軟件原本帶有多語言支持,但經(jīng)測試,發(fā)現(xiàn)該功能很不完善,而且遺漏了幾個標準資源的字符串,故本人發(fā)布的為直接修改資源的版本。無需原版。 漢化版相對于原版所作的更改: · 漢化文件:webextra.exe、DDOMAIN.TXT、default.txt; · 在 README.TXT 中添加漢化自述; · 刪除了所有的語言文件; · 去除了主程序菜單中的語言選項; · 添加 XP 主題支持文件 webextra.exe.manifest,一定程度上美化了 XP 系統(tǒng)中的顯示。 P.S. 大家都說這個軟件是免費版,可實際上經(jīng)本人研究,該軟件乃共享軟件泄漏之官方注冊版也。不過不管怎樣,好?/ca>
二、如何批量抓取網(wǎng)頁文字
如果你想要批量的抓取網(wǎng)頁文字,那么首先把當前的頁面所有的元素全部都放在一個數(shù)組當中,然后遍歷這個數(shù)組這個數(shù)組當中,所有的 context屬性全部都設置為另外一個數(shù)組的內容,這樣把另外一個數(shù)組相連接就是所有的文字。
三、python怎么抓取網(wǎng)頁中DIV的文字
1、編寫爬蟲思路:
確定下載目標,找到網(wǎng)頁,找到網(wǎng)頁中需要的內容。對數(shù)據(jù)進行處理。保存數(shù)據(jù)。
2、知識點說明:
1)確定網(wǎng)絡中需要的信息,打開網(wǎng)頁后使用F12打開開發(fā)者模式。
在Network中可以看到很多信息,我們在頁面上看到的文字信息都保存在一個html文件中。點擊文件后可以看到response,文字信息都包含在response中。
對于需要輸入的信息,可以使用ctrl+f,進行搜索。查看信息前后包含哪些特定字段。
對于超鏈接的提取,可以使用最左邊的箭頭點擊超鏈接,這時Elements會打開有該條超鏈接的信息,從中判斷需要提取的信息。從下載小說來看,在目錄頁提取出小說的鏈接和章節(jié)名。
2)注意編碼格式
輸入字符集一定要設置成utf-8。頁面大多為GBK字符集。不設置會亂碼。
四、如何用python實現(xiàn)在爬取到某網(wǎng)頁搜索框中,并輸入文字后,自動搜索信息并抓取
網(wǎng)絡爬蟲只能根據(jù)你指定的url爬取網(wǎng)頁的html代碼,至于你想要包含指定內容的網(wǎng)頁的話,只能先爬取下來網(wǎng)頁,然后在對頁面內容進行匹配(正則,也有開源工具)找到你想要的內容就可以了!順便說一句網(wǎng)絡爬蟲不能根據(jù)關鍵字來爬取網(wǎng)頁!
以上就是關于網(wǎng)頁文字抓取工具相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內容。
推薦閱讀:
如何自己建立一個網(wǎng)頁(如何自己建立一個網(wǎng)頁文檔)
html網(wǎng)頁制作(html網(wǎng)頁制作代碼大全)
問大家
韶關效果好的網(wǎng)頁美工設計目前需要多少錢?各位同志們幫回復下
邳州比較好的網(wǎng)頁美工設計費用多少錢?在座的筒子們幫忙回一下
汕頭值得選擇的網(wǎng)頁美工設計價格預估多少?在座的好基友們急急急
泰興人性化的網(wǎng)頁美工設計大概是多少錢?在座的老鄉(xiāng)們幫回答下
福安著名的網(wǎng)頁美工設計負責人手機號有么?各位老司機們跪求解答
電商設計,網(wǎng)頁設計,影視后期,哪個好,工資待遇高,門檻低點?
工作幾年了,想改行做網(wǎng)頁設計,現(xiàn)在零基礎,打算邊工作邊自學,大概多久可以入門呢?
昆山值得推薦的網(wǎng)頁美工設計哪家口碑好?在座的筒子們幫忙回一下
宿遷口碑好的網(wǎng)頁美工設計公司號碼有么?在座的筒子們幫忙回一下