中關村在線 02/21/06 16:22:39
作者:王凱 陽光2005
上網瀏覽網頁,保存資料成了不少網蟲每天的必修課。有的時候會遇到各種棘手問題,如網頁不允許「另存為」,複製的文本粘貼時會出現多餘字元等等。這些問題可能困擾著不少朋友,於是乎小編安排了這樣一篇文章,希望能夠起到拋磚引玉的作用。OK,準備好了么,Let's GO。
一、去偽存真留文本
在一些優秀的論壇或網頁中看到自己很感興趣的內容,當然要保存下來。但是有些論壇由於版權等原因,為了防止網友隨意複製,會做一些手腳。比如「http://nettu.net/cgi-bin/topic.cgi?forum=6&topic=542&show=0」,看起來沒什麼,但如果選中其中的文字,就會發現原來裡面隱藏著與背景顏色同色的無用字元(如圖1)/如果我們想複製其中的代碼或帖子內容,會將許多無用的東西一起複制過來。如何解決這個問題?
去偽存真留文本
1.如此輕鬆――原來註冊就可以
很多論壇和站點都和本例相似,對沒有註冊的用戶萬般刁難。只要註冊后登陸,一切煩惱一掃而光!如果註冊了仍然不行,請繼續看下文。
2.複雜內容――找工具來幫忙
如果要複製的內容較多,而且其中有很多空行,上面的方法就顯得捉肘見襟了。可以嘗試使用下面的方法:
(1)Word處理很輕鬆
首先將你需要的內容全部複製下來,當然擺脫不了其中的無用字元了。打開Word,將複製的內容粘貼。選擇「編輯→替換」命令,在替換對話框中,點「高級」按鈕,然後在「格式」中選擇「字體」(如圖2),在「字體顏色」中選擇網頁背景顏色(本例中是白色)(如圖3),點「確定」。在「搜索範圍」中選「全部」,然後再點「全部替換」按鈕。關閉替換對話框,無用的字元是不是已經沒有了!
Word處理很輕鬆
調節顏色
(2)文字識別也拿手
如果系統中沒有安裝Word,僅僅為了簡單的複製去弄個Office,未免有些興師動眾。其實我們還可以通過迂迴戰術把它複製下來。這裡我們需要另一個小工具――Mini Ocr漢字顯示字體識別軟體。
小提示
《文萃》6期雜誌《「迷你」OCR幫你找出PDF中的漢字》一文介紹了Mini Ocr的使用方法,另外6期光碟中已經收錄該軟體。
首先把需要的內容捕捉下來,如果文章很短,則鍵盤上的PrintScreen鍵就完全可以勝任了。如果文章較長,可以用PrintScreen鍵分多次捕捉,或使用HyperSnap-DX等專業截圖軟體進行截取。
接著要對捕捉的圖片進行簡單的處理。我們只需要保留文章內容,其它的所有無用信息都可以切走,然後將這幅圖保存,圖像格式可以是BMP、GIF或者JPG。
運行Mini Ocr,點「打開圖像文件」,選擇剛才處理過的圖像;接著點「文字識別」,軟體自動開始識別。根據文本內容的多少,識別的時間也不盡相同。識別完成之後,會彈出「耗時XXX秒」的對話框。點「確定」,我們需要的東西就在眼前,趕緊點擊「保存結果」把它保存下來吧!
經過以上幾個簡單步驟就得到了我們需要的資料,是不是很爽?
二、搞定頑固網頁
有的時候,對欲保存的網頁點擊「文件→另存為」,會出現「此網頁無法保存」的錯誤提示;或打算選中文章內容複製后粘貼到其它文字處理軟體中(如Word、WPS等),又選不中網頁中的文章內容。怎麼搞定這類網頁呢?點擊「查看→源文件」命令,這時打開一個文本文件,再點擊它的「文件→另存為」命令即可將此網頁保存。
小提示
在另存為對話框中,將「保存類型」設置為「所有文件」,將文件名改為***.html的形式。另外此方法無法保存網頁中的圖片等其他元素。
三、文字複製加速度
很多時候我們將網頁中的文本複製到Word中進行簡單的編輯與排版操作,但在實際複製過程時往往會將網頁中的一些如圖片、表格和各種小圖標等一起複制到Word中,這些無關緊要的東西手工刪除起來非常麻煩,這裡給大家推薦快速複製網頁文本的三種方法。
方法一:打開記事本,將複製的網頁內容粘貼到記事本中,然後再將記事本中的文本複製到Word中,即用記事本作為一個「中轉站」,這樣可以避開圖片、表格和各種小圖標等的複製,提高複製速度和質量。
方法二:先將網頁內容複製下來,打開Word,暫時不進行粘貼操作,在Word菜單欄中選擇「編輯→選擇性粘貼」,在打開的「選擇性粘貼」對話框中選中「無格式文本」,這樣即可自動剔除網頁中的無關圖片、表格和各種小圖標了(如圖4)。
文字複製加速度
方法三:將複製的網頁內容粘貼到Word中,接下來單擊所粘貼網頁右下方的「粘貼選項」工具按鈕,在其下拉菜單中選擇「僅保留文本」選項即可,這樣原粘貼網頁中的無關圖片、表格和各種小圖標等會自動消失。
小提示
如果用戶在Word的文檔編輯區沒有找到那個「粘貼選項」工具按鈕,則可以在Word菜單欄中選擇「工具→自動更正選項」,然後將彈出的對話框切換到「智能標記」選項卡,選中「顯示智能標記操作按鈕」即可(如圖5)。
轉換
http://chinanews.sina.com/tech/2006/0221/16221077959.html