EvoTalk

15 一月, 2007

Catch Google Suggest Keyword

Posted by: asd In: Code Snippet| Perl| 程式設計 ()

參考Google Suggest script
改為支援查詢中文,重點為中文必須是utf8編碼,url遇到中文需要url encode,也就如%xx%xx%xx型式。輸入5401常用中文字,輸出為每個常用字開頭的關鍵字(utf8編碼)排名

Tags: ,

Releated Posts



1 Response to "Catch Google Suggest Keyword"

1 | EvoTalk » 修正 - Catch Google Suggest Keyword

五月 24th, 2007 at 10:55

Avatar

[...] 之前一篇 「Catch Google Suggest Keyword 」,抓到的熱門中文詞常包含簡體中文,及一些雜七雜八的詞,用人工篩選需要耗費很多的時間及精神。可以透過中文 wiki 將這些熱門詞輸入查詢,若找得到就保留下來,找不到就剔除。底下的 code 和之前那一篇大同小異,多了一道手續將熱門詞送往 wiki 篩選。需注意的是 perl 的 regular expression 的pattrn 如何處理 big5,可參考 JeffHung.Blog – Perl with UTF-8 mode,目前是採用評論的方法 : 呼叫 metaquote 函式將 big5 傳入,傳回值當作 regular expression 的 pattern。 view plain PERL: # gsuggest.pl – Google suggest [...]

Comment Form