pdf, rss, ruby at June 14th, 2009 by 小影
因為電子書上沒有適合的 RSS Reader ,我寫了一個小程式把 RSS 轉為 PDF。
跟前幾篇一樣假設裝了 Ruby 和 Rubygems ,輸入以下指令:
gem sources -a http://gems.github.com
gem install siuying-rssbook
接著就可以把 RSS 檔案轉為 PDF:
rssbook engadgetchinese.rss engadget.pdf
也可以指定 URL:
rssbook "http://feeds2.feedburner.com/engadgetchinese?format=xml" engadget.pdf
也可使用自定的字型:
rssbook "http://feeds2.feedburner.com/engadgetchinese?format=xml" engadget.pdf "Arial Unicode.ttf"
Posted in Tech | No Comments »
feed, rss, ruby, web at June 7th, 2009 by 小影
話說最近剛買了本電子書,其中一個目標是能在書上慢慢讀 RSS 。一路整理想讀的 feed 時,理所當然地,就遇上了想讀的 feed 不顯示全文的問題。
要是在 PC 上可以使用 greasemonkey script rssget ,但要讓不能執行 greasemonkey 的 client 上就必需要由伺服器方面解決了,於是就開始在 server side 作 fulltext feed 的計畫。
要寫這樣一個 script 也很簡單,基本上只有兩步:1) 把 RSS Feed 的 item 逐個找出來;2) 把每個 item 指向的頁面內容抽出來,放回原本的 Item 中。用 Hpricot 處理非常簡單:
抽取全文通常是用 XPath 或 CSS selector ,這也可以用 Hpricot 解決:
單是這樣本已可滿足需求,但是否可以更簡潔和易維護呢?於是我就造了 fullfeed 這個全文 Feed 的 framework,希望更快幫我做出全文 ...
Posted in Tech | 2 Comments »
development, java, rss, stock at March 2nd, 2006 by 小影
開始用rss後,平時讀網頁的流程改變了。現在一籃子網站有那個更新都可以在Google Desktop/Google Homepage讀到,發現好東西才點擊讀詳情,省下了不少尋找的時間。不過可惜的是總有些有需要RSS版本的網站遲遲沒有這服務,例如港交所的「最新上市公司訊息」。等他們進化到應用rss真是不知要等到何年何月!路是人走出來,既然沒有rss feed就自己動手整一個吧!因此就制作了any2rss:用regular expression把網頁內容分析成rss feed的軟件。除了港交所外,要新增不同網站的支援,只需加一句regular expression和幾個parameter就可以了。
這個hkex feed的基本功能沒問題,只是太多垃圾公司的訊息了,應該要在軟件裏加一個white list/black list filter的功能。另外只能提供標題也有點不便,不過這真沒有簡單的解決方法 -- 看到那篇有興趣才逐一點擊吧。
相關連結
Lastest Listed Companies Information
Posted in Tech | No Comments »