RSS 轉 PDF 的小工具

, , at June 14th, 2009 by 小影

因為電子書上沒有適合的 RSS Reader ,我寫了一個小程式把 RSS 轉為 PDF。 跟前幾篇一樣假設裝了 Ruby 和 Rubygems ,輸入以下指令: gem sources -a http://gems.github.com gem install siuying-rssbook 接著就可以把 RSS 檔案轉為 PDF: rssbook engadgetchinese.rss engadget.pdf 也可以指定 URL: rssbook "http://feeds2.feedburner.com/engadgetchinese?format=xml" engadget.pdf 也可使用自定的字型: rssbook "http://feeds2.feedburner.com/engadgetchinese?format=xml" engadget.pdf "Arial Unicode.ttf"

Fullfeed ,一個制作全文 Feed 的 Framework (1)

, , , at June 7th, 2009 by 小影

話說最近剛買了本電子書,其中一個目標是能在書上慢慢讀 RSS 。一路整理想讀的 feed 時,理所當然地,就遇上了想讀的 feed 不顯示全文的問題。 要是在 PC 上可以使用 greasemonkey script rssget ,但要讓不能執行 greasemonkey 的 client 上就必需要由伺服器方面解決了,於是就開始在 server side 作 fulltext feed 的計畫。 要寫這樣一個 script 也很簡單,基本上只有兩步:1) 把 RSS Feed 的 item 逐個找出來;2) 把每個 item 指向的頁面內容抽出來,放回原本的 Item 中。用 Hpricot 處理非常簡單: 抽取全文通常是用 XPath 或 CSS selector ,這也可以用 Hpricot 解決: 單是這樣本已可滿足需求,但是否可以更簡潔和易維護呢?於是我就造了 fullfeed 這個全文 Feed 的 framework,希望更快幫我做出全文 ...

網頁轉RSS

, , , at March 2nd, 2006 by 小影

開始用rss後,平時讀網頁的流程改變了。現在一籃子網站有那個更新都可以在Google Desktop/Google Homepage讀到,發現好東西才點擊讀詳情,省下了不少尋找的時間。不過可惜的是總有些有需要RSS版本的網站遲遲沒有這服務,例如港交所的「最新上市公司訊息」。等他們進化到應用rss真是不知要等到何年何月!路是人走出來,既然沒有rss feed就自己動手整一個吧!因此就制作了any2rss:用regular expression把網頁內容分析成rss feed的軟件。除了港交所外,要新增不同網站的支援,只需加一句regular expression和幾個parameter就可以了。 這個hkex feed的基本功能沒問題,只是太多垃圾公司的訊息了,應該要在軟件裏加一個white list/black list filter的功能。另外只能提供標題也有點不便,不過這真沒有簡單的解決方法 -- 看到那篇有興趣才逐一點擊吧。 相關連結 Lastest Listed Companies Information