Yahoo PipesでRSSを整形(正規表現) Pinterest編

2015年2月2日

2015年10月5日 追記
Yahoo Pipesの代替サービスですが、情報管理LOG – Yahoo! Pipes終了後の代替サービスを考えるが参考になるかもしれません。

2015年8月2日 追記
Yahoo Pipesは、2015年9月末をもってサービスを終了のアナウンスがありました。

PinterestのRSSをYahoo Pipes(Yahoo.comのカウントが必要)を使いHTMLタグをすべて削除する方法です。

PinterestのRSSは2種類

ユーザのすべてのピンを時系列で取得するRSSフィード
http://pinterest.com/[username]/feed.rss

ユーザの特定のボードのみを取得するRSSフィード
http://pinterest.com/[username]/[board]/rss

個人的な問題点

MacのアプリDay Oneにそのまま取り込むとhtmlタグが入ってしまいエントリーが表示されなくなってしまう。htmlタグをRSSから削除することが必要に。

Yahoo Pipesで正規表現を使用してhtmlタグをすべて削除

Yahoo pipesはデータを整形や統合など様々な加工ができるツールです。
Pipes: Rewire the web – Yahoo(※サービス終了に伴いYahoo pipesへのリンクを削除しました)

Yahoo Pipes

Yahoo Pipes

シンプルに下記の2つのみ。
– Fetch FeedでRSSの内容を取得
– Regex(正規表現)でhtmlタグをすべて削除

下記URLにてご使用下さい(※サービス終了に伴いYahoo pipesへのリンクを削除しました)。URLにRSSのURLを入力し、Run pipeをクリック。適応済みのRSSのURLが生成されます。※URLは「Get as RSS」のリンク部分です。

Regex(正規表現)のメモ

Yahoo PipesのRegex設定

g 繰り返し
s ワイルドカードの「.」が改行ともマッチするようになる
m 改行を含む
i 大文字/小文字の区分無し

文字列の中で指定したタグ内をマッチさせる(改行が無い場合)

<title>(.*?)</title>

文字列の中で指定したタグ内をマッチさせる(改行OK)

<div>((?:.|n)+)</div>

文字列の中のhtmlタグをすべて削除

<("[^"]*"|'[^']*'|[^'">])*>

Pinterest RSS→Day One ワークフロー

  • Pnterestで投稿
  • Pnterest RSS
  • Yahoo Pipes(RSSを整形)
  • IFTTT(RSSを整形してDropboxに)
  • Dropbox
  • Macでプログラムを23:55PMに自動起動しDropboxから各テキストファイルとまとめて1ファイルに。
  • 上記の処理後Day Oneに自動書き込み