2007-11-19から1日間の記事一覧

URLの抽出

30分プログラム、その186。HTMLからのURL抽出。 上で書いたワンライナーをごにょごにょしたやつ。特にいいネタを思いつかなかったので。変ったのは、 ワンライナーじゃなくなった マジックナンバーがなくなった ソートと重複削除を追加 使い方 $ curl -s htt…

URLの抽出(ワンライナー)

ファイルからURLというかドメイン名だけを抽出するワンライナー。 ruby -ruri -e 'puts $<.read.scan(URI.regexp("http")).map{|x| x[3]}' $ $ echo 'http://howdyworld.org' | ruby -ruri -e '...' $ ruby -ruri -e '...' index.html