アトム-サイト
[ アトム-サイト ] - 管理人さんのページです。
feed-icon RSS2.0   feed-icon Atom
[ php ] 一覧へ
正規表現
管理人さんのブログ 2008-04-02 16:48:24

プログラマーだと正規表現使わずともちょこっとプログラム書けば色々出来てしまうので、今までほとんど正規表現使う事がなかった。

今回、1行で書けそうな処理だったので、勉強しつつ挑戦(プログラムだとその何倍にもなるので…)。

入力された文字列を『空白』と『ダブルクォーテーション』で分割します。
検索エンジンで『blog "atom site"』みたいに入力するそのキーワード取得です(この例だと「blog」「atom site」がキーワード)。

以下、試行錯誤のアレコレです(書き込みの関係上、半角を全角にしてあります)。
動かないのもあります。
$cut_strs = mb_split(’[¥s]’, $in_str);
mb_ereg(”[¥s]”, $in_str, $cut_strs);
preg_match_all(’|”([^”]*)”(?=[¥s,]+)[¥s,]+|U’, $in_str, $cut_strs);
preg_match_all(”|<[^>]+>(.*)</[^>]+>|U”, $in_str, $cut_strs);
preg_match_all(’|<b>(.*)<¥/b>|U’, $in_str, $cut_strs);
preg_match_all(’|a(.*)b|U’, $in_str, $cut_strs);
preg_match_all(’|”(.*)”|U’, $in_str, $cut_strs);
preg_match_all(’/(”[^”]*(?:””[^”]*)*”/u’, $in_str, $cut_strs);
preg_match_all(’/¥¥G(”(?:[^”]|””)*”|[^¥s]*)¥s/u’, $in_str, $cut_strs);
preg_match_all(’/¥¥G(”(?:[^”]|””)*”|[^  ]*)[  ]/u’, $in_str.” ”, $cut_strs);

単純にmb_split()では出来なさそう。
mb_ereg()でなくpreg_match_all()を使うのは処理が早い(らしい)から(//uオプションを使えば、UNICODE対応しているらしい)。

…で、近い正規表現はこれ!
preg_match_all(’/(”(?:[^”]|””)*”|[^  ]*)[  ]/u’, $in_str.” ”, $cut_strs);

preg_match_allは、分割した語句は配列の[1]に入るみたいです。

if($cut_strs[1]) {
foreach($cut_strs[1] as $cut_str) {
 //ダブルクォーテーションが入るので削除します
 $cut_str = preg_replace(’/[”]/u’, ’’, $cut_str);

こんな感じにしました。

それにしても、分かりづらいですねぇ『正規表現』って。
何書いてあるのか、一見して分からない。


※ 『php』に繋がる関連物を 視覚的に探しだせるサイトを作ってみました(よろしければクリックしてみてくださいね)。

 コメント記入者:

 リンク元:
(1) : http://www.google.co.jp/hws/search?hl=ja&q=in_str+php&client=fenrir&adsafe=off&safe=off&lr=lang_ja

 ページ閲覧者数:6人

[ php ] 一覧へ


<< 2009年11月
2009年11月8日(日)
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

 最近の書き込み

打ちっぱなし
  <2009-11-05 13:32:56>
T-01A
  <2009-11-04 13:53:05>
ハイキング
  <2009-11-03 07:25:18>
(*)日産キューブ インパネ
  <2009-10-31 16:44:00>
(*)日産キューブ インパネ
  <2009-10-31 12:43:26>
胃カメラ
  <2009-10-30 12:47:11>
PDA遍歴
  <2009-10-30 11:50:37>
ハゼ釣り
  <2009-10-30 11:41:37>
無線LAN アクセスポイント
  <2009-10-30 08:56:56>
腰痛
  <2009-10-28 09:24:22>


 カテゴリー

おでかけ(67)
サッカー(41)
季節(32)
食べ物(30)
旅(28)
家(28)
映画(26)
地元(25)
DIY(24)
家族(21)
学校(20)
モバイル(20)
生物(20)
健康(18)
Web(17)
風景(17)
ドラマ(17)
通勤(16)
ブログ(14)
Winアプリ(14)
家電(13)
ゲーム(12)
足技(12)
ブラウザ(11)
本(11)
ゴルフ(10)
自転車(10)
Linux(10)
php(9)
 ・ REST SOAP
 ・ ダウンロードできない
 ・ zip
 ・ 画像リサイズ
 ・ 正規表現
 ・ session廃棄
 ・ 価格にカンマ
 ・ php.ini
 ・ アップロードデータのサイズ
javascript(9)
ネットワーク(8)
PCハード(8)
飲み物(8)
会社(8)
感銘映像(6)
税金(5)
空想(5)
VMware(4)
Ruby(4)
データベース(3)
perl(1)