ドットインストール代表のライフハックブログ
今日の正規表現Tips (2008/10/05) \d 0〜9の数字を表す正規表現です。 \D 数字以外を表す正規表現です。 正規表現では小文字が大文字になると反対の意味を持ちます。 ツール 正規表現チェッカー 正規表現Tips集 Tips その1 Tips その2 テキスト編集で役立つ『正規表現のサンプル集』を詳しい説明つきで紹介。 正規表現を使ってテキスト検索&置換して仕事の効率アップを図ろう。 ≪ メニュー ≫ 1.正規表現とはなにか? 2.正規表現を使う準備 3.正規表現サンプル集【検索編】 4.正規表現サンプル集【置換編】 5.正規表現のお勉強と本の紹介 6.エディタの強調表示でテキストに色づけ 7.プログラムで正規表現を使う 8.正規表現サンプルリクエスト
正規表現で、入力された文字が半角英数で構成されているかどうかチェックするぞ。String.matchesメソッドで気軽に正規表現を使おう! /** * 愛のJava256本ノック for Java 5.0 * Javaサンプルソース ver0.2C "StringCheck" * StringCheck.java 「正規表現で入力文字が半角英数かどうかチェック」 * * 2005/09/23 制作:安永ノリカズ * * 【コンパイル&実行方法】 * >javac StringCheck.java * >java StringCheck * 【キーワード】 * 正規表現(regular expression), java.util.regex.Patternクラス, * コマンドラインパラメータ, 配列の長さ(length) * 【試してみよう】 * 郵便番号や電話番号のチェックを行う。 *
シンガポール在住のソフトウェア開発者です。なんだかんだでシンガも4年目突入。仕事もしくは趣味でやっていることをまとめています。 英語のブログは http://atmarkplant.com にあります 文字列を限られたスペースの中で表示する場合, たとえば, Webサイトや携帯電話内, 文字数に加えて全角・半角を意識しなければならない。 全角・半角で, 文字の大きさが違うとともに, 全角半角を組み合わせると, 文字の間のスペースが微妙に違ったりする。記号なども加えると, 一層面倒である。 しかし, 単純にJavaのプログラムで文字数を数えると, String.length() だと全角も半角も同じ文字数を返す ex) str = "ゆきりん"; // All 全角 str2 = "Yuki"; // All 半角 str3 = "第3期生"; // 全角・半
Javaにおける正規表現 Javaには正規表現に関する機能を実現するためのパッケージ java.util.regex があります (Java SDK 1.4 で導入)。 このパッケージにより、強力な正規表現の機能を持つ Perl とほぼ同等の機能が実現されています。 クラス java.util.regex.Pattern が正規表現を表すクラスで、このクラスの matcher メソッドによって、実際にマッチングを行うクラス java.util.regex.Matcher のインスタンスを生成します。 クラス Pattern は new ではなく、compile という static メソッドによりインスタンスを生成します。なお、static メソッドはクラスに属し、インスタンスがなくても呼び出すことができます。通常のメソッド呼び出しは「インスタンス名.メソッド名」ですが、static メソ
MSDN フォーラムで、名前などの入力項目に携帯の絵文字を入力させないように、以下のステップで対応したいという話がありました。 ユーザーのキャリアを判定 キャリア別に入力の絵文字をチェック 絵文字が含まれていればエラー表示 フォーラムでは、このうち 2 番目のステップについて議論があり、自分が提案した方法でうまくいったそうですので、その内容を書いておきます。 ASP.NET の Web アプリのサーバー側のプログラムでは文字列は Unicode で扱われるので、絵文字に該当する Unicode 文字が分かれば、正規表現を使ってチェックできるはずです。 Wikipedia のページ 携帯電話の絵文字 によると、各キャリアの絵文字の Unicode 表現は以下のとおりとのことです。 au: E468-E5DF, EA80-EB88 DoCoMo: E63E-E6A5, E6AC-E6AE, E
携帯電話の絵文字に触れる機会があったので、絵文字にマッチする正規表現を。 絵文字は Unicode の外字領域にある。なので絵文字以外の外字が使われていないという前提があるならば、こうしてしまえばよい。 import re private_use = re.compile(ur'[\uE000-\uF8FF]') これだとあまりにも乱暴なので、以下の Wikipedia 記事を参考に範囲を狭めると、こうなる。 import re _au = ur'\ue468-\ue5df\uea80-\ueb88' _docomo = ur'\ue63e-\ue6a5\ue6ac-\ue6ae\ue6b1-\ue6ba\ue6ce-\ue757' _softbank = ur'\ue001-\ue05a\ue101-\ue15a\ue201-\ue253\ue301-\ue34d\ue401-\ue44
なんだかすごいタイトルだなw 今日絵文字の抽出ロジックを書く機会があったのですが、 思ったより探し物が見つからなかったので記述 間違っていたら教えてください。 ■絵文字領域(docomo) sjis:[\xF8\xF9][\x40-\x7E\x80-\xFC] utf8:\xEE[\x98-\x9D][\x80-\xBF]■絵文字領域(au) sjis:[\xF3\xF4\xF6\xF7][\x40-\x7E\x80-\xFC] utf8:(?:\xEE[\xB1-\xB3\xB5\xB6\xBD-\xBF]|\xEF[\x81-\x83])[\x80-\xBF]■絵文字領域(softbank) sjis:[\xF7\xF9\xFB][\x41-\x7E\x80-\x9B\xA1-\xFA] utf8:\xEE[\x80\x81\x84\x85\x88\x89\x8C\x8D\x90\x9
UTF-8なフォームから送られてくる絵文字のUTF-8コード正規表現 (iモード・EZweb・SoftBank・Emobile全部) (?:\xEE[\x80\x81\x84\x85\x88\x89\x8C\x8D\x90\x91\x94\x98-\x9D\xB1-\xB3\xB5\xB6\xBD-\xBF]|\xEF[\x81-\x83])[\x80-\xBF] EZwebの公式UnicodeのUTF-8だけの場合 \xEE[\x91-\x97\xAA-\xAE][\x80-\xBF] 全部ひっくるめると、 (?:\xEE[\x80\x81\x84\x85\x88\x89\x8C\x8D\x90-\x9D\xAA-\xAE\xB1-\xB3\xB5\xB6\xBD-\xBF]|\xEF[\x81-\x83])[\x80-\xBF] でいいか。
UTF-8 if(preg_match("/^[ァ-ヾ]+$/u",$str)){ echo "カタカナのみです"; }else{ echo "カタカナのみではありません"; } UTF-8 コード表記 if(preg_match("/^(¥xe3¥x82[¥xa1-¥xbf]|¥xe3¥x83[¥x80-¥xbe])+$/u",$str)){ echo "カタカナのみです"; }else{ echo "カタカナのみではありません"; } UTFでは、修飾子『 u 』をつけないと、「ダ」を認識できないことがあります。 (修飾子『 i 』などをあわせてつけたとき) EUC-JP コード表記 if(preg_match("/^(¥xa5[¥xa1-¥xf6]|¥xa1[¥xb3¥xb4¥xbc])+$/",$str)){ echo "カタカナのみです"; }else{ echo "カタカナのみ
Struts1.3.5のMaskValidatorでまとめてたけど、改めてまとめてみた。よく使いそうなものだけを選抜。正規表現無敵説を感じる。 チェックはEclipseのQuickRExを使っている。Windpowsについている文字コード表をもとに調べた。文字コードはUnicode。 机に一冊 こういう本は一札持っておきたいところ。 半角英字 https://gist.github.com/daipresents/119881443e690c492a0d7b5deb6e1e1d.js?file=gistfile1.txt ex => abcdefghijklmnopqrstuvwxyz 半角数字 https://gist.github.com/daipresents/119881443e690c492a0d7b5deb6e1e1d.js?file=gistfile2.txt ex => 0
正規表現 表記意味例結果 .1文字ワイルドカードA.CAAC、ABC、ACC、AC等 .*複数 . が続く.*A.*BBBBABB、BBBBA、ABBB、A等 c*cの文字が続くc*AccccA、ccA、cA、A等 c+cの文字が1文字以上c+AcA、cccA等。Aはダメ .+空白以外A.+ABCD、AAA、AE等。A BCD、A AA、A等はダメ c?cの文字が1文字、もしくは無しMAC ?OSMACOS、MAC OS c|d(or記号)cかdどちらか(A|B)CAC、BC (c|d)?cかdどちらか、もしくは無し(A|B)?CAC、BC、C [cde][]内のどれか一つ[cde]AcA、dA、eA [0-9A-Za-z]数字とアルファベット[0-9A-Za-z]0、5、e、H、U等 []cde]cde]の内どれか[]cde]A]A、cA、dA、eA [.*].か*文字A[.*]BA.B
正規表現とは、ある特定の文字列ではなく、文字列の一部をパターン化して表現する手法をいいます。 複数行ある文章の中から文字列を検索する時に、検索したい文字列すべてを指定するのではなく、文字列の任意の一部を置き換え可能な状態にして検索をする場合に正規表現を用います。 たとえば、UNIXやWindowsでは、文字列を検索するときに使用される正規表現として、「*」を任意の文字列(空き文字も含む)に、「?」を任意の1文字として使用することができます。パターンを、app* と表現すると、 apple application appeal などの文字列がマッチすることになります。 この正規表現の方法は、当然ながらプログラム言語ごとに異なりますが、Perlの場合は他の言語に比べて非常に強力な正規表現によるパターンマッチ機能を備えており、より詳細にかつ容易にパターンマッチを行うことができるとされています。
一定期間更新がないため広告を表示しています
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く