正規表現に関するasedarumaのブックマーク (2)

  • 正規表現の先読み・後読み

    正規表現の「先読み(lookahead)」「後読み(lookbehind)」について紹介します。 正規表現の「位置へのマッチ」 正規表現は、文字列のパターンマッチに使われます。たとえば [0-9]{4} は数字4つが並ぶ文字列にマッチする表現です。 多くの正規表現は「文字列」にマッチしますが、「文字列」ではなく「位置」にマッチする表現があります。これは、アンカーと呼ばれます。また、長さ0の文字列にマッチすると考えて、ゼロ幅アサーションとも呼ばれます。 アンカーの例として、^(先頭)$(末尾)\b(単語の境界)などがあります。 この例では、cat にはマッチします。一方、category や concat は cat を含みますが前後が単語の境界になっていないためマッチしません。 先読み 先読み(lookahead)は、位置にマッチする記法の一種です。位置の指定に正規表現を使います。(?=

    正規表現の先読み・後読み
    asedaruma
    asedaruma 2022/08/23
    はてなアンテナは昔、更新チェックの正規表現に先読み・後読みが使えたが、今ははてラボ落ちしたためなのかはてなの技術力が落ちたのか使えなくなってる。とても不便。
  • 正規表現の確認ができるエディタを作ってみた。 - 考え得る最高を常に行う

    正規表現の練習くらいにしか役に立たないですが作ってみました。 特徴 リアルタイムで確認ができる。 XHTMLJavascriptで作ったので保存すればローカルで使える。 JavaScriptで実装してるので一部使えない表現有り。 正規表現エディタ あとがき 最近ブログを更新してないので数ヶ月前に作ったやつを手直したものです。Firefox2(MAC)とIE7では動くの確認しました。あまり詳しくないんですが各ブラウザに多少、正規表現の実装が違う気がします。 patternを空にすると選択範囲がおかしくなるのを修正。

    正規表現の確認ができるエディタを作ってみた。 - 考え得る最高を常に行う
    asedaruma
    asedaruma 2007/09/14
    これはすばらしい。Unicode用かな。Shift_JISとかEUC-JPとかも選べるようになるともっと便利かも。
  • 1