VBAで正規表現の一致結果を取得し値を抽出する方法

目次

概要

Excel VBAで正規表現(RegExp)を使うと、特定のパターンに一致する文字列を簡単に抽出できます。本記事では、MatchesコレクションとSubMatchesを用いて、一致した値やその部分一致を取得する方法を解説します。


サンプルコード

Sub ExtractMatchesWithRegExp()
    Dim regObj As Object
    Dim matches As Object
    Dim i As Long
    
    ' 正規表現オブジェクト作成
    Set regObj = CreateObject("VBScript.RegExp")
    regObj.Global = True
    regObj.Pattern = "\d+" ' 数字1文字以上に一致
    
    ' マッチング実行
    Set matches = regObj.Execute("9876-5432")
    
    ' 一致数と個別の一致結果を出力
    Range("B2").Value = matches.Count
    Range("B3").Value = matches(0).Value
    Range("B4").Value = matches(1).Value
    
    ' グループ化したパターンでの部分一致取得
    regObj.Pattern = "(\d+)-(\d+)"
    Set matches = regObj.Execute("9876-5432")
    
    Range("E2").Value = matches.Count
    With matches(0)
        Range("E3").Value = .SubMatches(0) ' ハイフン前の数字
        Range("E4").Value = .SubMatches(1) ' ハイフン後の数字
    End With
End Sub

コード解説

  1. RegExpオブジェクトの作成
    CreateObject("VBScript.RegExp")で正規表現オブジェクトを生成します。
  2. Globalプロパティ
    Trueに設定すると、文字列中のすべての一致箇所を対象にします。
  3. Patternプロパティ
    抽出対象のパターンを指定します。
    • \d+:数字が1文字以上連続する部分
    • (\d+)-(\d+):ハイフンで区切られた2つの数字をそれぞれグループ化
  4. Executeメソッド
    文字列に対して正規表現を適用し、一致結果のMatchesコレクションを取得します。
  5. Matchesコレクションの参照
    matches(0).Value のようにして、一致した文字列を個別に取得します。
  6. SubMatchesコレクション
    パターン内で括弧 () で囲った部分を取得できます。
    例:(\d+)-(\d+)なら、1番目の括弧の値が.SubMatches(0)、2番目が.SubMatches(1)になります。

応用例

  • 電話番号から市外局番と加入者番号を分割して取得
  • 郵便番号を前半・後半に分けて処理
  • 商品コードからカテゴリ部分と番号部分を抽出

まとめ

VBAの正規表現は、単に検索や置換を行うだけでなく、一致結果をコレクションとして扱えるため、細かくデータを抽出できます。MatchesSubMatchesを活用すれば、文字列解析やデータ整理の効率が大幅に向上します。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

私が勉強したこと、実践したこと、してることを書いているブログです。
主に資産運用について書いていたのですが、
最近はプログラミングに興味があるので、今はそればっかりです。

目次