目次
概要
Excel VBAで正規表現(RegExp)を使うと、特定のパターンに一致する文字列を簡単に抽出できます。本記事では、MatchesコレクションとSubMatchesを用いて、一致した値やその部分一致を取得する方法を解説します。
サンプルコード
Sub ExtractMatchesWithRegExp()
Dim regObj As Object
Dim matches As Object
Dim i As Long
' 正規表現オブジェクト作成
Set regObj = CreateObject("VBScript.RegExp")
regObj.Global = True
regObj.Pattern = "\d+" ' 数字1文字以上に一致
' マッチング実行
Set matches = regObj.Execute("9876-5432")
' 一致数と個別の一致結果を出力
Range("B2").Value = matches.Count
Range("B3").Value = matches(0).Value
Range("B4").Value = matches(1).Value
' グループ化したパターンでの部分一致取得
regObj.Pattern = "(\d+)-(\d+)"
Set matches = regObj.Execute("9876-5432")
Range("E2").Value = matches.Count
With matches(0)
Range("E3").Value = .SubMatches(0) ' ハイフン前の数字
Range("E4").Value = .SubMatches(1) ' ハイフン後の数字
End With
End Sub
コード解説
- RegExpオブジェクトの作成
CreateObject("VBScript.RegExp")で正規表現オブジェクトを生成します。 - Globalプロパティ
Trueに設定すると、文字列中のすべての一致箇所を対象にします。 - Patternプロパティ
抽出対象のパターンを指定します。\d+:数字が1文字以上連続する部分(\d+)-(\d+):ハイフンで区切られた2つの数字をそれぞれグループ化
- Executeメソッド
文字列に対して正規表現を適用し、一致結果のMatchesコレクションを取得します。 - Matchesコレクションの参照
matches(0).Valueのようにして、一致した文字列を個別に取得します。 - SubMatchesコレクション
パターン内で括弧()で囲った部分を取得できます。
例:(\d+)-(\d+)なら、1番目の括弧の値が.SubMatches(0)、2番目が.SubMatches(1)になります。
応用例
- 電話番号から市外局番と加入者番号を分割して取得
- 郵便番号を前半・後半に分けて処理
- 商品コードからカテゴリ部分と番号部分を抽出
まとめ
VBAの正規表現は、単に検索や置換を行うだけでなく、一致結果をコレクションとして扱えるため、細かくデータを抽出できます。MatchesとSubMatchesを活用すれば、文字列解析やデータ整理の効率が大幅に向上します。
