使用環境
- エディション:Windows 10 Pro
- バージョン:20H2
背景
Pythonで作業している中で、glob関数を使ってフォルダ内のCSVファイルを取得しようとしました。
しかし、対象のフォルダは複数の階層構造になっており、さらにその下のサブフォルダにもCSVファイルが存在していました。
そのため、今回は複数階層にまたがるフォルダからCSVファイルをすべて取得する方法を学びました。
解決策:パスに「*」を使って階層を指定する
階層に応じて、「*(アスタリスク)」を使ってパスを拡張することで、目的のファイルを取得することができました。
フォルダ構成例
- 「data」フォルダの直下にフォルダA、フォルダBがある
- フォルダAには直接CSVファイルが入っている
- フォルダBの中にはさらにサブフォルダがあり、そのサブフォルダ内にCSVファイルが存在する
文字で説明すると少し分かりにくいかもしれませんが、
要するに階層がバラバラに深くなっている状況です。
サンプルプログラム
from glob import glob
data3 = glob('./data/**/*.csv')
data4 = glob('./data/***/**/*.csv')
プログラムの解説
1行目、globライブラリをインポートしています。
2行目、3階層目にあるCSVファイルをすべて取得しています。**を使うことで再帰的に検索が可能になります。
3行目、4階層目にあるCSVファイルを取得しています。さらに深いフォルダ構造にも対応できます。
※階層の数え方については多少曖昧な部分もありますが、基本的に**を重ねることで深い階層までカバーできます。
注意点と失敗談
最初、パスをコピペして使用した際に、
Windows標準のパス表記で「\(バックスラッシュ)」が混ざってしまい、エラーに悩まされました。
また、キーボードから「¥」ボタンを押しても「\」になってしまい、問題が解決できずにいました。
最終的に、「\」を「/」に置き換えることで、正常に動作するようになりました。
まとめ
Pythonのglobを使用すると、
複数階層にまたがるフォルダ内の特定拡張子(今回であれば.csv)ファイルを一括で取得することができます。
パスに「*」や「**」をうまく使うことで、
サブフォルダやさらに深い階層のファイルにも柔軟に対応できるようになります。
フォルダ構成が複雑な場合でも、シンプルにファイルをまとめて取得したいときに非常に便利なテクニックです。
副業から独立まで「稼げる」Webスキルを習得する(PR)
ここまで読んでいただきありがとうございます。 最後に宣伝をさせてください。
「副業を始めたいが、何から手をつければいいかわからない」「独学でスキルはついたが、収益化できていない」という悩みを持つ方には、マンツーマン指導のWebスクール**「メイカラ」**が適しています。
このスクールは、単に技術を教えるだけでなく、**「副業として具体的にどう稼ぐか」**という実務直結のノウハウ提供に特化している点が特徴です。
講師陣は、実際に「副業Webライターから1年で独立して月収100万円」を達成したプロや、現役で利益を出し続けているブロガーなど、確かな実績を持つプレイヤーのみで構成されています。そのため、机上の空論ではない、現場で通用する戦術を学ぶことができます。
副業に特化した強み
- 最短ルートの提示: 未経験からでも実績を出せるよう、マンツーマンで指導。
- AI活用の習得: 副業の時間対効果を最大化するための、正しいAI活用スキルも網羅。
- 案件獲得のチャンス: 運営がWebマーケティング会社であるため、実力次第で社内案件の紹介など、仕事に直結する可能性があります。
受講者の多くは、「在宅でできる仕事を探している」「副業を頑張りたい」という20代・30代・40代が中心です。
受講前には、講師による無料説明が行われます。無理な勧誘はなく、自分に合った副業スタイルやプランを相談できるため、まずは話を聞いてみることから始めてみてはいかがでしょうか。
