実行環境
- MacBook Air (11-inch, Early 2015)
- macOS バージョン 11.6(20G165)
- Python 3.8.8(64-bit)
エラー発生の経緯
Pythonのpandasライブラリを使ってCSVファイルを読み込み、
条件抽出を行おうとした際に、以下のエラーが発生しました。
ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 2
このエラーが出たため、正しくデータを読み込めずに処理が止まってしまいました。
実際に実行したコマンド
diff = pd.read_csv(diff_files[0], encoding='shift-jis', header=None, dtype=object)
ここで、エラーが発生しました。
エラーの原因
調べたところ、このエラーは、
- CSVファイル内のカラム数(列数)が、各行で揃っていない
ことが原因で発生するものでした。
具体的には、ファイルの冒頭行では1列しか存在していないと認識されているのに、
8行目で突然2列のデータが出現したため、整合性が取れずエラーが発生したという状況です。
対処方法
CSVファイルの列数が一定でない場合、pandasのread_csv()関数で
あらかじめカラム名(列名)を定義することで対応できると分かりました。
そこで、以下のようにカラム名を自動生成しました。
col_names = ['c{0:02d}'.format(i) for i in range(18)] # ※18は列数です
これで、c00, c01, …, c17 という18個のカラム名が自動生成されます。
次に、read_csv()を次のように修正しました。
diff = pd.read_csv(diff_files[0], names=col_names, encoding='shift-jis', header=None, dtype=object)
ここで、
names=col_namesを指定することで、ファイルの列構成に合わせるheader=Noneを指定することで、ファイル冒頭行をデータ行として読み込む
設定にしています。
これで、エラーが発生せず無事にデータを読み込むことができました。
結果
無事、エラーが消えました!
本当に嬉しかったです。
まとめ|ParserError対策は「カラム数の整合性を保つ」こと
今回の経験から分かったことは、
- CSVファイル内の列数は、常に整合性を保つことが大事
- カラム数が不揃いな場合は、
namesオプションでカラム名を指定する
という基本的な注意点です。
特に、データの整形前や外部データを取り込む際は、
事前に列数の確認やファイル内容のチェックを怠らないことが大切だと実感しました。
今後もpandasを使う際には、ファイル構造に注意しながら処理を進めたいと思います。
副業から独立まで「稼げる」Webスキルを習得する(PR)
ここまで読んでいただきありがとうございます。 最後に宣伝をさせてください。
「副業を始めたいが、何から手をつければいいかわからない」「独学でスキルはついたが、収益化できていない」という悩みを持つ方には、マンツーマン指導のWebスクール**「メイカラ」**が適しています。
このスクールは、単に技術を教えるだけでなく、**「副業として具体的にどう稼ぐか」**という実務直結のノウハウ提供に特化している点が特徴です。
講師陣は、実際に「副業Webライターから1年で独立して月収100万円」を達成したプロや、現役で利益を出し続けているブロガーなど、確かな実績を持つプレイヤーのみで構成されています。そのため、机上の空論ではない、現場で通用する戦術を学ぶことができます。
副業に特化した強み
- 最短ルートの提示: 未経験からでも実績を出せるよう、マンツーマンで指導。
- AI活用の習得: 副業の時間対効果を最大化するための、正しいAI活用スキルも網羅。
- 案件獲得のチャンス: 運営がWebマーケティング会社であるため、実力次第で社内案件の紹介など、仕事に直結する可能性があります。
受講者の多くは、「在宅でできる仕事を探している」「副業を頑張りたい」という20代・30代・40代が中心です。
受講前には、講師による無料説明が行われます。無理な勧誘はなく、自分に合った副業スタイルやプランを相談できるため、まずは話を聞いてみることから始めてみてはいかがでしょうか。
