【Python × pandas】ParserError: Expected 1 fields in line 8, saw 2 の原因と対処法｜on_bad_linesでエラー回避

2024年2月29日2025年12月21日

Pythonでpandasを使ってCSVファイルを読み込んでいると、以下のようなエラーに遭遇することがあります。

ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 2

一見すると難解なこのエラーですが、実際にはCSVファイルの中に想定外の形式の行が含まれていることが原因です。

今回はこのエラーの意味と、実際に私が遭遇した事例、そして有効だった対処法について解説いたします。

エラーの意味：行ごとの列数が一致していない

このエラーは、pandas.read_csv() でCSVファイルを読み込む際に、特定の行（今回の例では8行目）において、他の行と異なる列数が見つかった場合に発生します。

例えば、以下のようなCSVがあったとします：

名前,年齢,性別
田中,28,男性
佐藤,35,女性
,,,, ←← 空白やカンマだけの不正行
鈴木,41,男性

このようなケースでは、3列を期待しているのに5列（カンマ4つ）を含む行が混ざっており、pandas側でパース（構文解析）できずに ParserError が発生します。

エラーの原因：空白行や余計な区切り記号（カンマ）

私が遭遇したケースでは、CSVファイルに余計な空白行やカンマだけの行が含まれていたことが原因でした。

特に、手作業で作成されたCSVファイルや、他ツールからエクスポートされたデータでは、このような行が入りやすくなります。

有効だった対処法：`on_bad_lines='skip'` を使う

pandasの read_csv() 関数には、不正な行をスキップするためのオプションがあります。

以下のように書くことで、エラーの原因となる行を無視して処理を続けることができます。

import pandas as pd

csv_file_path = 'sample.csv'

df = pd.read_csv(
    csv_file_path,
    encoding='shift_jis',
    on_bad_lines='skip',         # 不正行をスキップ
    warn_bad_lines=True          # スキップされた行を警告表示（※pandas 1.3 以前向け）
)

print(df)

パラメータ解説

on_bad_lines='skip'
　→ 不正な構文の行（列数の不一致など）を無視して読み込みを継続します
　※pandas 1.3.0以降で使用可能
warn_bad_lines=True
　→ スキップした行に関する警告を表示します
　※このオプションはpandas 1.3以降では非推奨です。代わりに on_bad_lines='warn' を使用してください