はじめに
今回は、PythonでCSVファイルを書き込んだ際に文字化けが発生した問題と、
それを解決する方法について勉強しました。
使用環境は以下のとおりです。
- PC: MacBook Air (11-inch, Early 2015)
- OS: macOS バージョン11.6(20G165)
- Pythonバージョン: 3.8.8(64-bit)
背景
Pythonでデータを処理し、
最終的に**to_csvメソッドを使ってCSVファイルに書き出したところ、
ファイルを開いた際に文字化けが発生**してしまいました。
実際のコマンド
初めに使用したコードはこちらです。
df.to_csv('export.csv', index=False)
dfは、元となるデータフレームです。'export.csv'は、出力先ファイル名です。index=Falseは、データフレームのインデックス列をCSVに書き込まない指定です。
このままでは、日本語を含む文字列が文字化けしてしまいました。
対処方法
① encoding="utf-8_sig"を追加する
調べたところ、to_csvのオプションにエンコーディング(文字コード)を明示的に指定するとよいとわかりました。
そこで、以下のように書き換えました。
df.to_csv('export.csv', encoding="utf-8_sig", index=False)
ポイントは、
- **
utf-8_sig**と指定することです。 sigとは、「BOM(Byte Order Mark)」付きUTF-8を意味し、Windows環境でも文字化けしにくくなります。
この方法で、無事に文字化けせずに保存できました。
他にも使えるエンコーディング例
環境やファイルの用途によって、
もしutf-8_sigでうまくいかない場合、以下のエンコーディングも試すことができます。
| エンコーディング名 | 説明 |
|---|---|
utf-8 | BOMなしUTF-8。Mac/Linux向け。WindowsのExcelでは文字化けすることも。 |
shift-jis | 日本のWindows標準文字コード。Excelで互換性が高い。 |
cp932 | Shift-JISを拡張した日本語Windows向けコード。 |
iso2022_jp | 古いメール用標準。通常のCSVでは使用しない。 |
euc_jp | 古いUNIX系の日本語環境用。近年はあまり使われない。 |
まとめ
to_csvで文字化けする場合は、encoding="utf-8_sig"を指定するとよい。- それでもうまくいかない場合は、環境に応じた別のエンコーディングも試してみる。
- 特にWindowsのExcelで開く前提なら、
utf-8_sigまたはshift-jis系を優先的に検討するとよい。
今回の対応を通じて、PythonからCSVファイルを出力する際は、エンコーディングを必ず意識すべきだと実感しました。
今後もファイル入出力時には、より注意深く文字コードを設定していきたいと考えています。
副業から独立まで「稼げる」Webスキルを習得する(PR)
ここまで読んでいただきありがとうございます。 最後に宣伝をさせてください。
「副業を始めたいが、何から手をつければいいかわからない」「独学でスキルはついたが、収益化できていない」という悩みを持つ方には、マンツーマン指導のWebスクール**「メイカラ」**が適しています。
このスクールは、単に技術を教えるだけでなく、**「副業として具体的にどう稼ぐか」**という実務直結のノウハウ提供に特化している点が特徴です。
講師陣は、実際に「副業Webライターから1年で独立して月収100万円」を達成したプロや、現役で利益を出し続けているブロガーなど、確かな実績を持つプレイヤーのみで構成されています。そのため、机上の空論ではない、現場で通用する戦術を学ぶことができます。
副業に特化した強み
- 最短ルートの提示: 未経験からでも実績を出せるよう、マンツーマンで指導。
- AI活用の習得: 副業の時間対効果を最大化するための、正しいAI活用スキルも網羅。
- 案件獲得のチャンス: 運営がWebマーケティング会社であるため、実力次第で社内案件の紹介など、仕事に直結する可能性があります。
受講者の多くは、「在宅でできる仕事を探している」「副業を頑張りたい」という20代・30代・40代が中心です。
受講前には、講師による無料説明が行われます。無理な勧誘はなく、自分に合った副業スタイルやプランを相談できるため、まずは話を聞いてみることから始めてみてはいかがでしょうか。
