今回も PowerShell を使った CSV の前処理の前処理のスクリプトの続きです。
値にカンマや改行を含む CSV
前回の記事で、CSV 形式のテキストの整形処理をする PowerShell スクリプトを作成しました。
大抵はそれで事足りると思うのですが、 一部のスクリプトについて、CSV 形式によっては対応しきれないものがあります。
フィールドが単純にカンマと改行で区切れれば問題ないのですが、クォートされて値にカンマや改行コードが含まれるような複雑な CSV は扱えません。
本記事ではクォートされたフィールドの処理にも対応した改善版のスクリプトを紹介します。
ただし、正規表現を使った置換処理を多用しているため、非常に重たくなっています。 巨大な CSV ファイルでは実用的なパフォーマンスが得られないかもしれませんので、ご承知おきください。
続きを読む