文字コードをいい感じに揃える、str.normalize('NFKC')

プログラムを見ていたら、なんか呪文のように使ってる場所があって、あんまり気にせずコピペしていましたが、新ためてどういう意味なのか調べました。

{df}.{data}.str.normalize('NFKC')

調べてみたら、KCタイプの文字変換だったようです。
すっごい平たくいうと、半角カタカナとか混じっていても、一旦要素分解して、比較できる全角にするから比較しても大丈夫、という代物でした。


参考:
https://ja.wikipedia.org/wiki/Unicode%E6%AD%A3%E8%A6%8F%E5%8C%96
https://japandas.readthedocs.io/en/latest/jpstrings.html