文字コードで化けてて化けてない話


データが部分的に化ける、という話があって、データをみていると化けないんですが、
データをメールに出力すると一部が?になって化ける。

なんだろうこれ、と思ったら、PDFからコピペした文字が化けていて、
ほとんどの場所は通常通りに入ってるんですが、化けて?になるところは「⽅」っていう文字が入ってる。

これ文字コードを解析するツールなどでみるとわかるんですが、
https://www.hyuki.com/aozora/code.cgi

普通の文字に見えてるのはブラウザさんがそうしてるだけで、文字コードはチグハグになっていました。

んで、みていると、化けてないのに「 ︖ 」表記になってるところを発見。

なんだろうと思ったら、縦書き用の?が文字化けしていたようです。
元々「?」の文字が入ってる場所だから、文字化けしても?(ちょっと位置が違うように見える)だったので気がつかなかったようです。

該当文字コード
https://www.compart.com/en/unicode/U+FE16