秀丸エディタでUTF-8をデフォで使う

まだ、秀丸エディタを好んで使っている人がたくさんいるようだ。愛用して使うのは良いが、イマドキはUTF-8で保存していないと様々な場面で面倒が起こる。あなたが事務職であってもテキストエディタを使うならUTF-8で保存しよう。

秀丸エディタの新規作成時のデフォルト文字コードをUTF-8に設定するには、メニューの「その他」>「動作環境」>「ファイル」>「エンコード1」を開き、「新規作成やASCIIのとき」の項目を「Unicode(UTF-8)」に変更します。左メニューのファイルのツリーが見えないひとは、左の一番下の上級者向け設定(A)をチェックしよう。

この設定変更により、次回以降新規作成するファイルは自動的にUTF-8(通常はBOMなし)として開かれ、保存時も文字コードが指定されます。さらに、文字コードと同様に改行コードも固定しておくと作業がよりスムーズになります。

テキストファイルでUTF-8が世界標準として推奨される主な理由は、「世界中のすべての文字を文字化けせずに1つのファイルで表現できるから」です。

具体的には、以下のような決定的なメリットがあります。

1. 世界中のあらゆる言語を同時に扱える

昔の「Shift_JIS(日本語用)」や「gb2312(中国語用)」といった文字コードは、特定の言語しか保存できませんでした。UTF-8であれば、日本語、英語、中国語、アラビア語、さらには絵文字まで、世界中のあらゆる文字を同じファイル内に混在させても絶対に文字化けしません。

2. 世界標準(デファクトスタンダード)である

現在、インターネット上のウェブサイトの95%以上、そして最新のプログラミング言語(Python, JavaScriptなど)や各種クラウドサービスの多くが、デフォルトの文字コードとしてUTF-8を採用しています。UTF-8にしておけば、他の人や異なるシステムにファイルを渡したときにトラブルが起きる可能性を最小限に抑えられます。

3. MacやLinuxとの親和性が高い

Windowsでは長年「Shift_JIS」が標準でしたが、MacやLinux(iPhoneやAndroidも含む)は最初からUTF-8が標準です。異なるOS間でテキストファイルをやり取りする際、UTF-8であれば文字化けを気にする必要がなくなります。

4. 英語(ASCII)部分のデータ量が少ない

UTF-8は、英数字(ASCII文字)を1バイト、日本語などの全角文字を3バイトで表現する仕組みです。そのため、ソースコードや設定ファイルのように英数字が大部分を占めるテキストファイルでは、ファイルサイズを非常に小さく(軽量に)抑えることができます。