なんでも計算スタジオ

文字列のバイト数計算(UTF-8 / UTF-16 / Shift_JIS)

入力した文字列のバイト数を、UTF-8・UTF-16・Shift_JISで同時に表示します。Shift_JISはJIS X 0208に基づく正確な値です。データベースの文字数制限やファイルサイズの確認に。

12 / 50,000 文字

計算結果

UTF-8
24バイト
UTF-16
24バイト
Shift_JIS
18バイト
Shift_JISで表現できない文字
0
文字数
12文字

Shift_JISのバイト数は JIS X 0208 + ASCII・半角カナ に基づく正確な値です。Shift_JISに存在しない文字はバイト数に含めません。文字数はコードポイント単位です。

使い方

文字列を入力すると、UTF-8・UTF-16・Shift_JISの各エンコーディングでのバイト数と文字数が表示されます。改行を含む複数行の入力にも対応しています。

データの取り扱い

すべての計算はお使いのブラウザ内で行われ、入力値がサーバに送信されることはありません。

計算式の解説

UTF-8

1文字あたり1〜4バイト。ASCII(英数字・記号)は1バイト、全角ひらがな・漢字などは3バイト、絵文字など補助面の文字は4バイトです。

UTF-16

基本多言語面(BMP)の文字は2バイト、補助面の文字(絵文字など)はサロゲートペアで4バイトです(= JS文字列のコードユニット数 × 2)。

Shift_JIS

ASCIIと半角カナを1バイト、JIS X 0208に収録される文字(全角ひらがな・カタカナ・漢字・記号など)を2バイトとして数えた正確な値です。JIS X 0208 の収録判定は Unicode が公開する対応表から生成しています。Shift_JISに存在しない文字(多くの絵文字や一部の漢字など)はバイト数に含めず、「表現できない文字」として別に数えます。

よくある質問

Shift_JISのバイト数は正確ですか?
はい。JIS X 0208(Unicodeの対応表から生成)に収録される文字を2バイト、ASCII・半角カナを1バイトとして数えた正確な値です。Shift_JISに変換できない文字(多くの絵文字や一部の漢字など)はバイト数に含めず、「表現できない文字」の件数として別に表示します。
ひらがな1文字は何バイトですか?
UTF-8では3バイト、UTF-16では2バイト、Shift_JIS(目安)では2バイトです。エンコーディングによって異なります。
絵文字のバイト数はどうなりますか?
多くの絵文字は補助面(U+10000以上)にあり、UTF-8では4バイト、UTF-16でも4バイト(サロゲートペア)になります。本ツールの文字数はコードポイント単位で数えるため、サロゲートペアは1文字として数えます。

関連ツール