文字コードの取得

CGIテクニック集トップへ





概要

日本語文字コードを自動的に取得します。パックで使われています。

必用な処理

  1. PerlのPackage Jcodeを読み込む
  2. 文字コードを取得する

サンプルコード

 use Jcode;
 
 my $string = "日本語文字列";
 
 my $code = getcode($string);

コードの解説

 use Jcode;

PerlのPackage Jcodeを読み込みます。

 my $string = "日本語文字列";

$stringには任意の日本語文字列が入っています。この文字列の文字コードを取得します。

 my $code = getcode($string);

getcodeメソッドにより$stringから文字コードを自動検出します。その結果により$codeに以下のコードが入力されます。

 ascii   Ascii (Contains no Japanese Code)
 binary  Binary (Not Text File)
 euc     EUC-JP
 sjis    SHIFT_JIS
 jis     JIS (ISO-2022-JP)
 ucs2    UCS2 (Raw Unicode)
 utf8    UTF8

getcodeは二つの値を返します。一つは文字コードでもう一つはそのコードにマッチした数です。以下のように二つの返り値を取得することができます。

 my ($code, $match) = getcode($string);

関連するCGIテクニック

文字コード変換の仕方
メールのタイトル用にエンコードする方法
Shift_JISでの文字列サーチする方法
JISの長文メールの文字化けの解消
Perl 5.6.1でのUTF-8の処理の方法
英文スパムなどのアスキーコードのみの文字列を排除する方法