Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the really-simple-ssl domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/cgis2/required.asia/public_html/wp-includes/functions.php on line 6170

Notice: 関数 _load_textdomain_just_in_time が誤って呼び出されました。twentyfourteen ドメインの翻訳の読み込みが早すぎました。これは通常、プラグインまたはテーマの一部のコードが早すぎるタイミングで実行されていることを示しています。翻訳は init アクション以降で読み込む必要があります。詳しくは WordPress のデバッグをご覧ください。 (このメッセージはバージョン 6.7.0 で追加されました) in /home/cgis2/required.asia/public_html/wp-includes/functions.php on line 6170
UTF-8の全角カタカナ正規表現 | Linux/Windows
Deprecated: 関数 WP_Dependencies->add_data() がバージョン 6.9.0 から非推奨になった引数付きで呼び出されました。IE の条件付きコメントは、対応しているすべてのブラウザーで無視されます。 in /home/cgis2/required.asia/public_html/wp-includes/functions.php on line 6170

UTF-8の全角カタカナ正規表現

2008年7月16日 syokunin コメントする

UTF-8全角カタカナの正規表現マッチが必要となり、
どこぞにありそうだと思いつつも
勉強もかねて自分で作ってみる。

■とりあえず思いつくところを並べてみた
（スクリプターらしからぬ行為）

$str = ”
ァィゥェォ
アイウエオ
カキクケコ
ガギグゲゴ
サシスセソ
ザジズゼゾ
タチツテト
ダヂヅデド
ッ
ナニヌネノ
ハヒフヘホ
バビブベボ
パピプペポ
マミムメモ
ャュョ
ヤユヨ
ラリルレロ
ワヲン
ー・ヽヾ
“;


■16進数に変換した値をキーとしててソート＆ダンプしてみる。
$array = array();

$strs = explode(' ', $str);

foreach ($strs as $s){

$s = trim($s);

if($s) {

$array[(bin2hex($s))] = $s;

}

}
var_dump($array);
実行結果

■結果から、連番部分を抜き出せばいいのかもしれないが

思いついてない文字があるかもしれないので、

最小[e382a1]-100 ～ 最大[e383be]+100まで文字をダンプしてみる。

もちろん100という数字に根拠なし。
$start = hexdec('0xe382a1')-100;

$end = hexdec('0xe383be')+100;
$array2 = array();

for($i = $start; $i <= $end; $i++ ) {
$array2[(dechex($i))] = pack("H*",dechex($i));
}

var_dump($array2);

実行結果

■結果をざっと眺めて、「ヰ」とか「ヱ」とか忘れてたことに気づく。

で、カタカナ部分のみ抜き出すと

e382a1 ～ e382bf

e38380 ～ e383b6

e383bb ～ e383be

だったのでこれを1バイトづつマッチさせる感じで正規表現を記述。

1バイト目がe3、2バイト目が82、3バイト目a1-bf

1バイト目がe3、2バイト目が83、3バイト目80-b6

1バイト目がe3、2バイト目が83、3バイト目bb-be

の３パターン

コメントを残すコメントをキャンセル

Just another WordPress site