awkでUTF-8文字を扱ったときの正規表現系の処理
はじめまして。MAC OS Xのawkについて質問です。
下記の2つのファイルを定義します(漢字はUTF-8)。
=== a.awk ===
{
gsub("元","先",$0)
gsub("F","T",$0)
print $0
}
=== a.txt ===
元先
FT
そこで awk -f a.awk a.txt を実行すると
元先
TT
となってしまします。私の考えでは、
先先
TT
となると思うのですが。。。
これは仕様なのでしょうか?
他の正規表現を扱う関数も同様に漢字の部分が無視されます。
よろしくお願いいたします。