Chef Solo で invalid byte sequence in Windows-31J / invalid byte sequence in UTF8 に遭遇したときの対処をいくつか
- OS は Windows 7 SP1, Windows Server 2008 R2
- Chef は Fast Start Guide for Windows - Chef - Opscode Open Source Wiki からダウンロード => chef-client-11.4.0-1.windows.msi
- Chef リポジトリは ここ
Chef-solo に同梱されている Ruby は 1.9.3p286 なので、エンコーディングが 1.8.x に比べて改善されているらしい。が、やはり日本語 Windows を使ってるといろいろハマるのでメモ。
前提
環境変数 LANG がセットされていない場合、
ECHO %LANG% => (空)
外部エンコーディングは Windows-31J
ruby -e "p Encoding.default_external" => #<Encoding:Windows-31J>
最近の風潮としてエンコーディングの基本はUTF8なので、環境変数 LANG をセットしておく。
SET LANG=ja_JP.utf8
そうすると外部エンコーディングも UTF8 になる。
ruby -e "p Encoding.default_external" => #<Encoding:UTF-8>
で、ソースコードはマジックコメントでUTF8を指定しておく。
# -*- encoding: utf-8 -*-
基本はこれで問題ないんだけども、 日本語 Windows では Windows-31J と付き合わないわけにはいかないのでまれに問題がおきる。
windows_batch リソース
何らかのコマンドに対して日本語で引数を指定する場合次のように書くわけだが、受け側ではShiftJISを期待してる。
ところがマジックコメントでUTF8を指定しているため、受け側には文字化けした文字列がわたってしまう。
windows_batch "sample" do code = <<-EOH hoge 日本語 EOH end
なのでコマンドに日本語を渡したい場合は Windows-31J でエンコードしましょう。
windows_batch "sample" do tmp = <<-EOH hoge 日本語 EOH code tmp.encode('Windows-31J', 'utf-8') end
windows_package リソース
「アプリケーションの追加と削除」に登録されるようなアプリケーションをインストールしてくれる便利なコマンドなんだけど、やっぱり日本語が入るとエラーが発生します。
難点なのが、目当てのアプリケーションに日本語が入ってなくても、アプリケーションがインストールされているかのチェックでレジストリを参照すること。このときに日本語を含むアプリケーションがあるとエラーが発生してしまう。
windows_package "Fuga Application" do source "path/to/fuga" installer_type :customoptions "/q" action :install end
これはレシピをいじっても仕方なくて、同梱されている Ruby ライブラリの問題。具体的には win32/registry.rb 。これを以下のように修正してあげればいいい。
+++ C:/opscode/chef/embedded/lib/ruby/1.9.1/win32/registry.rb Thu May 09 11:12:35 2013 @@ -165,11 +165,14 @@ dlload "kernel32.dll" end FormatMessageA = Kernel32.extern "int FormatMessageA(int, void *, int, int, void *, int, void *)", :stdcall + FormatMessageW = Kernel32.extern "int FormatMessageW(int, void *, int, int, void *, int, void *)", :stdcall def initialize(code) @code = code msg = "\0".force_encoding(Encoding::ASCII_8BIT) * 1024 - len = FormatMessageA.call(0x1200, 0, code, 0, msg, 1024, 0) - msg = msg[0, len].force_encoding(Encoding.find(Encoding.locale_charmap)) + #len = FormatMessageA.call(0x1200, 0, code, 0, msg, 1024, 0) + len = FormatMessageW.call(0x1200, 0, code, 0, msg, 1024, 0) * 2 + #msg = msg[0, len].force_encoding(Encoding.find(Encoding.locale_charmap)) + msg = msg[0, len].force_encoding("UTF-16LE").encode(Encoding.find(Encoding.locale_charmap)) super msg.tr("\r", '').chomp end attr_reader :code