UTF-8のテキストデータなどをSJISで保存してしまうと、文字によっては英数字;のように文字化けしてしまう。
糝とか。
これを糝のような文字に戻してやる。
最初からSJISで保存するなって?
俺がやったわけじゃ(ry
入稿データが(ry
utf8 = File.open('utf8.txt', 'w')
File.open('moji.txt').each do |row|
while (row =~ /&#(x\w+);/)
row.gsub!("&##{$1};", ["0#{$1}".hex].pack("U*"))
end
utf8.puts row
end