陈寒彤 (@Hantong)[Unicode] 编码问题, 难蚌... 中发帖

在 porting go 里面的 ParseDuration, 遇到个奇怪的 BUG, 遂测试: 
[图片]
百思不得其解, 联想到之前经常处理的编码问题, 遂测试:
fn main() {
println!("{:x?}", "µ".as_bytes());
println!("{:x?}", "μ".as_bytes());
}

上面那个从 time package - time - Go Packages 文档里面复制的, 下面那个是输入法的
[图片]
[图片]
无奖竞猜, 这两个看起来一模一样的字符串的字节序列一样不一样…
[图片]
答案揭晓: 显然不一样
[图片]
一查码表, 麻了:




Unicode code point
character
UTF-8 (hex.)
name




U+00B5
µ
c2 b5
MICRO ...