python - utf8编码规则会受制于Unicode实际的字符对应吗？

Question

我用python 写'\xF5\x90\x90\x90'.decode('utf8') 但是报错了： {代码...} 问题是：\xF5\x90\x90\x90 是个标准的四字节的utf8编码的字符啊 转换成二进制就是 11110101 10010000 10010000 10010000 完全符合utf8编...

天蓬老师 · Answer

Unicode の範囲は 0x0000 ～ 0x10FFFF なので、テストしたところ、Python は仕様よりも緩和されており、0xFFFFF までサポートしていることがわかりました。ただし、ご質問の入力はこの範囲を超えているため、エラーが報告されます。
添付ファイル: UTF-8 標準 RFC3629