©
This document usesPHP Chinese website manualRelease
在头文件 |
|
|
---|---|---|
size_t mbrtoc16(char16_t * pc16,const char * s,size_t n,mbstate_t * ps); |
|
(自C11以来) |
将单个代码点从其窄多字节字符表示转换为其可变长度的16位宽字符表示(通常为UTF-16)。
如果s不是空指针,则检查多字节字符串的至多n个字节,从s指向的字节开始,以确定完成下一个多字节字符(包括任何移位序列)所需的字节数。 如果函数确定s中的下一个多字节字符是完整且有效的,则将其转换为相应的16位宽字符并将其存储在* pc16中(如果pc16不为null)。
如果* s中的多字节字符对应于多char16_t序列(例如UTF-16中的代理对),那么在第一次调用此函数后,将更新* ps,以便下次调用mbrtoc16时将写入 额外的char16_t,而不考虑* s。
如果s是一个空指针,n和pc16的值将被忽略,并且调用相当于mbrtoc16(NULL,“”,1,ps)。
如果生成的宽字符为空字符,则转换状态* ps表示初始转换状态。
如果定义了宏__STDC_UTF_16__,则该函数使用的16位编码为UTF-16; 否则,它是实现定义的。 在任何情况下,此函数使用的多字节字符编码均由当前活动的C语言环境指定。
PC16 |
- |
指向结果16位宽字符将被写入的位置的指针 |
---|---|---|
s |
- |
指向用作输入的多字节字符串的指针 |
n |
- |
限制可以检查的s中的字节数 |
ps |
- |
指向解释多字节字符串时使用的转换状态对象的指针 |
以下第一项适用:
如果从s转换的字符(并且存储在* pc16中,如果非null)是空字符,则返回0
返回从s成功转换的多字节字符的字节数[1 ... n]
如果来自多char16_t字符(例如代理对)的下一个char16_t现在已被写入* pc16,则返回(size_t)-3。在这种情况下,输入中没有处理字节。
如果接下来的n个字节构成一个不完整的,但到目前为止有效的多字节字符, 没有任何信息写入* pc16。则返回(size_t)-2
如果发生编码错误。 没有任何内容写入* pc16,值EILSEQ存储在errno中,并且如果* ps未指定,则返回(size_t)-1
#include#include #include mbstate_t state;int main(void){ setlocale(LC_ALL, "en_US.utf8"); char in[] = u8"zß水?"; // or "z\u00df\u6c34\U0001F34C" size_t in_sz = sizeof in / sizeof *in; printf("Processing %zu UTF-8 code units: [ ", in_sz); for(size_t n = 0; n < in_sz; ++n) printf("%#x ", (unsigned char)in[n]); puts("]"); char16_t out[in_sz]; char *p_in = in, *end = in + in_sz; char16_t *p_out = out; int rc; while((rc = mbrtoc16(p_out, p_in, end - p_in, &state))) { if(rc == -3) // surrogate pairs in UTF-16 p_out += 1; else if(rc > 0) { p_in += rc; p_out += 1; } else break; } size_t out_sz = p_out - out + 1; printf("into %zu UTF-16 code units: [ ", out_sz); for(size_t x = 0; x < out_sz; ++x) printf("%#x ", out[x]); puts("]");}
输出:
Processing 11 UTF-8 code units: [ 0x7a 0xc3 0x9f 0xe6 0xb0 0xb4 0xf0 0x9f 0x8d 0x8c 0 ]into 6 UTF-16 code units: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c 0 ]
C11标准(ISO / IEC 9899:2011):
7.28.1.1 mbrtoc16函数(p:398-399)
c16rtomb(C11) |
将16位宽字符转换为窄多字节字符串(函数) |
---|
| mbrtoc16的C ++文档 |
本文档系腾讯云云+社区成员共同维护,如有问题请联系 yunjia_community@tencent.com
在头文件 |
|
|
---|---|---|
int iswdigit(wint_t ch); |
|
(自C95以来) |
检查给定的宽字符是否对应(如果缩小)十个十进制数字字符0123456789中的一个。
CH |
- |
宽字符 |
---|
如果宽字符是数字字符,则为非零值,否则为零。
iswdigit
与iswxdigit
是唯一不受当前安装的C语言环境影响的标准宽字符分类函数。
一些语言环境提供了检测非ASCII数字的附加字符类。
#include#include #include #include void test(wchar_t a3, wchar_t u3, wchar_t j3){ printf(" '%lc' '%lc' '%lc'\n", a3, u3, j3); printf("iswdigit %d %d %d\n", !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3)); printf("jdigit: %d %d %d\n", !!iswctype(a3, wctype("jdigit")), !!iswctype(u3, wctype("jdigit")), !!iswctype(j3, wctype("jdigit")));} int main(void){ wchar_t a3 = L'3'; // the ASCII digit 3 wchar_t u3 = L'三'; // the CJK numeral 3 wchar_t j3 = L'3'; // the fullwidth digit 3 setlocale(LC_ALL, "en_US.utf8"); puts("In American locale:"); test(a3, u3, j3); setlocale(LC_ALL, "ja_JP.utf8"); puts("\nIn Japanese locale:"); test(a3, u3, j3);}
输出:
In American locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 0 In Japanese locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 1
C11标准(ISO / IEC 9899:2011):
7.30.2.1.5 iswdigit函数(p:449)
C99标准(ISO / IEC 9899:1999):
7.25.2.1.5 iswdigit函数(p:395)
isdigit |
检查一个字符是否是一个数字(功能) |
---|
| 用于iswdigit的C ++文档 |
ASCII 值 (十六进制) |
字符 |
iscntrl iswcntrl. |
isprint iswprint. |
isspace iswspace. |
isblank iswblank. |
isgraph iswgraph. |
ispunct iswpunct. |
isalnum iswalnum. |
isalpha iswalpha. |
isupper iswupper. |
islower iswlower. |
isdigit iswdigit. |
isxdigit iswxdigit. |
|
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 - 8 |
0x00-0x08 |
控制码 (NUL, etc.) |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
9 |
0x09 |
tab (\t) |
≠0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
10 - 13 |
0x0A-0x0D |
空格 (\n,\v,\f,\r) |
≠0 |
0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
14 - 31 |
0x0E-0x1F |
控制码 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
32 |
0x20 |
space |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
33 - 47 |
0x21-0x2F |
!"#$%&'()*+,-./ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
48 - 57 |
0x30-0x39 |
0123456789 |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
0 |
0 |
0 |
≠0 |
≠0 |
58 - 64 |
0x3a-0x40 |
:;<=>?@ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
65 - 70 |
0x41-0x46 |
ABCDEF |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
≠0 |
71 - 90 |
0x47-0x5A |
GHIJKLMNOPQRSTUVWXYZ |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
0 |
91 - 96 |
0x5B-0x60 |
[]^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | |
||||||||||||
97 -102 |
0x61-0x66 |
abcdef |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
0 |
≠0 |
0 |
≠0 |
103-122 |
0x67-0x7A |
ghijklmnopqrstuvwxyz |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
0 |
≠0 |
0 |
0 |
123-126 |
0x7B-0x7E |
{|}~ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
127 |
0x7F |
退格 (DEL) |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |