©
Ce document utiliseManuel du site Web PHP chinoisLibérer
在头文件 |
|
|
---|---|---|
int mbtowc(wchar_t * pwc,const char * s,size_t n) |
|
(直到C99) |
int mbtowc(wchar_t * restrict pwc,const char * restrict s,size_t n) |
|
(自C99以来) |
将第一个字节由s指向的多字节字符转换为宽字符,如果pwc不为null,则将其写入* pwc。
如果s是空指针,则重置全局转换状态并确定是否使用移位序列。
每次调用mbtowc都会更新内部全局转换状态(类型为mbstate_t的静态对象,只有此函数已知)。 如果多字节编码使用移位状态,则必须小心避免回溯或多次扫描。 在任何情况下,多线程都不应该在没有同步的情况下调用mbtowc:可以使用mbrtowc。
pwc |
- |
指向宽字符输出的指针 |
---|---|---|
s |
- |
指向多字节字符的指针 |
n |
- |
限制可以检查的s中的字节数 |
如果s不是空指针,则返回多字节字符中包含的字节数,如果s指向的第一个字节没有形成有效的多字节字符,则返回-1;如果s指向空字符,则返回0'\ 0'。
如果s是空指针,则重置其内部转换状态以表示初始移位状态,如果当前多字节编码不是状态相关的(不使用移位序列),且如果当前多字节为非零值编码是依赖于状态的(使用移位序列),则返回0。
#include#include #include #include #include // print multibyte string to wide-oriented stdout// equivalent to wprintf(L"%s\n", ptr);void print_mb(const char* ptr){ mbtowc(NULL, 0, 0); // reset the conversion state const char* end = ptr + strlen(ptr); int ret; for (wchar_t wc; (ret = mbtowc(&wc, ptr, end-ptr)) > 0; ptr+=ret) { wprintf(L"%lc", wc); } wprintf(L"\n");} int main(void){ setlocale(LC_ALL, "en_US.utf8"); // UTF-8 narrow multibyte encoding print_mb(u8"z\u00df\u6c34\U0001F34C"); // or u8"zß水?"}
输出:
zß水?
C11标准(ISO / IEC 9899:2011):
7.22.7.2 mbtowc函数(p:358)
C99标准(ISO / IEC 9899:1999):
7.20.7.2 mbtowc函数(p:322)
C89 / C90标准(ISO / IEC 9899:1990):
4.10.7.2 mbtowc函数
mbrtowc(C95) |
将下一个多字节字符转换为宽字符,给定状态(函数) |
---|---|
mblen |
返回下一个多字节字符(函数)中的字节数 |
| mbtowc的C ++文档 |
本文档系腾讯云云+社区成员共同维护,如有问题请联系 yunjia_community@tencent.com
在头文件 |
|
|
---|---|---|
int iswdigit(wint_t ch); |
|
(自C95以来) |
检查给定的宽字符是否对应(如果缩小)十个十进制数字字符0123456789中的一个。
CH |
- |
宽字符 |
---|
如果宽字符是数字字符,则为非零值,否则为零。
iswdigit
与iswxdigit
是唯一不受当前安装的C语言环境影响的标准宽字符分类函数。
一些语言环境提供了检测非ASCII数字的附加字符类。
#include#include #include #include void test(wchar_t a3, wchar_t u3, wchar_t j3){ printf(" '%lc' '%lc' '%lc'\n", a3, u3, j3); printf("iswdigit %d %d %d\n", !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3)); printf("jdigit: %d %d %d\n", !!iswctype(a3, wctype("jdigit")), !!iswctype(u3, wctype("jdigit")), !!iswctype(j3, wctype("jdigit")));} int main(void){ wchar_t a3 = L'3'; // the ASCII digit 3 wchar_t u3 = L'三'; // the CJK numeral 3 wchar_t j3 = L'3'; // the fullwidth digit 3 setlocale(LC_ALL, "en_US.utf8"); puts("In American locale:"); test(a3, u3, j3); setlocale(LC_ALL, "ja_JP.utf8"); puts("\nIn Japanese locale:"); test(a3, u3, j3);}
输出:
In American locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 0 In Japanese locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 1
C11标准(ISO / IEC 9899:2011):
7.30.2.1.5 iswdigit函数(p:449)
C99标准(ISO / IEC 9899:1999):
7.25.2.1.5 iswdigit函数(p:395)
isdigit |
检查一个字符是否是一个数字(功能) |
---|
| 用于iswdigit的C ++文档 |
ASCII 值 (十六进制) |
字符 |
iscntrl iswcntrl. |
isprint iswprint. |
isspace iswspace. |
isblank iswblank. |
isgraph iswgraph. |
ispunct iswpunct. |
isalnum iswalnum. |
isalpha iswalpha. |
isupper iswupper. |
islower iswlower. |
isdigit iswdigit. |
isxdigit iswxdigit. |
|
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 - 8 |
0x00-0x08 |
控制码 (NUL, etc.) |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
9 |
0x09 |
tab (\t) |
≠0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
10 - 13 |
0x0A-0x0D |
空格 (\n,\v,\f,\r) |
≠0 |
0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
14 - 31 |
0x0E-0x1F |
控制码 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
32 |
0x20 |
space |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
33 - 47 |
0x21-0x2F |
!"#$%&'()*+,-./ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
48 - 57 |
0x30-0x39 |
0123456789 |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
0 |
0 |
0 |
≠0 |
≠0 |
58 - 64 |
0x3a-0x40 |
:;<=>?@ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
65 - 70 |
0x41-0x46 |
ABCDEF |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
≠0 |
71 - 90 |
0x47-0x5A |
GHIJKLMNOPQRSTUVWXYZ |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
≠0 |
0 |
0 |
0 |
91 - 96 |
0x5B-0x60 |
[]^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | |
||||||||||||
97 -102 |
0x61-0x66 |
abcdef |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
0 |
≠0 |
0 |
≠0 |
103-122 |
0x67-0x7A |
ghijklmnopqrstuvwxyz |
0 |
≠0 |
0 |
0 |
≠0 |
0 |
≠0 |
≠0 |
0 |
≠0 |
0 |
0 |
123-126 |
0x7B-0x7E |
{|}~ |
0 |
≠0 |
0 |
0 |
≠0 |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
127 |
0x7F |
退格 (DEL) |
≠0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |