问题:
尽管尝试显式转换 a 中的指定列DataFrame 到字符串,它们保留为 dtype 'object'。检查各个列值确认它们确实是字符串。
Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 non-null values attr5 56992 non-null values attr6 56992 non-null values dtypes: int64(2), object(5) Column 'attr2' remains as dtype 'object' despite conversion: convert attr2 to string
说明:
Pandas 使用 dtype 'object' 来描述包含可变长度数据类型的列,例如字符串。这与“int64”和“float64”等固定长度数据类型不同。在内部,Pandas 使用指向“对象”ndarray 中的字符串对象的指针来存储字符串数据。
int64 array: [1, 2, 3, 4] object array: [pointer to string 'John', pointer to string 'Mary', pointer to string 'Bob', pointer to string 'Alice']
“dtype 对象”并不意味着其中的对象不是字符串。每个字符串对象仍然驻留在内存中,并且可以通过“对象”ndarray 中的指针进行访问。
为了确保 Pandas 将列识别为字符串,请确保这些列中的所有元素都是一致的字符串。此外,还可以使用 .apply(str) 或 .astype('string') 等方法将元素转换为字符串。
以上是为什么我的 DataFrame 列在字符串转换后显示'Object”数据类型?的详细内容。更多信息请关注PHP中文网其他相关文章!