Python で文字列を操作する一般的な方法は何ですか?-Python チュートリアル-php.cn

1. はじめに

Python の開発プロセスでは、特定の関数を実装するために、文字列の結合、文字列のインターセプト、文字列のフォーマットなど、特定の文字列の特別な処理が必要になることがよくあります。

2. 文字列の結合

" " 演算子を使用すると、複数の文字列の結合を完了できます。" " 演算子は、複数の文字列を結合し、文字列オブジェクトを生成できます。

たとえば、2 つの文字列を定義し、1 つは英語版の有名な引用文を保存し、もう 1 つは中国語版の有名な引用文を保存し、" " 演算子を使用して結合します。コードは次のようになります。次のように:

mot_en = "Rememberance is a form meeting. Frgetfulness is a form of freedom"
mot_cn = "记忆是一个相遇。遗忘是一种自由。"
print(mot_en + "-" + mot_cn)

ログイン後にコピー

実行結果は次のとおりです:

Python で文字列を操作する一般的な方法は何ですか?

文字列を他のタイプのデータと結合することはできませんたとえば、次のコードを使用して文字列と数値を結合すると、例外が発生します。

str1 = "今天一共走了"
num = 23456
str2 = "步"

print(str1 + num + str2)

ログイン後にコピー

Python で文字列を操作する一般的な方法は何ですか?

#この問題を解決するには、数値全体を文字列に変換します。正の数値を文字列に変換するには、str() 関数を使用します。修正されたコードは次のとおりです:

str1 = "今天一共走了"
num = 23456
str2 = "步"

print(str1 + str(num) + str2)

ログイン後にコピー

上記のコードを実行すると、結果は次のようになります:

Python で文字列を操作する一般的な方法は何ですか?

3. 文字列の長さを計算します

異なる文字列は異なるバイトを占めるため、文字列の長さを計算するには、まず各文字列が占めるバイト数を知る必要があります。 Python では、数字、英語、小数点、アンダースコア、およびスペースは 1 バイトを占め、漢字は 2 ～ 4 バイトを占めることができ、バイト数は使用されるエンコーディングによって異なります。

Python では、文字列の長さを計算するために len() 関数が提供されます。構文形式は次のとおりです。

len(str)

ログイン後にコピー

このうち、string はカウントする文字列を指定するために使用されます。

例: 「人生は短いので、Python を使用します」という内容の文字列を定義し、len() 関数を使用して文字列の長さを計算します。コードは次のとおりです:

str1 = "人生苦短，我用Python"  # 定义字符串

string = len(str1)  # 计算字符串长度

print(string)

ログイン後にコピー

上記を実行すると、コードは「13」と表示されます

Python で文字列を操作する一般的な方法は何ですか?

実際の開発では、文字列が占めるバイト数を取得する必要がある場合があります。 UTF-8 エンコードを使用する場合、中国語の文字は 3 バイトを占有し、GBK または GB2312 を使用する場合、中国語の文字は 2 バイトを占有し、encode() メソッドを使用してエンコードして取得できます。

str1 = "人生苦短，我用Python"  # 定义字符串

string = len(str1.encode())  # 计算UTF-8编码字符串的长度

print(string)

ログイン後にコピー

コードの実行結果は次のとおりです。

Python で文字列を操作する一般的な方法は何ですか?

GBK でエンコードされた文字列の長さを取得したい場合は、次のコード:

str1 = "人生苦短，我用Python"  # 定义字符串

string = len(str1.encode("gbk"))  # 计算GBK编码字符串的长度

print(string)

ログイン後にコピー

コードの実行結果は次のとおりです:

Python で文字列を操作する一般的な方法は何ですか?

4. 文字列のインターセプト

文字列も属しているため、シーケンスを使用して文字列をインターセプトするには、スライスを使用してそれを実現できます。スライスによって文字列をインターセプトするための構文形式は次のとおりです。

string[start : end : step]

ログイン後にコピー

パラメータの説明:

string: インターセプトする文字列を示します
start: インターセプトされる最初の文字 (この文字を含む) のインデックスを示します。指定しない場合、デフォルトは "0"
end: インターセプトされる次の文字のインデックスを示します (この文字を除く)。指定されていない場合、デフォルトは文字列の長さです。
step: 文字列のステップサイズを示します。スライス, if 省略した場合のデフォルトは「1」ステップサイズを省略した場合、最後のコロンは省略可能

文字を定義し、そのサブ文字をインターセプトしますコードは次のとおりです:

str1 = "人生苦短，我用Python"  # 原生字符串
substr1 = str1[1]  # 截取第2字符
substr2 = str1[5:]  # 从第6字符截取
substr3 = str1[:5]  # 从左边数截取5个字符
substr4 = str1[2:5]  # 截取第3到第5个字符

print("原生字符串", str1)
print(substr1 + "\n" + substr2 + "\n" + substr3 + "\n" + substr4)

ログイン後にコピー

実行結果は次のとおりです:

Python で文字列を操作する一般的な方法は何ですか?

文字列インターセプトを実行するとき、指定されたインデックスが存在しない場合

Python で文字列を操作する一般的な方法は何ですか?

この問題を解決するには、try…Except ステートメントを使用して例外をスローします。コードは次のとおりです。

str1 = "人生苦短，我用Python"  # 原生字符串
try:
    sbustr1 = str1[15]
except IndexError:
    print("指定索引不存在")

ログイン後にコピー

実行結果は次のとおりです:

Python で文字列を操作する一般的な方法は何ですか?

5. 個別の文字列

Python では、文字列オブジェクトによって文字列を分割するには、文字列をリストに分割します。

文字列オブジェクトの Split() メソッドは分割を実現できます。split() メソッドの構文形式は次のとおりです:

str.split(sep,maxsplit)

ログイン後にコピー

パラメータの説明:

str: 分割する文字列を示します。
#sep: 複数の文字を含めることができる区切り文字を指定するために使用されます。デフォルトは None です。つまり、すべての空文字 (スペース、改行 "\n"、タブ " を含む) \t" "待って)
maxsplit:可选参数，用于指定分割的次数，如果不指定或者为-1，则分割次数没有限制，否则返回结果列表的元素个数最多为maxsplit+1
返回值：分隔后的字符串列表

说明：在split方法中，如果不指定sep参数，那么也不能指定maxsplit参数。

例如：定义一个百度网址的字符串，然后用split()方法根据不同的分隔符进行分割，代码如下：

str1 = "百 度 网 址 >>> https://www.baidu.com/"  #
print("原字符串", str1)
list1 = str1.split()  # 采用默认分隔符分割
list2 = str1.split(">>>")  # 采用多个分隔符分割
list3 = str1.split(".")  # 采用“.”进行分割
list4 = str1.split(" ", 4)  # 采用空格进行分割，并且只分割前四个

print(str(list1) + "\n" + str(list2) + "\n" + str(list3) + "\n" + str(list4))

ログイン後にコピー

运行结果如下：

Python で文字列を操作する一般的な方法は何ですか?

六、检索字符串

在Python中，字符串对象提供了很多应用于字符串查找的方法，这里主要介绍以下几种：

1.count()方法

检索指定字符串在列外一个字符串中出现的次数检索对象不存在，怎返回0，否则返回出现的次数，其语法如下：

str.count(sub[, start[,end]])

ログイン後にコピー

参数说明：

str：表示原字符串
sub：表示要检索的子字符串
start：可选参数，表示检索范围的起始位置的索引，如不指定，默认从头检索
end：可选参数，表示检索范围的结束位置的索引，如不指定，则检索到结尾。

2.find()方法

该方法用于检索是否包含指定的子字符串，检索对象不存在，怎返回-1，否则返回首次出现的索引值，其语法如下：

str.findt(sub[, start[,end]])

ログイン後にコピー

参数说明：

str：表示原字符串
sub：表示要检索的子字符串
start：可选参数，表示检索范围的起始位置的索引，如不指定，默认从头检索
end：可选参数，表示检索范围的结束位置的索引，如不指定，则检索到结尾。

3.index()方法

index()方法同find()方法类似，也是用于检索是否包含指定的子字符串。只不过使用index()方法，当指定的字符串不存在时，会抛出异常，其语法格式如下：

str.index(sub[, start[,end]])

ログイン後にコピー

参数说明：

str：表示原字符串
sub：表示要检索的子字符串
start：可选参数，表示检索范围的起始位置的索引，如不指定，默认从头检索
end：可选参数，表示检索范围的结束位置的索引，如不指定，则检索到结尾。

4.startswith()方法

该方法用于检索是否指定字符串开头。如果是则返回True，否则返回False。其语法格式如下：

str.startswith(prefix[, start[, end]])

ログイン後にコピー

参数说明：

str：表示原字符串
prefix：表示要检索的子字符串
start：可选参数，表示检索范围的起始位置的索引，如不指定，默认从头检索
end：可选参数，表示检索范围的结束位置的索引，如不指定，则检索到结尾。

5.endswith()方法

该方法用于检索是否指定字符串结尾。如果是则返回True，否则返回False。其语法格式如下：

str.endswith(prefix[, start[, end]])

ログイン後にコピー

参数说明：

str：表示原字符串
prefix：表示要检索的子字符串
start：可选参数，表示检索范围的起始位置的索引，如不指定，默认从头检索
end：可选参数，表示检索范围的结束位置的索引，如不指定，则检索到结尾。

七、字母的大小写转换

在Python中，字符串对象提供了lower()方法和upper()方法进行字母大小写转换。

1.lower()方法

将字符串中大写字母转换为小写，其语法如下：

str.lower()

ログイン後にコピー

2.upper()方法

将字符串中小写字母转换为大写，其语法如下：

str.upper()

ログイン後にコピー

八、去除字符串中的空格和特殊字符

这里的特殊字符是指制表符“\t”、回车符“\r”、换行符“\n”等。

1.strip()方法

strip()方法用于去除字符串左、右两侧的空格和特殊字符，语法如下：

str.strip([chars])

ログイン後にコピー

参数说明：

str：表示要去除空格字符串
chars：可选参数，用于指定要去除的字符，可以指定多个，如果设置chars为“@.”,则去除左右侧包括的“@”或“.”，如不知定，则默认去除制表符“\t”、回车符“\r”、换行符“\n”等。

2.lstrip()方法

lstrip()方法用于去除左侧的空格和特殊字符，语法格式如下：

str.lstrip([chars])

ログイン後にコピー

参数说明：

str：表示要去除空格字符串
chars：可选参数，用于指定要去除的字符，可以指定多个，如果设置chars为“@.”,则去除左侧包括的“@”或“.”，如不知定，则默认去除制表符“\t”、回车符“\r”、换行符“\n”等。

3.rstrip()方法

rstrip()方法用于去除右侧的空格和特殊字符，语法格式如下：

str.rstrip([chars])

ログイン後にコピー

参数说明：

str：表示要去除空格字符串
chars：可选参数，用于指定要去除的字符，可以指定多个，如果设置chars为“@.”,则去除右侧包括的“@”或“.”，如不知定，则默认去除制表符“\t”、回车符“\r”、换行符“\n”等。

九、格式化字符串

Python 的字符串格式化有两种方式: “% ”操作符方式，字符串对象的format() 方法

1.使用“ %”操作符

【1】 % 格式化方式

%[(name)][flags][width].[precision]typecode

    (name): 可选，用于选择指定的key
    flags: 可选，可供选择的值有:
        +: 右对齐；正数前加正好，负数前加负号；
        -: 左对齐；正数前无符号，负数前加负号；
         : 右对齐；正数前加空格，负数前加负号；
        0: 右对齐；正数前无符号，负数前加负号；用 0 填充空白处
    width: 可选，占有宽度
    .precision: 可选，小数点后保留的位数
    typecode: 必选
        s，获取传入对象的 __str__ 方法的返回值，并将其格式化到指定位置
        r，获取传入对象的 __repr__ 方法的返回值，并将其格式化到指定位置
        c，整数：将数字转换成其 unicode 对应的值，10进制范围为 0 <= i <= 1114111（py27则只支持 0-255）；字符：将字符添加到指定位置
        o，将整数转换成八进制表示，并将其格式化到指定位置
        x，将整数转换成十六进制表示，并将其格式化到指定位置
        d，将整数、浮点数转换成十进制表示，并将其格式化到指定位置
        e，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（小写 e ）
        E，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（大写 E ）
        f，将整数、浮点数转换成浮点数表示，并将其格式化到指定位置（默认保留小数点后6位）
        F，同上
        g，自动调整将整数、浮点数转换成 浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是 e；）
        G，自动调整将整数、浮点数转换成 浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是 E；）
        %，当字符串中存在格式化标志时，需要用 %% 表示一个百分号

ログイン後にコピー

【2】% 格式化方式例子

[[fill]align][sign][#][0][width][,][.precision][type]

        fill: 【可选】空白处填充的字符
        align:【可选】对齐方式（需配合width使用）
            <: 内容左对齐
            >: 内容右对齐(默认)
            ＝: 内容右对齐，将符号放置在填充字符的左侧，且只对数字类型有效。 即使：符号 + 填充物 + 数字
            ^: 内容居中
        sign: 【可选】有无符号数字
            +: 正号加正，负号加负；
            -: 正号不变，负号加负；
            空格: 正号空格，负号加负；
        #：【可选】对于二进制、八进制、十六进制，如果加上 #，会显示 0b/0o/0x，否则不显示
        ,: 【可选】为数字添加分隔符，如：1,000,000
        width: 【可选】格式化位所占宽度
        .precision: 【可选】小数位保留精度
        type: 【可选】格式化类型
            传入” 字符串类型 “的参数
                s: 格式化字符串类型数据
                空白: 未指定类型，则默认是 None，同 s
            传入“ 整数类型 ”的参数
                b: 将十进制整数自动转换成二进制表示然后格式化
                c: 将十进制整数自动转换为其对应的 unicode 字符
                d: 十进制整数
                o: 将十进制整数自动转换成8进制表示然后格式化；
                x: 将十进制整数自动转换成16进制表示然后格式化（小写 x ）
                X: 将十进制整数自动转换成16进制表示然后格式化（大写 X ）
            传入“ 浮点型或小数类型 ”的参数
                e: 转换为科学计数法（小写 e ）表示，然后格式化；
                E: 转换为科学计数法（大写 E ）表示，然后格式化;
                f: 转换为浮点型（默认小数点后保留 6 位）表示，然后格式化；
                F: 转换为浮点型（默认小数点后保留 6 位）表示，然后格式化；
                g: 自动在e和f中切换
                G: 自动在E和F中切换
                %: 显示百分比（默认显示小数点后 6 位）

ログイン後にコピー

2.字符串对象的format() 方法

【1】 format 格式化方式

# 字符串格式化

print("I am %s, %d years old." % ("Y", 18))
print("I am %s, %s years old." % ("Y", 18))
print("I am %s, %s years old." % ("Y", ["18"]))
print("I am %s, %s years old." % ("Y", (18,)))

# 保留
print("percent %0.2f%%." % 23.36666)
# 截取
print("percent %.5s." % 23.36666)

# 字典形式
print("I am %(name)s, %(age)d years old." % {"name": "Y", "age": 18})

# 其他
print("I am \033[42;1m%(name)10s\033[0m, "
      "\033[42;1m%(age)-10d\033[0m years old."
      % {"name": "Y", "age": 18})

print("user", "root", "password", "root", sep=":")

ログイン後にコピー

运行结果：

Python で文字列を操作する一般的な方法は何ですか?

【2】format 格式化方式例子

# format 格式
print("I am {}, {} years old, who is {}.".format("Y", "22", "wise"))
print("I am {0}, {1} years old, who is {2}.".format("Y", "22", "wise"))
print("I am {1}, {1} years old, who is {1}.".format("Y", "22", "wise"))

print("I am {name}, {age} years old, who is {adj}.".format(name="Y", age="22", adj="wise"))
print("I am {name}, {age} years old, who is {adj}.".format(**{"name": "Y", "age": "22", "adj": "wise"}))

print("I am {0[0]}, {0[1]} years old, who is {0[2]}.".format(["Y", "22", "wise"], [1, 2, 3]))
print("I am {:s}, {:d} years old, who is {:f}.".format("good", 122, 12.22))
print("I am {:s}, {:d} years old, who is {:f}.".format(*["good", 122, 12.22]))

# 进制，百分比
print("number: {:b}, {:o}, {:d}, {:x}, {:X}, {:0.2%}".format(12, 15, 17, 999, 999, 0.55))

ログイン後にコピー

运行结果：

Python で文字列を操作する一般的な方法は何ですか?