Zusammenfassung der Python-Strings, zum Sammeln empfohlen!-Python-Tutorial-php.cn

Zusammenfassung der Python-Strings, zum Sammeln empfohlen!

Was ist ein Python-String?

Ein String ist ein Objekt, das eine Folge von Zeichen enthält. Zeichen sind Zeichenfolgen der Länge 1. In Python sind einzelne Zeichen auch Zeichenfolgen. Interessanter ist jedoch, dass es in der Programmiersprache Python keinen Zeichendatentyp gibt, in anderen Programmiersprachen wie C, Kotlin und Java jedoch Zeichendatentypen. Wir können einfache Anführungszeichen, doppelte Anführungszeichen und dreifache Anführungszeichen verwenden oder str()-Funktion zum Deklarieren von Python-Strings. Der folgende Codeausschnitt zeigt, wie man einen String in Python deklariert:

# A single quote string
single_quote = 'a'# This is an example of a character in other programming languages. It is a string in Python
# Another single quote string
another_single_quote = 'Programming teaches you patience.'
# A double quote string
double_quote = "aa"
# Another double-quote string
another_double_quote = "It is impossible until it is done!"
# A triple quote string
triple_quote = '''aaa'''
# Also a triple quote string
another_triple_quote = """Welcome to the Python programming language. Ready, 1, 2, 3, Go!"""
# Using the str() function
string_function = str(123.45)# str() converts float data type to string data type
# Another str() function
another_string_function = str(True)# str() converts a boolean data type to string data type
# An empty string
empty_string = ''
# Also an empty string
second_empty_string = ""
# We are not done yet
third_empty_string = """"""# This is also an empty string: ''''''

Nach dem Login kopieren

Eine andere Möglichkeit, einen String in Python zu erhalten, ist die Verwendung der Funktion input(). Die Funktion input() ermöglicht es uns, eingegebene Werte über die Tastatur in das Programm einzufügen. Eingefügte Werte werden als Strings gelesen, aber wir können sie in andere Datentypen konvertieren:

# Inputs into a Python program
input_float = input()# Type in: 3.142
input_boolean = input() # Type in: True
# Convert inputs into other data types
convert_float = float(input_float)# converts the string data type to a float
convert_boolean = bool(input_boolean) # converts the string data type to a bool

Nach dem Login kopieren

Wir verwenden die Funktion type(), um den Datentyp eines Objekts in Python zu bestimmen, das die Klasse des Objekts zurückgibt. Wenn das Objekt eine Zeichenfolge ist, wird die Klasse str zurückgegeben. Wenn das Objekt ein Wörterbuch, eine Ganzzahl, eine Gleitkommazahl, ein Tupel oder ein Boolescher Wert ist, gibt es entsprechend die Klassen dict, int, float, tuple und bool zurück. Lassen Sie uns nun die Funktion type() verwenden, um den Datentyp der im vorherigen Codeausschnitt deklarierten Variablen zu bestimmen:

# Data types/ classes with type()
print(type(single_quote))
print(type(another_triple_quote))
print(type(empty_string))
print(type(input_float))
print(type(input_boolean))
print(type(convert_float))
print(type(convert_boolean))

Nach dem Login kopieren

ASCII-Tabelle mit Python-Zeichenfolgen

American Standard Code for Information Interchange (ASCII) soll uns bei der Zuordnung helfen Zeichen oder Text in Zahlen umwandeln, da sich Zahlensätze leichter im Computerspeicher speichern lassen als Text. ASCII kodiert 128 Zeichen hauptsächlich im Englischen und wird zur Informationsverarbeitung in Computern und bei der Programmierung verwendet. Zu den ASCII-kodierten englischen Zeichen gehören Kleinbuchstaben (a-z), Großbuchstaben (A-Z), Zahlen (0-9) sowie Satzzeichen und andere Symbole. Die Funktion

ord() konvertiert eine Python-Zeichenfolge der Länge 1 (ein Zeichen). Dezimaldarstellung in der ASCII-Tabelle, und die Funktion chr() konvertiert die Dezimaldarstellung zurück in eine Zeichenfolge. Zum Beispiel:

import string
# Convert uppercase characters to their ASCII decimal numbers
ascii_upper_case = string.ascii_uppercase# Output: ABCDEFGHIJKLMNOPQRSTUVWXYZ
for one_letter in ascii_upper_case[:5]:# Loop through ABCDE
print(ord(one_letter))

Nach dem Login kopieren

Ausgabe:

Nach dem Login kopieren

# Convert digit characters to their ASCII decimal numbers
ascii_digits = string.digits# Output: 0123456789
for one_digit in ascii_digits[:5]:# Loop through 01234
print(ord(one_digit))

Nach dem Login kopieren

Ausgabe:

Nach dem Login kopieren

Im obigen Codeausschnitt durchlaufen wir die Zeichenfolgen ABCDE und 01234 und konvertieren jedes Zeichen in seine Dezimaldarstellung in der ASCII-Tabelle. Wir können auch die Funktion chr() verwenden, um den umgekehrten Vorgang durchzuführen und die Dezimalzahlen in der ASCII-Tabelle in ihre Python-Zeichenfolgen umzuwandeln. Zum Beispiel:

decimal_rep_ascii = [37, 44, 63, 82, 100]
for one_decimal in decimal_rep_ascii:
print(chr(one_decimal))

Nach dem Login kopieren

Ausgabe:

%
,
?
R
d

Nach dem Login kopieren

In der ASCII-Tabelle werden die Zeichenfolgenzeichen in der Ausgabe des obigen Programms ihren jeweiligen Dezimalzahlen zugeordnet.

String-Eigenschaften

Nullindex: Der Index des ersten Elements im string ist Null und der Index des letzten Elements ist len(string) - 1. Zum Beispiel:

immutable_string = "Accountability"
print(len(immutable_string))
print(immutable_string.index('A'))
print(immutable_string.index('y'))

Nach dem Login kopieren

Ausgabe:

14
0
13

Nach dem Login kopieren

Unveränderlichkeit: Dies bedeutet, dass wir die Zeichen in der Zeichenfolge nicht aktualisieren können. Beispielsweise können wir kein Element aus einer Zeichenfolge entfernen oder versuchen, an einer seiner Indexpositionen ein neues Element zuzuweisen. Wenn wir versuchen, die Zeichenfolge zu aktualisieren, wird TypeError:

immutable_string = "Accountability"
# Assign a new element at index 0
immutable_string[0] = 'B'

Nach dem Login kopieren

Output:

---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
~AppDataLocalTemp/ipykernel_11336/2351953155.py in
2
3 # Assign a new element at index 0
----> 4 immutable_string[0] = 'B'
TypeError: 'str' object does not support item assignment

Nach dem Login kopieren

ausgegeben. Wir können die Zeichenfolge jedoch der Variablen „immutable_string“ neu zuweisen. Dabei sollten wir beachten, dass es sich nicht um dieselbe Zeichenfolge handelt, da sie nicht auf die Erinnerung verweisen das gleiche Objekt. Python aktualisiert das alte String-Objekt nicht; es erstellt ein neues, wie wir an den IDs sehen können:

immutable_string = "Accountability"
print(id(immutable_string))
immutable_string = "Bccountability"
print(id(immutable_string)
test_immutable = immutable_string
print(id(test_immutable))

Nach dem Login kopieren

Ausgabe:

2693751670576
2693751671024
2693751671024

Nach dem Login kopieren

Die beiden oben genannten IDs sind auch auf demselben Computer unterschiedlich, was bedeutet, dass beide immutable_string-Variablen auf zeigen verschiedene Adressen im Speicher. Wir weisen die letzte immutable_string-Variable der test_immutable-Variable zu. Sie können sehen, dass die test_immutable-Variable und die letzte immutable_string-Variable auf dieselbe Adresse verweisen.

Verkettung: Verketten Sie zwei oder mehr Zeichenfolgen, um eine neue Zeichenfolge mit +-Zeichen zu erhalten. Zum Beispiel:

first_string = "Zhou"
second_string = "luobo"
third_string = "Learn Python"
fourth_string = first_string + second_string
print(fourth_string)
fifth_string = fourth_string + " " + third_string
print(fifth_string)

Nach dem Login kopieren

Ausgabe:

Zhouluobo
Zhouluobo Learn Python

Nach dem Login kopieren

Wiederholen: Zeichenfolgen können mit dem *-Symbol wiederholt werden. Zum Beispiel:

print("Ha" * 3)

Nach dem Login kopieren

Ausgabe:

HaHaHa

Nach dem Login kopieren

Indizierung und Slicing: Wir haben festgestellt, dass Zeichenfolgen von Null an indiziert werden und wir über seinen Indexwert auf jedes Element in der Zeichenfolge zugreifen können. Wir können auch eine Teilmenge einer Zeichenfolge erhalten, indem wir zwischen zwei Indexwerten schneiden. Zum Beispiel:

main_string = "I learned English and Python with ZHouluobo. You can do it too!"
# Index 0
print(main_string[0])
# Index 1
print(main_string[1])
# Check if Index 1 is whitespace
print(main_string[1].isspace())
# Slicing 1
print(main_string[0:11])
# Slicing 2:
print(main_string[-18:])
# Slicing and concatenation
print(main_string[0:11] + ". " + main_string[-18:])

Nach dem Login kopieren

Ausgabe:

I
True
I learned English
You can do it too!
I learned English. You can do it too!

Nach dem Login kopieren

String-Methode

str.split(sep=None, maxsplit=-1): Die String-Aufteilungsmethode enthält zwei Attribute: sep und maxsplit. Wenn diese Methode mit ihrem Standardwert aufgerufen wird, teilt sie die Zeichenfolge überall dort auf, wo Leerzeichen vorhanden sind. Diese Methode gibt eine Liste von Zeichenfolgen zurück:

string = "Apple, Banana, Orange, Blueberry"
print(string.split())

Nach dem Login kopieren

Ausgabe:

['Apple,', 'Banana,', 'Orange,', 'Blueberry']

Nach dem Login kopieren

Wir können sehen, dass die Zeichenfolge nicht gut aufgeteilt ist, da die geteilte Zeichenfolge , enthält. Wir können sep=',' verwenden, um zu teilen, wo ein , :

print(string.split(sep=','))

Nach dem Login kopieren

Ausgabe:

['Apple', ' Banana', ' Orange', ' Blueberry']

Nach dem Login kopieren

Das ist besser als die vorherige Aufteilung, aber wir können Leerzeichen vor einigen der geteilten Zeichenfolgen sehen. Sie können es mit (sep=', ') entfernen:

# Notice the whitespace after the comma
print(string.split(sep=', '))

Nach dem Login kopieren

Ausgabe:

['Apple', 'Banana', 'Orange', 'Blueberry']

Nach dem Login kopieren

Jetzt ist die Zeichenfolge schön aufgeteilt. Manchmal möchten wir nicht die maximale Anzahl an Teilen aufteilen. Wir können das Attribut maxsplit verwenden, um anzugeben, wie oft wir aufteilen möchten:

print(string.split(sep=', ', maxsplit=1))
print(string.split(sep=', ', maxsplit=2))

Nach dem Login kopieren

Ausgabe:

['Apple', 'Banana, Orange, Blueberry']
['Apple', 'Banana', 'Orange, Blueberry']

Nach dem Login kopieren

str.splitlines(keepends=False)：有时我们想处理一个在边界处具有不同换行符（'n'、nn'、'r'、'rn'）的语料库。我们要拆分成句子，而不是单个单词。可以使用 splitline 方法来执行此操作。当 keepends=True 时，文本中包含换行符；否则它们被排除在外

import nltk# You may have to `pip install nltk` to use this library.
macbeth = nltk.corpus.gutenberg.raw('shakespeare-macbeth.txt')
print(macbeth.splitlines(keepends=True)[:5]

Nach dem Login kopieren

Output:

['[The Tragedie of Macbeth by William Shakespeare 1603]n', 'n', 'n', 'Actus Primus. Scoena Prima.n', 'n']

Nach dem Login kopieren

str.strip([chars])：我们使用 strip 方法从字符串的两侧删除尾随空格或字符。例如：

string = "Apple Apple Apple no apple in the box apple apple "
stripped_string = string.strip()
print(stripped_string)
left_stripped_string = (
stripped_string
.lstrip('Apple')
.lstrip()
.lstrip('Apple')
.lstrip()
.lstrip('Apple')
.lstrip()
)
print(left_stripped_string)
capitalized_string = left_stripped_string.capitalize()
print(capitalized_string)
right_stripped_string = (
capitalized_string
.rstrip('apple')
.rstrip()
.rstrip('apple')
.rstrip()
)
print(right_stripped_string)

Nach dem Login kopieren

Output:

Apple Apple Apple no apple in the box apple apple
no apple in the box apple apple
No apple in the box apple apple
No apple in the box

Nach dem Login kopieren

在上面的代码片段中，我们使用了 lstrip 和 rstrip 方法，它们分别从字符串的左侧和右侧删除尾随空格或字符。我们还使用了 capitalize 方法，它将字符串转换为句子大小写str.zfill(width)： zfill 方法用 0 前缀填充字符串以获得指定的宽度。例如：

example = "0.8"# len(example) is 3
example_zfill = example.zfill(5) # len(example_zfill) is 5
print(example_zfill)

Nach dem Login kopieren

Output:

000.8

Nach dem Login kopieren

str.isalpha()：如果字符串中的所有字符都是字母，该方法返回True；否则返回 False：

# Alphabet string
alphabet_one = "Learning"
print(alphabet_one.isalpha())
# Contains whitspace
alphabet_two = "Learning Python"
print(alphabet_two.isalpha())
# Contains comma symbols
alphabet_three = "Learning,"
print(alphabet_three.isalpha())

Nach dem Login kopieren

Output:

True
False
False

Nach dem Login kopieren

如果字符串字符是字母数字，str.isalnum() 返回 True；如果字符串字符是十进制，str.isdecimal() 返回 True；如果字符串字符是数字，str.isdigit() 返回 True；如果字符串字符是数字，则 str.isnumeric() 返回 True

如果字符串中的所有字符都是小写，str.islower() 返回 True；如果字符串中的所有字符都是大写，str.isupper() 返回 True；如果每个单词的首字母大写，str.istitle() 返回 True：

# islower() example
string_one = "Artificial Neural Network"
print(string_one.islower())
string_two = string_one.lower()# converts string to lowercase
print(string_two.islower())
# isupper() example
string_three = string_one.upper() # converts string to uppercase
print(string_three.isupper())
# istitle() example
print(string_one.istitle())

Nach dem Login kopieren

Output:

False
True
True
True

Nach dem Login kopieren

str.endswith(suffix) 返回 True 是以指定后缀结尾的字符串。如果字符串以指定的前缀开头，str.startswith(prefix) 返回 True：

sentences = ['Time to master data science', 'I love statistical computing', 'Eat, sleep, code']
# endswith() example
for one_sentence in sentences:
print(one_sentence.endswith(('science', 'computing', 'Code')))

Nach dem Login kopieren

Output:

True
True
False

Nach dem Login kopieren

# startswith() example
for one_sentence in sentences:
print(one_sentence.startswith(('Time', 'I ', 'Ea')))

Nach dem Login kopieren

Output:

True
True
True

Nach dem Login kopieren

str.find(substring) 如果子字符串存在于字符串中，则返回最低索引；否则它返回 -1。str.rfind(substring) 返回最高索引。如果找到，str.index(substring) 和 str.rindex(substring) 也分别返回子字符串的最低和最高索引。如果字符串中不存在子字符串，则会引发 ValueError

string = "programming"
# find() and rfind() examples
print(string.find('m'))
print(string.find('pro'))
print(string.rfind('m'))
print(string.rfind('game'))
# index() and rindex() examples
print(string.index('m'))
print(string.index('pro'))
print(string.rindex('m'))
print(string.rindex('game'))

Nach dem Login kopieren

Output:

6
0
7
-1
6
0
7
---------------------------------------------------------------------------
ValueErrorTraceback (most recent call last)
~AppDataLocalTemp/ipykernel_11336/3954098241.py in
 11 print(string.index('pro'))# Output: 0
 12 print(string.rindex('m'))# Output: 7
---> 13 print(string.rindex('game'))# Output: ValueError: substring not found
ValueError: substring not found

Nach dem Login kopieren

str.maketrans(dict_map) 从字典映射创建一个翻译表，str.translate(maketrans) 用它们的新值替换翻译中的元素。例如：

example = "abcde"
mapped = {'a':'1', 'b':'2', 'c':'3', 'd':'4', 'e':'5'}
print(example.translate(example.maketrans(mapped)))

Nach dem Login kopieren

Output:

Nach dem Login kopieren

字符串操作

循环遍历一个字符串

字符串是可迭代的，因此它们支持使用 for 循环和枚举的循环操作：

# For-loop example
word = "bank"
for letter in word:
print(letter)

Nach dem Login kopieren

Output:

b
a
n
k

Nach dem Login kopieren

# Enumerate example
for idx, value in enumerate(word):
print(idx, value)

Nach dem Login kopieren

Output:

0 b
1 a
2 n
3 k

Nach dem Login kopieren

字符串和关系运算符

当使用关系运算符（>、<、== 等）比较两个字符串时，两个字符串的元素按其 ASCII 十进制数字逐个索引进行比较。例如：

print('a' > 'b')
print('abc' > 'b')

Nach dem Login kopieren

Output:

False
False

Nach dem Login kopieren

在这两种情况下，输出都是 False。关系运算符首先比较两个字符串的索引 0 上元素的 ASCII 十进制数。由于 b 大于 a，因此返回 False；在这种情况下，其他元素的 ASCII 十进制数字和字符串的长度无关紧要

当字符串长度相同时，它比较从索引 0 开始的每个元素的 ASCII 十进制数，直到找到具有不同 ASCII 十进制数的元素。例如：

print('abd' > 'abc')

Nach dem Login kopieren

Output:

True

Nach dem Login kopieren

检查字符串的成员资格

in 运算符用于检查子字符串是否是字符串的成员：

print('data' in 'dataquest')
print('gram' in 'programming')

Nach dem Login kopieren

Output:

True
True

Nach dem Login kopieren

检查字符串成员资格、替换子字符串或匹配模式的另一种方法是使用正则表达式

import re
substring = 'gram'
string = 'programming'
replacement = '1234'
# Check membership
print(re.search(substring, string))
# Replace string
print(re.sub(substring, replacement, string))

Nach dem Login kopieren

Output:

pro1234ming

Nach dem Login kopieren

字符串格式

f-string 和 str.format() 方法用于格式化字符串。两者都使用大括号 {} 占位符。例如：

monday, tuesday, wednesday = "Monday", "Tuesday", "Wednesday"
format_string_one = "{} {} {}".format(monday, tuesday, wednesday)
print(format_string_one)
format_string_two = "{2} {1} {0}".format(monday, tuesday, wednesday)
print(format_string_two)
format_string_three = "{one} {two} {three}".format(one=tuesday, two=wednesday, three=monday)
print(format_string_three)
format_string_four = f"{monday} {tuesday} {wednesday}"
print(format_string_four)

Nach dem Login kopieren

Output:

Monday Tuesday Wednesday
Wednesday Tuesday Monday
Tuesday Wednesday Monday
Monday Tuesday Wednesday

Nach dem Login kopieren

f-strings 更具可读性，并且它们比 str.format() 方法实现得更快。因此，f-string 是字符串格式化的首选方法

处理引号和撇号

撇号 (') 在 Python 中表示一个字符串。为了让 Python 知道我们不是在处理字符串，我们必须使用 Python 转义字符 ()。因此撇号在 Python 中表示为 '。与处理撇号不同，Python 中有很多处理引号的方法。它们包括以下内容：

# 1. Represent string with single quote (`""`) and quoted statement with double quote (`""`)
quotes_one ='"Friends don't let friends use minibatches larger than 32" - Yann LeCun'
print(quotes_one)
# 2. Represent string with double quote `("")` and quoted statement with escape and double quote `("statement")`
quotes_two =""Friends don't let friends use minibatches larger than 32" - Yann LeCun"
print(quotes_two)
# 3. Represent string with triple quote `("""""")` and quoted statment with double quote ("")
quote_three = """"Friends don't let friends use minibatches larger than 32" - Yann LeCun"""
print(quote_three)

Nach dem Login kopieren

Output:

"Friends don't let friends use minibatches larger than 32" - Yann LeCun
"Friends don't let friends use minibatches larger than 32" - Yann LeCun
"Friends don't let friends use minibatches larger than 32" - Yann LeCun

Nach dem Login kopieren

写在最后

字符串作为编程语言当中最为常见的数据类型，熟练而灵活的掌握其各种属性和方法，实在是太重要了，小伙伴们千万要实时温习，处处留心哦！

好了，这就是今天分享的内容，如果喜欢就点个赞吧~

Das obige ist der detaillierte Inhalt vonZusammenfassung der Python-Strings, zum Sammeln empfohlen!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!