Python程序提取字符串直到第一个非字母数字字符

王林
发布: 2023-09-11 12:49:02
转载
1287 人浏览过

Python程序提取字符串直到第一个非字母数字字符

Python 字符串是表示信息或数据的字符序列。普通字符串可以包含用单引号或双引号括起来的各种字符,但字母数字字符串仅包含数字字母字母数字非字母数字字符串都在各种场景中使用和应用,包括密码保护、数据处理和验证、格式化等。

可以识别和提取特定模式。我们还可以使用这些类型的字符串提供不同的组合。我们将根据这些字符串执行操作。我们的任务是提取字符串,直到遇到第一个非字母数字字符。

理解问题

在遇到非字母数字字符之前,我们必须从原始字符串中提取子字符串。让我们通过一个例子来理解这一点。

输入输出场景

让我们考虑一个具有以下值的字典 -

Input: Inp_STR = "Sales18@22!Roam"
登录后复制

给定的字符串由字母、数字和特殊字符组成。一旦遇到非字母数字字符,我们就必须检索子字符串。

Output: Sales18
登录后复制

我们可以看到,从原始字符串中返回了一个子字符串“Sales18”,因为在此之后遇到了非字母数字字符,即“@”。现在我们已经理解了问题陈述,让我们讨论一些解决方案。

使用迭代

这是根据提供的条件提取字符串的基本且更简单的方法。我们将传递一个字符串并创建一个新变量,该变量将存储所有字母数字字符,即字母(大写和小写)和数字。之后,我们将遍历原始字符串并迭代每个字符。

我们将建立一个条件来检查原始字符串中的字符是否是字母数字。一旦遇到非字母数字字符,循环将中断并返回子字符串。

示例

以下是提取字符串直到第一个非字母数字字符的示例 -

Inp_STR = "Sales18@22Roam" print(f"The original string is: {Inp_STR}") ExSTR = "" alphaNum = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz1234567890" for x in Inp_STR: if x not in alphaNum: break else: ExSTR += x print(f"The extracted string till 1st Non-Alphanumeric character: {ExSTR}")
登录后复制

输出

The original string is: Sales18@22Roam The extracted string till 1st Non-Alphanumeric character: Sales18
登录后复制
登录后复制

使用正则表达式模块 + Search()

Regex 模块或“re”模块是一个强大的编程工具,用于搜索和匹配模式。这些模式以独特的表达式的形式传递。使用此模块,我们将检测原始字符串中的非字母数字模式并检索第一次遇到的序列。我们使用“search()”函数在字符串中搜索由表达式“W+”表示的非字母数字模式。

W”表示非字母数字类,“+”设置非字母数字字符的连续匹配逻辑。“.start()”方法返回匹配子字符串的起始索引,该索引值将用于检索所需的子字符串。

示例

以下是一个示例 -

import re Inp_STR = "Sales18@22Roam" print(f"The original string is: {Inp_STR}") ExSTR = re.search(r"\W+", Inp_STR).start() print(f"The 1st non-alphanumeric character is encountered at: {ExSTR}") ExSTR = Inp_STR[ : ExSTR] print(f"The extracted string till 1st Non-Alphanumeric character: {ExSTR}")
登录后复制

输出

The original string is: Sales18@22Roam The 1st non-alphanumeric character is encountered at: 7 The extracted string till 1st Non-Alphanumeric character: Sales18
登录后复制
登录后复制

使用 Regex 模块 + Findall()

这是提取字符串直到遇到第一个非字母数字字符的另一种方法。在这种方法中,我们将使用 re 模块中的“findall()”函数来查找所有出现的由字母数字字符组成的子字符串。

将获得匹配子字符串的列表,我们将使用“0”索引值检索第一个子字符串。我们将使用正则表达式:“[dA-Za-z]*”,它表示一行中的零个或多个字母数字字符。

正则表达式符号“d”匹配0到9之间的任何数字,“A-Z”匹配A到Z之间的任何大写字母,“a-z< /b>” 匹配 a 到 z 之间的任何小写字母。

示例

以下是一个示例 -

import re Inp_STR = "Sales18@22Roam" print(f"The original string is: {Inp_STR}") ExSTR = re.findall(r"[\dA-Za-z]*", Inp_STR)[0] print(f"The extracted string till 1st Non-Alphanumeric character: {ExSTR}")
登录后复制

输出

The original string is: Sales18@22Roam The extracted string till 1st Non-Alphanumeric character: Sales18
登录后复制
登录后复制

使用 Isalnum() 方法

在这种方法中,我们将迭代原始字符串中每个字符的索引,并建立一个条件来检查索引“x”处的字符是否不是字母数字。这是在“isalnum()”方法的帮助下完成的,该方法确定字符串的字母数字性质。之后,我们将使用列表切片来提取字符串,直到第一个字母数字字符。

示例

以下是一个示例 -

Inp_STR = "Sales18@22Roam" print(f"The original string is: {Inp_STR}") for x in range(len(Inp_STR)): if not Inp_STR[x].isalnum(): ExSTR = Inp_STR[:x] print(f"The 1st non-alphanumeric character is encountered at: {x}") break else: ExSTR = Inp_STR print(f"The extracted string till 1st Non-Alphanumeric character: {ExSTR}")
登录后复制

输出

The original string is: Sales18@22Roam The 1st non-alphanumeric character is encountered at: 7 The extracted string till 1st Non-Alphanumeric character: Sales18
登录后复制
登录后复制

结论

在本文中,我们讨论了一些高效且优化的解决方案,用于在遇到第一个非字母数字字符时从字符串中提取子字符串。我们了解简单和粗暴的解决方案以及先进和优化的解决方案。我们使用正则表达式模块并使用其“search()”和“findall()”函数来提取相关字符串。最后,我们讨论了另一种基于列表切片的解决方案,其中涉及使用“isalnum()”方法。

以上是Python程序提取字符串直到第一个非字母数字字符的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:tutorialspoint.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!