自動テスト: Python のいくつかの一般的なプログラミングパターン-Python チュートリアル-php.cn

自動テスト: Python のいくつかの一般的なプログラミングパターン

王林

リリース： 2023-04-13 21:04:01

転載

2872 人が閲覧しました

自動テスト: Python のいくつかの一般的なプログラミングパターン

この章では、主に Python にはどのようなプログラミングモードがあるのかを理解し、Python の基本的な構文を習得し、理解できるようにするために、「Python の構文仕様とデータ型」に関する内容を更新します。コマンドラインパラメータの出力方法と基本的な応用 Python のデータ型を理解すると、さらに関連した操作を実行できるようになります。

一般的なプログラミングパターン

①Python 対話型コマンドプログラミング。

②Pythonスクリプトプログラミング。

③中国語のエンコード処理。

1. 対話型コマンドプログラミングモード

対話型コマンドプログラミングモードは、典型的な 1 行ずつの読み取り実行モードです。

このプログラミングモードは、プログラムが 1 行以下の場合の一般的なアプリケーションです。

次の図では、プログラミングに PythonIDLE エディターを使用しています。このエディターのプログラミングモードは、典型的な対話型コマンドエンコーディングシンボルです。

#>>>> は、対話型コマンドを入力するためのプロンプトです。入力完了後に Enter キーを押すたびに、Python パーサーによってコマンドが実行されます。

自動テスト: Python のいくつかの一般的なプログラミングパターン

2. スクリプトプログラミングモード

コードのより複雑または大規模なセクションを記述する必要がある場合、命令型プログラミングは十分便利ではありません。

したがって、Python はスクリプトプログラミングモードを提供します。接尾辞 *.py が付いたスクリプトファイルを作成し、そのファイルに大量のコードを書き込むと、コードのメンテナンスと更新が容易になり、対話型コマンドまたは IDE ツールを使用して実行できます。

自動テスト: Python のいくつかの一般的なプログラミングパターン #3. 文字プログラミング

String はデータ型です。ただし、文字列には特殊なエンコードの問題があります。

コンピュータは数値のみを処理できるため、テキストを処理する場合は、処理する前にまずテキストを数値に変換する必要があります。

補足: 文字エンコーディングの開発の歴史

初期のコンピュータでは、設計時に 1 バイトとして 8 ビットが使用されていたため、1 バイトで表現できる最大の整数は 255 (2 進数) になります。 11111111 = 10 進数の 255)、より大きな整数を表現したい場合は、より多くのバイトを使用する必要があります。たとえば、2 バイトで表現できる最大整数は 65535、4 バイトで表現できる最大整数は 4294967295 です。

コンピューターはアメリカ人によって発明されて以来、最初にコンピューターにエンコードされたのは、英語の大文字と小文字、数字、および一部の記号の 127 文字だけでした。このエンコードテーブルは ASCII エンコードと呼ばれます。文字文字 A のコードは 65、小文字 z のコードは 122 です。

自動テスト: Python のいくつかの一般的なプログラミングパターン拡張機能: unicode 文字セット

Python3 が中国語の文字化け問題をうまく解決できる理由は、Python3 がすべての文字列の文字エンコーディングに Unicode を使用しているためです。

##● Unicode は、文字化けを防ぐために、すべての言語を 1 つのコードセットに統一します。

# Unicode も絶えず開発されていますが、最も一般的に使用されるのは 2 バイトを使用して文字を表すことです (非常にまれな文字に遭遇した場合は 4 バイトが必要です)。現在、ほとんどのオペレーティングシステムとほとんどのプログラミング言語が Unicode をサポートしています。

ASCII エンコードは 1 バイトですが、Unicode エンコードは通常 2 バイトです。

拡張子: UTF-8 文字セット

また新たな問題が発生:

Unicode エンコーディングに統一されれば、コード化けの問題は解消されます。ただし、作成するテキストが基本的にすべて英語の場合、Unicode エンコードは ASCII エンコードの 2 倍のストレージ容量を必要とし、ストレージと送信の点で非常に不経済です。

ソリューションの誕生:

Unicode エンコードを「可変長エンコード」に変換する UTF-8 エンコードが再び登場しました。

#UTF-8 エンコーディングは、Unicode 文字をさまざまな数値サイズに応じて 1 ～ 6 バイトにエンコードします。一般的に使用される英語の文字は 1 バイトにエンコードされ、中国語の文字は通常 3 バイトにエンコードされます。非常にまれな文字のみがエンコードされます。 4 ～ 6 バイトにエンコードされます。

# 送信するテキストに英語の文字が多数含まれている場合は、UTF-8 エンコードを使用するとスペースを節約できます。

# UTF-8 エンコードには追加の利点があります。つまり、ASCII エンコードは実際には UTF-8 エンコードの一部と見なすことができるため、ASCII エンコードのみをサポートする多数の歴史的なレガシーソフトウェアをエンコードできます。 UTF-8 でコーディングしながら作業を続けます。

特記事項:

Unicode エンコードは、コンピューターのメモリ内で均一に使用されます。

python3 文字エンコーディング

Python3 バージョンでは、文字列は Unicode でエンコードされます。つまり、Python 文字列は複数の言語をサポートします。

単一文字のエンコーディングの場合、Python は単一文字の 10 進整数表現を取得する ord() 関数と、エンコーディングを対応する文字に変換する chr() 関数を提供します。

例:

>>> ord(‘A’)
65
>>> ord(‘中’)
20013
>>> chr(66)
‘B’
>>> chr(25991)
‘文’

ログイン後にコピー

Python ソースコードもテキストファイルであるため、ソースコードに中国語が含まれている場合は、ソースコードを保存するときに UTF-8 エンコードを指定する必要があります。 Python インタープリターがソースコードを読み取るとき、UTF-8 エンコーディングで読み取れるようにするために、通常はファイルの先頭にこの行を書き込みます。