「ディスクリプタ」という概念はよく聞くかもしれませんが、ほとんどのプログラマーはほとんど使用しないため、その原理をよく理解していないかもしれません。python ビデオ チュートリアルコラムで詳しく紹介します
推奨 (無料):Python ビデオ チュートリアル
ただし、キャリアを向上させたい場合はPython の使用にさらに習熟するには、descriptor
の概念を明確に理解しておく必要があると思います。これは、将来の開発に非常に役立ち、また、将来的には Python の設計をより深く理解できるようになります。
開発プロセス中に記述子を直接使用したことはありませんが、最下位レベルでは非常に頻繁に使用されます。たとえば、次のようになります:
function
、バインドされたメソッド
、アンバインドされたメソッド
property
、staticmethod
、classmethod
#記述子とは何ですか?
記述子とは何かを理解する前に、まず参照する例を見つけます。
class A: x = 10print(A.x) # 10
この例は非常に単純です。まずクラスA# で見てみましょう。
## クラス属性xを定義し、その値を取得します。
クラス属性を直接定義するこの方法に加えて、次のようにクラス属性を定義することもできます:
class Ten: def __get__(self, obj, objtype=None): return 10class A: x = Ten() # 属性换成了一个类print(A.x) # 10
xが特定のものではないことがわかります。値ですが、クラス
Tenを介して、
Tenは特定の値を返す
__get__メソッドを定義します。
クラスの属性をクラスにホストでき、そのような属性は記述子であると結論付けることができます# #In簡単に言えば、Descriptor
はバインディング動作
Attributeで、これは何を意味するのでしょうか?
behaviour
は何と呼ばれるでしょうか?Behavior
はメソッドです。したがって、
は次のように理解することもできます。オブジェクトの属性は特定の値ではなく、定義するメソッドに与えられます。
メソッドを使用して属性を定義すると、どのような利点があるか想像できますか?
メソッドを使用すると、メソッド内に独自のロジックを実装できます。最も単純なのは、次のように、さまざまな条件に従ってメソッド内の属性にさまざまな値を割り当てることができます:
class Age: def __get__(self, obj, objtype=None): if obj.name == 'zhangsan': return 20 elif obj.name == 'lisi': return 25 else: return ValueError("unknow")class Person: age = Age() def __init__(self, name): self.name = name p1 = Person('zhangsan')print(p1.age) # 20p2 = Person('lisi')print(p2.age) # 25p3 = Person('wangwu')print(p3.age) # unknow
この例では、
ageクラス属性は別のクラスによってホストされています。このクラスの__get__
では、Person
クラス属性に基づきます。name
は、age
の値を決定します。このような例を通して、記述子の使用を通じて、クラス属性の定義方法を簡単に変更できることがわかります。
記述子プロトコル記述子の定義を理解した後、管理プロパティのクラスに焦点を当てます。
実際、クラス属性をクラス上でホストしたい場合、このクラス内に実装されたメソッドを簡単に定義することはできません。「記述子プロトコル」に準拠している必要があります。つまり、次のメソッドは次のとおりです。実装:
さらに、記述子は「データ記述子」と「非データ記述子」に分類できます。
は、非データ記述子と呼ばれる
__get____の定義に加えて、記述子
# と呼ばれる
__set__または
__delete__も定義します。 ##それらの違いは何ですか。以下で詳しく説明します。
メソッドと
__set__メソッドを含む記述子の例を見てみましょう。
この例では、クラス属性# coding: utf8class Age: def __init__(self, value=20): self.value = value def __get__(self, obj, type=None): print('call __get__: obj: %s type: %s' % (obj, type)) return self.value def __set__(self, obj, value): if value <= 0: raise ValueError("age must be greater than 0") print('call __set__: obj: %s value: %s' % (obj, value)) self.value = valueclass Person: age = Age() def __init__(self, name): self.name = name p1 = Person('zhangsan')print(p1.age)# call __get__: obj: <__main__.Person object at 0x1055509e8> type: <class '__main__.Person'># 20print(Person.age)# call __get__: obj: None type: <class '__main__.Person'># 20p1.age = 25# call __set__: obj: <__main__.Person object at 0x1055509e8> value: 25print(p1.age)# call __get__: obj: <__main__.Person object at 0x1055509e8> type: <class '__main__.Person'># 25p1.age = -1# ValueError: age must be greater than 0
age
は、その値が
クラスに依存する記述子です。出力から判断すると、
age
属性を取得または変更するときに、
の__get__
と__set__# が呼び出されます。 ## 方法:###
p1.age
时,__get__
被调用,参数obj
是Person
实例,type
是type(Person)
Person.age
时,__get__
被调用,参数obj
是None
,type
是type(Person)
p1.age = 25
时,__set__
被调用,参数obj
是Person
实例,value
是25p1.age = -1
时,__set__
没有通过校验,抛出ValueError
其中,调用__set__
传入的参数,我们比较容易理解,但是对于__get__
方法,通过类或实例调用,传入的参数是不同的,这是为什么?
这就需要我们了解一下描述符的工作原理。
描述符的工作原理
要解释描述符的工作原理,首先我们需要先从属性的访问说起。
在开发时,不知道你有没有想过这样一个问题:通常我们写这样的代码a.b
,其背后到底发生了什么?
这里的a
和b
可能存在以下情况:
a
可能是一个类,也可能是一个实例,我们这里统称为对象b
可能是一个属性,也可能是一个方法,方法其实也可以看做是类的属性其实,无论是以上哪种情况,在 Python 中,都有一个统一的调用逻辑:
__getattribute__
尝试获得结果__getattr__
用代码表示就是下面这样:
def getattr_hook(obj, name): try: return obj.__getattribute__(name) except AttributeError: if not hasattr(type(obj), '__getattr__'): raise return type(obj).__getattr__(obj, name)
我们这里需要重点关注一下__getattribute__
,因为它是所有属性查找的入口,它内部实现的属性查找顺序是这样的:
__get__
__dict__
中查找__dict__
中查找不到,再看它是否是一个非数据描述符__get__
AttributeError
异常写成代码就是下面这样:
# 获取一个对象的属性 def __getattribute__(obj, name): null = object() # 对象的类型 也就是实例的类 objtype = type(obj) # 从这个类中获取指定属性 cls_var = getattr(objtype, name, null) # 如果这个类实现了描述符协议 descr_get = getattr(type(cls_var), '__get__', null) if descr_get is not null: if (hasattr(type(cls_var), '__set__') or hasattr(type(cls_var), '__delete__')): # 优先从数据描述符中获取属性 return descr_get(cls_var, obj, objtype) # 从实例中获取属性 if hasattr(obj, '__dict__') and name in vars(obj): return vars(obj)[name] # 从非数据描述符获取属性 if descr_get is not null: return descr_get(cls_var, obj, objtype) # 从类中获取属性 if cls_var is not null: return cls_var # 抛出 AttributeError 会触发调用 __getattr__ raise AttributeError(name)
如果不好理解,你最好写一个程序测试一下,观察各种情况下的属性的查找顺序。
到这里我们可以看到,在一个对象中查找一个属性,都是先从__getattribute__
开始的。
在__getattribute__
中,它会检查这个类属性是否是一个描述符,如果是一个描述符,那么就会调用它的__get__
方法。但具体的调用细节和传入的参数是下面这样的:
a
是一个实例,调用细节为:type(a).__dict__['b'].__get__(a, type(a))复制代码
a
是一个类,调用细节为:a.__dict__['b'].__get__(None, a)复制代码
所以我们就能看到上面例子输出的结果。
数据描述符和非数据描述符
了解了描述符的工作原理,我们继续来看数据描述符和非数据描述符的区别。
从定义上来看,它们的区别是:
__get___
,叫做非数据描述符__get__
之外,还定义了__set__
或__delete__
,叫做数据描述符此外,我们从上面描述符调用的顺序可以看到,在对象中查找属性时,数据描述符要优先于非数据描述符调用。
在之前的例子中,我们定义了__get__
和__set__
,所以那些类属性都是数据描述符。
我们再来看一个非数据描述符的例子:
class A: def __init__(self): self.foo = 'abc' def foo(self): return 'xyz'print(A().foo) # 输出什么? 复制代码
这段代码,我们定义了一个相同名字的属性和方法foo
,如果现在执行A().foo
,你觉得会输出什么结果?
答案是abc
。
为什么打印的是实例属性foo
的值,而不是方法foo
呢?
这就和非数据描述符有关系了。
我们执行dir(A.foo)
,观察结果:
print(dir(A.foo))# [... '__get__', '__getattribute__', ...]复制代码
看到了吗?A
的foo
方法其实实现了__get__
,我们在上面的分析已经得知:只定义__get__
方法的对象,它其实是一个非数据描述符,也就是说,我们在类中定义的方法,其实本身就是一个非数据描述符。
所以,在一个类中,如果存在相同名字的属性和方法,按照上面所讲的__getattribute__
中查找属性的顺序,这个属性就会优先从实例中获取,如果实例中不存在,才会从非数据描述符中获取,所以在这里优先查找的是实例属性foo
的值。
到这里我们可以总结一下关于描述符的相关知识点:
__getattribute__
是查找一个属性(方法)的入口__getattribute__
定义了一个属性(方法)的查找顺序:数据描述符、实例属性、非数据描述符、类属性__getattribute__
方法,会阻止描述符的调用__get__
描述符的使用场景
了解了描述符的工作原理,那描述符一般用在哪些业务场景中呢?
在这里我用描述符实现了一个属性校验器,你可以参考这个例子,在类似的场景中去使用它。
首先我们定义一个校验基类Validator
,在__set__
方法中先调用validate
方法校验属性是否符合要求,然后再对属性进行赋值。
class Validator: def __init__(self): self.data = {} def __get__(self, obj, objtype=None): return self.data[obj] def __set__(self, obj, value): # 校验通过后再赋值 self.validate(value) self.data[obj] = value def validate(self, value): pass 复制代码
接下来,我们定义两个校验类,继承Validator
,然后实现自己的校验逻辑。
class Number(Validator): def __init__(self, minvalue=None, maxvalue=None): super(Number, self).__init__() self.minvalue = minvalue self.maxvalue = maxvalue def validate(self, value): if not isinstance(value, (int, float)): raise TypeError(f'Expected {value!r} to be an int or float') if self.minvalue is not None and value < self.minvalue: raise ValueError( f'Expected {value!r} to be at least {self.minvalue!r}' ) if self.maxvalue is not None and value > self.maxvalue: raise ValueError( f'Expected {value!r} to be no more than {self.maxvalue!r}' )class String(Validator): def __init__(self, minsize=None, maxsize=None): super(String, self).__init__() self.minsize = minsize self.maxsize = maxsize def validate(self, value): if not isinstance(value, str): raise TypeError(f'Expected {value!r} to be an str') if self.minsize is not None and len(value) < self.minsize: raise ValueError( f'Expected {value!r} to be no smaller than {self.minsize!r}' ) if self.maxsize is not None and len(value) > self.maxsize: raise ValueError( f'Expected {value!r} to be no bigger than {self.maxsize!r}' )复制代码
最后,我们使用这个校验类:
class Person: # 定义属性的校验规则 内部用描述符实现 name = String(minsize=3, maxsize=10) age = Number(minvalue=1, maxvalue=120) def __init__(self, name, age): self.name = name self.age = age # 属性符合规则 p1 = Person('zhangsan', 20)print(p1.name, p1.age)# 属性不符合规则 p2 = person('a', 20)# ValueError: Expected 'a' to be no smaller than 3p3 = Person('zhangsan', -1)# ValueError: Expected -1 to be at least 1复制代码
现在,当我们对Person
实例进行初始化时,就可以校验这些属性是否符合预定义的规则了。
function与method
我们再来看一下,在开发时经常看到的function
、unbound method
、bound method
它们之间到底有什么区别?
来看下面这段代码:
class A: def foo(self): return 'xyz'print(A.__dict__['foo']) #print(A.foo) # print(A().foo) # >复制代码
从结果我们可以看出它们的区别:
function
准确来说就是一个函数,并且它实现了__get__
方法,因此每一个function
都是一个非数据描述符,而在类中会把function
放到__dict__
中存储function
被实例调用时,它是一个bound method
function
被类调用时, 它是一个unbound method
function
是一个非数据描述符,我们之前已经讲到了。
而bound method
和unbound method
的区别就在于调用方的类型是什么,如果是一个实例,那么这个function
就是一个bound method
,否则它是一个unbound method
。
property/staticmethod/classmethod
我们再来看property
、staticmethod
、classmethod
。
这些装饰器的实现,默认是 C 来实现的。
其实,我们也可以直接利用 Python 描述符的特性来实现这些装饰器,
property
的 Python 版实现:
class property: def __init__(self, fget=None, fset=None, fdel=None, doc=None): self.fget = fget self.fset = fset self.fdel = fdel self.__doc__ = doc def __get__(self, obj, objtype=None): if obj is None: return self.fget if self.fget is None: raise AttributeError(), "unreadable attribute" return self.fget(obj) def __set__(self, obj, value): if self.fset is None: raise AttributeError, "can't set attribute" return self.fset(obj, value) def __delete__(self, obj): if self.fdel is None: raise AttributeError, "can't delete attribute" return self.fdel(obj) def getter(self, fget): return type(self)(fget, self.fset, self.fdel, self.__doc__) def setter(self, fset): return type(self)(self.fget, fset, self.fdel, self.__doc__) def deleter(self, fdel): return type(self)(self.fget, self.fset, fdel, self.__doc__)复制代码
staticmethod
的 Python 版实现:
class staticmethod: def __init__(self, func): self.func = func def __get__(self, obj, objtype=None): return self.func 复制代码
classmethod
的 Python 版实现:
class classmethod: def __init__(self, func): self.func = func def __get__(self, obj, klass=None): if klass is None: klass = type(obj) def newfunc(*args): return self.func(klass, *args) return newfunc 复制代码
除此之外,你还可以实现其他功能强大的装饰器。
由此可见,通过描述符我们可以实现强大而灵活的属性管理功能,对于一些要求属性控制比较复杂的场景,我们可以选择用描述符来实现。
总结
这篇文章我们主要讲了 Python 描述符的工作原理。
首先,我们从一个简单的例子了解到,一个类属性是可以托管给另外一个类的,这个类如果实现了描述符协议方法,那么这个类属性就是一个描述符。此外,描述符又可以分为数据描述符和非数据描述符。
之后我们又分析了获取一个属性的过程,一切的入口都在__getattribute__
中,这个方法定义了寻找属性的顺序,其中实例属性优先于数据描述符调用,数据描述符要优先于非数据描述符调用。
さらに、メソッドは実際には非データ記述子であることもわかりました。クラス内に同じ名前のインスタンス属性とメソッドを定義すると、__getattribute__
の属性検索順序に従って、インスタンス属性が優先されます。
最後に、function
とmethod
の違いと、Python を使用してproperty
とstaticmethod## を実装する方法を分析しました。 #,
classmethodデコレータ。
以上がPython 記述子の意味を紹介します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。