Die überwältigende Resonanz auf meinen Blog-Beitrag, in dem ich den Attributzugriff erklärt habe, hat mich dazu inspiriert, einen weiteren Beitrag darüber zu schreiben, wie viel von Pythons Syntax eigentlich nur syntaktischer Zucker ist. In diesem Artikel möchte ich über binäre Rechenoperationen sprechen.
Konkret möchte ich erklären, wie die Subtraktion funktioniert:a - b
. Ich habe mich bewusst für die Subtraktion entschieden, weil sie nicht kommutativ ist. Dies unterstreicht die Bedeutung der Reihenfolge der Operationen im Vergleich zur Additionsoperation, bei der Sie während der Implementierung versehentlich a und b vertauschen und trotzdem das gleiche Ergebnis erhalten.a - b
。我故意选择了减法,因为它是不可交换的。这可以强调出操作顺序的重要性,与加法操作相比,你可能会在实现时误将 a 和 b 翻转,但还是得到相同的结果。
按照惯例,我们从查看 CPython 解释器编译的字节码开始。
>>> def sub(): a - b... >>> import dis>>> dis.dis(sub) 1 0 LOAD_GLOBAL 0 (a) 2 LOAD_GLOBAL 1 (b) 4 BINARY_SUBTRACT 6 POP_TOP 8 LOAD_CONST 0 (None) 10 RETURN_VALUE复制代码
看起来我们需要深入研究 BINARY_SUBTRACT 操作码。翻查 Python/ceval.c 文件,可以看到实现该操作码的 C 代码如下:
case TARGET(BINARY_SUBTRACT): { PyObject *right = POP(); PyObject *left = TOP(); PyObject *diff = PyNumber_Subtract(left, right); Py_DECREF(right); Py_DECREF(left); SET_TOP(diff); if (diff == NULL) goto error; DISPATCH(); }复制代码
这里的关键代码是PyNumber_Subtract(),实现了减法的实际语义。继续查看该函数的一些宏,可以找到binary_op1() 函数。它提供了一种管理二元操作的通用方法。
通读数据模型的文档,你会发现在实现减法时,有两个方法起到了关键作用:__sub__ 和 __rsub__。
当执行a - b
# 通过调用__sub__()实现减法 def sub(lhs: Any, rhs: Any, /) -> Any: """Implement the binary operation `a - b`.""" lhs_type = type(lhs) try: subtract = _mro_getattr(lhs_type, "__sub__") except AttributeError: msg = f"unsupported operand type(s) for -: {lhs_type!r} and {type(rhs)!r}" raise TypeError(msg) else: return subtract(lhs, rhs)复制代码
a - b
wird __sub__() im Typ a und dann b gesucht seine Parameter. Dies ist ähnlich wie __getattribute__() in meinem Artikel über den Attributzugriff. Die speziellen/magischen Methoden werden aus Leistungsgründen basierend auf dem Typ des Objekts analysiert, nicht auf dem Objekt selbst, das ich im Beispielcode unten darstelle diesen Prozess.Wenn also __sub__() definiert ist, wird Typ(a).__sub__(a,b) für die Subtraktionsoperation verwendet. (Anmerkung: Magische Methoden gehören zum Typ des Objekts, nicht zum Objekt)
Das bedeutet, dass die Subtraktion im Wesentlichen nur ein Methodenaufruf ist! Sie können es sich auch als die Funktion „operator.sub()“ in der Standardbibliothek vorstellen.
2. Lassen Sie die rechte Seite __rsub__() verwenden
Aber was ist, wenn a __sub__() nicht implementiert? Wenn a und b unterschiedliche Typen sind, werden wir versuchen, __rsub__() von b aufzurufen (das „r“ in __rsub__ bedeutet „rechts“, also auf der rechten Seite des Operators).
Wenn beide Seiten der Operation unterschiedlichen Typs sind, stellt dies sicher, dass beide die Möglichkeit haben, zu versuchen, den Ausdruck gültig zu machen. Wenn sie gleich sind, gehen wir davon aus, dass __sub__() damit umgehen wird. Selbst wenn beide Implementierungen identisch sind, müssen Sie dennoch __rsub__() aufrufen, falls eines der Objekte eine (Unter-)Klasse des anderen ist.
3. Der Typ ist egal
Jetzt können beide Seiten des Ausdrucks an der Operation teilnehmen! Was aber, wenn der Typ eines Objekts aus irgendeinem Grund die Subtraktion nicht unterstützt (z. B. 4 – „stuff“ wird nicht unterstützt)? In diesem Fall kann __sub__ oder __rsub__ lediglich NotImplemented zurückgeben. Dies ist das an Python zurückgegebene Signal, dass es mit der nächsten Operation fortfahren und versuchen soll, den Code ordnungsgemäß auszuführen. Für unseren Code bedeutet das, dass der Rückgabewert der Methode überprüft werden muss, bevor wir davon ausgehen können, dass sie funktioniert.# 一个创建闭包的函数,实现了二元运算的逻辑_MISSING = object()def _create_binary_op(name: str, operator: str) -> Any: """Create a binary operation function. The `name` parameter specifies the name of the special method used for the binary operation (e.g. `sub` for `__sub__`). The `operator` name is the token representing the binary operation (e.g. `-` for subtraction). """ lhs_method_name = f"__{name}__" def binary_op(lhs: Any, rhs: Any, /) -> Any: """A closure implementing a binary operation in Python.""" rhs_method_name = f"__r{name}__" # lhs.__*__ lhs_type = type(lhs) try: lhs_method = debuiltins._mro_getattr(lhs_type, lhs_method_name) except AttributeError: lhs_method = _MISSING # lhs.__r*__ (for knowing if rhs.__r*__ should be called first) try: lhs_rmethod = debuiltins._mro_getattr(lhs_type, rhs_method_name) except AttributeError: lhs_rmethod = _MISSING # rhs.__r*__ rhs_type = type(rhs) try: rhs_method = debuiltins._mro_getattr(rhs_type, rhs_method_name) except AttributeError: rhs_method = _MISSING call_lhs = lhs, lhs_method, rhs call_rhs = rhs, rhs_method, lhs if ( rhs_type is not _MISSING # Do we care? and rhs_type is not lhs_type # Could RHS be a subclass? and issubclass(rhs_type, lhs_type) # RHS is a subclass! and lhs_rmethod is not rhs_method # Is __r*__ actually different? ): calls = call_rhs, call_lhs elif lhs_type is not rhs_type: calls = call_lhs, call_rhs else: calls = (call_lhs,) for first_obj, meth, second_obj in calls: if meth is _MISSING: continue value = meth(first_obj, second_obj) if value is not NotImplemented: return value else: exc = TypeError( f"unsupported operand type(s) for {operator}: {lhs_type!r} and {rhs_type!r}" ) exc._binary_op = operator raise exc复制代码
但是,有了上述规则,就会得到预期的结果 VeggieSpam,因为 Bacon.__rsub__() 首先会在表达式中被调用(如果计算的是 Bacon() - Spam(),那么也会得到正确的结果,因为首先会调用 Bacon.__sub__(),因此,规则里才会说两个类的不同的方法需有区别,而不仅仅是一个由 issubclass() 判断出的子类。)
所以,如果我们可以推广这种方法,那么我们就可以实现 13 种操作的语义:+ 、-、*、@、/、//、%、**、<<、>>、&、^、和 |。
由于闭包和 Python 在对象自省上的灵活性,我们可以提炼出 operator 函数的创建。
有了这段代码,你可以将减法运算定义为 _create_binary_op(“sub”, “-”),然后根据需要重复定义出其它运算。
