为什么 1000000000000000 in range(1000000000000001) 在 Python3 里速度那么快-Tutorial Python-php.cn

为什么 1000000000000000 in range(1000000000000001) 在 Python3 里速度那么快

anonymity

Lepaskan： 2019-05-27 11:21:29

asal

2987 orang telah melayarinya

在 Python 中，表达式 1000000000000000 in range(1000000000000001) 的执行速度能有多快？

为什么 1000000000000000 in range(1000000000000001) 在 Python3 里速度那么快

判断一个元素 x 是否存在于集合 y 中最简单粗暴地方法就是迭代，每次取出一个值与之比较，如果集合中存在一个值 z 等于 x就返回 true ，它的时间复杂度是 O(n)，使用哈希算法的理论时间复杂度是 O(1)，二分查找的时间复杂度是 O(log n)，那么 Python 究竟会采用的哪种算法来实现呢？

先来做个实验：

#python2
timeit.timeit(&#39;1000000000 in range(0,1000000000,10)&#39;, number=1)
5.50357640805305
timeit.timeit(&#39;1000000000 in xrange(0,1000000000,10)&#39;, number=1)
2.3025200839183526
# python3
import timeit
timeit.timeit(&#39;1000000000 in range(0,1000000000,10)&#39;, number=1)
4.490355838248402e-06

Salin selepas log masuk

我们都知道 python2 中的 range 函数返回的是一个列表对象，一次性把所有的元素加载到内存，所以执行第一个表达式的时候，系统会突然感觉非常卡顿，它需要的时间是5秒多。

xrange 和 python3 中的 range 函数类似，都是返回一个迭代器对象，但是它俩的执行结果相差悬殊，让人大跌眼镜。第三个表达式所花的时间接近0秒，为何 python2 的 xrange 与 python3 中 range 函数区别这么大？为了弄明白其中的玄机，我们要理解in操作是如何执行的。根据 Python 文档 in 的规则：

如果该类实现了contains()方法，那么只要 y.contains(x) 返回 true 那么 x in y 也返回 true，反之亦然。

没有实现contains()方法，但实现了iter()方法，那么在迭代过程中如果有某个值 z==x，就返回 true，否则就是 false。

如果以上两个方法都没有实现，就看getitem()方法，如果存在一个索引i使得 x==y[i] ，就返回 true，否则返回 false。

明白了 in 的规则之后，我们先看看 xrange 提供了哪些方法：

dir(xrange)
[&#39;__class__&#39;,&#39;__getitem__&#39;, &#39;__hash__&#39;, &#39;__init__&#39;, 
&#39;__iter__&#39;, &#39;__len__&#39;, &#39;__new__&#39;, ...]

Salin selepas log masuk

是的，xrange 函数只实现了 getitem 和 iter，判断 x 是是否在 y 中需要逐个值迭代进行比较，也就是说 xrange 的时间复杂度是O(n)。

再来看看 python3 的 range 有哪些方法：

 dir(range)
[&#39;__class__&#39;, &#39;__contains__&#39;, &#39;__getitem__&#39;, &#39;__iter__&#39;,  
&#39;count&#39;, &#39;index&#39;, &#39;start&#39;, &#39;step&#39;, &#39;stop&#39;, ...]

Salin selepas log masuk

range 提供的属性比 xrange 要多很多，不仅实现了 getitem 和 iter ，还实现了 contains ，所以它会优先调用contains方法，此外，它还提供了三个属性 start、stop、step。那么究竟为什么它的执行速度会如此之快呢？来看看contains方法是如何实现的吧。

在 Python3 中，contains 并不是逐个值迭代对比，而是采用这样一种逻辑：

首先检查 x 是否在 start 和 stop 范围之间：start <= x < stop

如果在这个区间范围，那么再根据 step 计算 x 是否刚好落在 xrange 区间中的某个值上，这里用取模的方式来判断：(x - start) % step == 0

此刻真相大白，xrange 的时间复杂度是O(1)，也就是说不管 xrange(start, stop, step) 中的 stop 值多大，时间复杂度都是一个常量。所以 python3 中的 range 方法不仅可以节省内存，而且执行效率更高，所以不要再纠结学 Python2 还是 Python3 了。

Atas ialah kandungan terperinci 为什么 1000000000000000 in range(1000000000000001) 在 Python3 里速度那么快. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!