Java實作Timsort排序演算法的步驟與實現-java教程-PHP中文網

背景

Timsort 是一個混合、穩定的排序演算法，簡單來說就是歸併排序和二分插入排序演算法的混合體，號稱世界上最好的排序演算法。 Timsort一直是 Python 的標準排序演算法。 Java SE 7 後面加入了Timsort API ，我們從Arrays.sort可以看出它已經是非原始型別數組的預設排序演算法了。所以不管是進階程式設計學習還是面試，理解 Timsort 是比較重要。

// List sort()    
default void sort(Comparator<? super E> c) {
        Object[] a = this.toArray();
              //数组排序
        Arrays.sort(a, (Comparator) c);
              ...
    }

// Arrays.sort
    public static <T> void sort(T[] a, Comparator<? super T> c) {
        if (c == null) {
            sort(a);
        } else {
              // 废弃版本
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a, c);
            else
                TimSort.sort(a, 0, a.length, c, null, 0, 0);
        }
    }

    public static void sort(Object[] a) {
        if (LegacyMergeSort.userRequested)
            legacyMergeSort(a);
        else
            ComparableTimSort.sort(a, 0, a.length, null, 0, 0);
    }

登入後複製

前置知識

理解 Timsort 需要先回顧下面的知識。

指數搜尋

指數搜索，也被稱為加倍搜索，是一種用於在大型數組中搜索元素而創建的演算法。它是一個兩步驟的過程。首先，演算法試圖找到目標元素存在的範圍 (L，R)，然後在這個範圍內使用二元搜尋來尋找目標的準確位置。時間複雜度為O(lgn)。此搜尋演算法在大量有序數組中比較有效。

二分插入排序

插入排序演算法很簡單，大體過程是從第二個元素開始，依序向前移動交換元素直到找到合適的位置。

Java實作Timsort排序演算法的步驟與實現

插入排序最適時間複雜度也要O(n) ，我們可以使用二分查找來減少插入時元素的比較次數，將時間複雜度降為logn 。但是注意，二分查找插入排序仍然需要移動相同數量的元素，但是複製數組的時間消耗低於逐一互換操作。

特點：二分插入排序主要優點是在小資料集場景下排序效率很高。

public static int[] sort(int[] arr) throws Exception {
        // 开始遍历第一个元素后的所有元素
        for (int i = 1; i < arr.length; i++) {
            // 需要插入的元素
            int tmp = arr[i];
            // 从已排序最后一个元素开始，如果当前元素比插入元素大，就往后移动
            int j = i;
            while (j > 0 && tmp < arr[j - 1]) {
                arr[j] = arr[j - 1];
                j--;
            }
            // 将元素插入
            if (j != i) {
                arr[j] = tmp;
            }
        }
        return arr;
    }

    public static int[] binarySort(int[] arr) throws Exception {
        for (int i = 1; i < arr.length; i++) {
            // 需要插入的元素
            int tmp = arr[i];
            // 通过二分查找直接找到插入位置
            int j = Math.abs(Arrays.binarySearch(arr, 0, i, tmp) + 1);
            // 找到插入位置后，通过数组复制向后移动，腾出元素位置
            System.arraycopy(arr, j, arr, j + 1, i - j);
            // 将元素插入
            arr[j] = tmp;
        }
        return arr;
    }

登入後複製

歸併排序

歸併排序是利用分治策略的演算法，包含兩個主要的操作：分割與合併。大體過程是，透過遞歸將數組不斷分成兩半，一直到無法再分割（也就是數組為空或只剩下一個元素），然後進行合併排序。簡單來說合併操作就是不斷取兩個較小的排序數組然後將它們組合成一個更大的數組。

特點：歸併排序主要為大資料集場景設計的排序演算法。

Java實作Timsort排序演算法的步驟與實現

public static void mergeSortRecursive(int[] arr, int[] result, int start, int end) {
        // 跳出递归
        if (start >= end) {
            return;
        }
        // 待分割的数组长度
        int len = end - start;
        int mid = (len >> 1) + start;
        int left = start; // 左子数组开始索引
        int right = mid + 1; // 右子数组开始索引
        // 递归切割左子数组，直到只有一个元素
        mergeSortRecursive(arr, result, left, mid);
        // 递归切割右子数组，直到只有一个元素
        mergeSortRecursive(arr, result, right, end);
        int k = start;
        while (left <= mid && right <= end) {
            result[k++] = arr[left] < arr[right] ? arr[left++] : arr[right++];
        }
        while (left <= mid) {
            result[k++] = arr[left++];
        }
        while (right <= end) {
            result[k++] = arr[right++];
        }
        for (k = start; k <= end; k++) {
            arr[k] = result[k];
        }
    }

    public static int[] merge_sort(int[] arr) {
        int len = arr.length;
        int[] result = new int[len];
        mergeSortRecursive(arr, result, 0, len - 1);
        return arr;
    }

登入後複製

Timsort 執行過程

演算法大體過程，如果陣列長度小於指定閥值（MIN_MERGE）直接使用二分插入演算法完成排序，否則執行下面步驟：

先從陣列左邊開始，執行升序運行得到一個子序列。
將這個子序列放入運行堆疊裡，等待執行合併。
檢查運行堆疊裡的子序列，如果滿足合併條件則執行合併。
重複第一個步驟，執行下一個升序運行。

升序運行

升序運行就是從數組尋找一段連續遞增（升序）或遞減（降序）子序列的過程，如果子序列為降序則將它反轉為升序，也可以將此過程簡稱為 run。例如數組[2,3,6,4,9,30]，可以查找到三個子序列，[2,3,6]、[4,9]、[30]，或說3個 run。

幾個關鍵閥值

MIN_MERGE

#這是一個常數值，可以簡單理解為執行歸併的最小閥值，如果整個陣列長度小於它，就沒必要執行那麼複雜的排序，直接二分插入就行了。在 Tim Peter 的 C 實作中為 64，但實際經驗中設定為 32 效果較好，所以 java 裡面此值為 32。

降序反轉時為確保穩定性，相同元素不會被顛倒。

minrun

在合併序列的時候，如果 run 數量等於或略小於2 的冪次方的時候，合併效率最高；如果略大於2 的冪次方，效率就會顯著降低。所以為了提高合併效率，需要盡量控制每個 run 的長度，透過定義一個 minrun 來表示每個 run 的最小長度，如果長度太短，就用二分插入排序把 run 後面的元素插入到前面的 run 裡面。

一般在執行排序演算法之前，會先計算出這個minrun（它是根據資料的特性來進行自我調整），minrun 會從32到64選擇一個數字，因此資料的大小除以minrun 等於或略小於2 的冪次方。例如長度是 65 ，那麼 minrun 的值就是 33；如果長度是 165，minrun 就是 42。

看下 Java 里面的实现，如果数据长度（n） < MIN_MERGE，则返回数据长度。如果数据长度恰好是 2 的幂次方，则返回MIN_MERGE/2
也就是16，否则返回一个MIN_MERGE/2 <= k <= MIN_MERGE范围的值k，这样可以使的 n/k 接近但严格小于 2 的幂次方。

private static int minRunLength(int n) {
        assert n >= 0;
        int r = 0;      // 如果低位任何一位是1，就会变成1
        while (n >= MIN_MERGE) {
            r |= (n & 1);
            n >>= 1;
        }
        return n + r;
    }

登入後複製

MIN_GALLOP

MIN_GALLOP 是为了优化合并的过程设定的一个阈值，控制进入 GALLOP 模式中， GALLOP 模式放在后面讲。

下面是 Timsort 执行流程图

Java實作Timsort排序演算法的步驟與實現

运行合并

当栈里面的 run 满足合并条件时，它就将栈里面相邻的两个run 进行合并。

合并条件

Timsort 为了执行平衡合并（让合并的 run 大小尽可能相同），制定了一个合并规则，对于在栈顶的三个run，分别用X、Y 和 Z 表示他们的长度，其中 X 在栈顶，它们必须始终维持一下的两个规则：

Java實作Timsort排序演算法的步驟與實現

一旦有其中的一个条件不被满足，则将 Y 与 X 或 Z 中的较小者合并生成新的 run，并再次检查栈顶是否仍然满足条件。如果不满足则会继续进行合并，直至栈顶的三个元素都满足这两个条件，如果只剩两个run，则满足 Y > X 即可。

如下下图例子

当 Z <= Y+X ，将 X+Y 合并，此时只剩下两个run。
检测 Y < X ，执行合并，此时只剩下 X，则退出合并检测。

Java實作Timsort排序演算法的步驟與實現

我们看下 Java 里面的合并实现

private void mergeCollapse() {
      
       // 当存在两个以上run执行合并检查
        while (stackSize > 1) {

          // 表示 Y
            int n = stackSize - 2; 
           
          // Z <= Y + X 
            if (n > 0 && runLen[n-1] <= runLen[n] + runLen[n+1]) { 

              // 如果 Z < X 合并Z+Y ，否则合并X+Y
              if (runLen[n - 1] < runLen[n + 1])
                    n--;
                
                // 合并相邻的两个run，也就是runLen[n] 和 runLen[n+1]
                mergeAt(n); 
            } else if (runLen[n] <= runLen[n + 1]) {
                
                // Y <= X 合并 Y+X
                mergeAt(n);
            } else {
                
                // 满足两个条件，跳出循环
                break; 
            }
        }
    }

登入後複製

合并内存开销

原始归并排序空间复杂度是 O(n)也就是数据大小。为了实现中间项，Timsort 进行了一次归并排序，时间开销和空间开销都比 O(n)小。

优化是为了尽可能减少数据移动，占用更少的临时内存，先找出需要移动的元素，然后将较小序列复制到临时内存，在按最终顺序排序并填充到组合序列中。

比如我们需要合并 X [1, 2, 3, 6, 10] 和 Y [4, 5, 7, 9, 12, 14, 17]，X 中最大元素是10，我们可以通过二分查找确定，它需要插入到 Y 的第 5个位置才能保证顺序，而 Y 中最小元素是4，它需要插入到 X 中的第4个位置才能保证顺序，那么就知道了[1, 2, 3] 和 [12, 14, 17] 不需要移动，我们只需要移动 [6, 10] 和 [4, 5, 7, 9]，然后只需要分配一个大小为 2 临时存储就可以了。