Sắp xếp hiệu quả — Merge, Quick, Heap Sort & Timsort

Nếu O(n²) là đi bộ, thì O(n log n) là lái xe. Nhưng không phải chiếc xe nào cũng phù hợp mọi cung đường — xe đua nhanh trên đường cao tốc (Quick Sort trên random data), xe tải chở được hàng nặng bất kể địa hình (Merge Sort — luôn O(n log n)), xe địa hình bền bỉ nhưng chậm (Heap Sort — O(1) space, worst-case guarantee), và xe hybrid thông minh tự chuyển chế độ (Timsort — khai thác pattern trong dữ liệu thực).

Bốn thuật toán trong bài này đều đạt O(n log n) — nhưng trade-off giữa bộ nhớ, tính ổn định, cache behavior, và worst-case guarantee hoàn toàn khác nhau. Hiểu những trade-off này là điều phân biệt một kỹ sư biết "implement thuật toán" với một kỹ sư biết chọn đúng thuật toán cho bài toán thực tế.

🎯 Mục tiêu

Sau bài học này, bạn sẽ:

Hiểu nguyên lý Divide and Conquer (chia để trị) — nền tảng của Merge Sort và Quick Sort
Phân biệt Merge Sort (stable, extra space) vs Quick Sort (in-place, cache-friendly)
Biết tại sao Heap Sort đảm bảo O(n log n) nhưng chậm hơn trong thực tế
Hiểu Timsort: tại sao Python, Java, V8 Engine chọn nó cho production
Tránh Quick Sort worst-case O(n²) bằng randomized pivot và introsort

Bức tranh tư duy — Chia để trị như chiến thuật quân sự

Hãy hình dung bạn là tướng quân, cần sắp xếp 10,000 binh lính theo chiều cao. Không ai đủ sức so sánh từng người một (O(n²) — quá lâu). Ba vị tướng đề xuất ba chiến thuật khác nhau:

🗡️ Merge Sort — Tướng "Phân đội":

"Chia quân thành hai đội bằng nhau. Mỗi đội tự sắp xếp bằng cách tiếp tục chia nhỏ — cho đến khi chỉ còn 1 người (mặc định đã sắp xếp). Sau đó, ghép hai đội đã sắp xếp lại bằng cách so sánh từng cặp đầu hàng."

→ Split first, merge later. Luôn ổn định, luôn O(n log n), nhưng cần sân tập thêm (extra memory) để ghép quân.

⚔️ Quick Sort — Tướng "Chọn tướng":

"Chọn một tướng (pivot). Lệnh: ai yếu hơn tướng đứng bên trái, ai mạnh hơn đứng bên phải. Tướng đứng giữa — đã đúng vị trí vĩnh viễn. Lặp lại cho hai bên."

→ Partition first, recurse later. Nhanh nhất trong thực tế nhờ cache-friendly, nhưng nếu chọn tướng tệ (pivot xấu), có thể n-1:1 mỗi lần chia → O(n²).

🏆 Heap Sort — Tướng "Giải đấu":

"Tổ chức giải đấu loại trực tiếp (tournament/heap). Tìm quán quân (max), rút ra xếp cuối. Lặp lại — mỗi lần rút quán quân ra, người kế vị lên ngôi qua log n trận."

→ Build heap, extract-max repeatedly. Đảm bảo O(n log n) mọi trường hợp, không cần thêm bộ nhớ, nhưng nhảy lung tung giữa các vị trí (cache-unfriendly).

text

Merge Sort:  [8,3,5,1] → [8,3] [5,1] → [8] [3] [5] [1]
                                         ↓ merge ↓
                                       [3,8] [1,5]
                                         ↓ merge ↓
                                       [1,3,5,8] ✓

Quick Sort:  [8,3,5,1]  pivot=5 → [3,1] [5] [8]
             [3,1] pivot=3 → [1] [3]
             Kết quả: [1,3,5,8] ✓

Heap Sort:   [8,3,5,1] → build max-heap → [8,5,3,1]
             extract 8 → [5,3,1|8]
             extract 5 → [3,1|5,8]
             extract 3 → [1|3,5,8]
             Kết quả: [1,3,5,8] ✓

Bảng so sánh tổng quan

Tiêu chí	Merge Sort	Quick Sort	Heap Sort	Timsort
Best	O(n log n)	O(n log n)	O(n log n)	O(n) ✅
Average	O(n log n)	O(n log n)	O(n log n)	O(n log n)
Worst	O(n log n) ✅	O(n²) ❌	O(n log n) ✅	O(n log n) ✅
Space	O(n)	O(log n)	O(1) ✅	O(n)
Stable	✅ Có	❌ Không	❌ Không	✅ Có
Cache	Kém	Tốt ✅	Kém	Tốt ✅
In-place	❌ Không	✅ Có	✅ Có	❌ Không
Adaptive	❌ Không	❌ Không	❌ Không	✅ Có

💡 Đọc bảng này thế nào?

Không có thuật toán nào "tốt nhất" ở mọi tiêu chí. Merge Sort thắng ở stability và worst-case guarantee. Quick Sort thắng ở cache và average performance. Heap Sort thắng ở space. Timsort thắng ở real-world data. Chọn đúng thuật toán = hiểu đúng yêu cầu bài toán.

Merge Sort — Chia để trị, trộn để thắng

Nguyên lý hoạt động

Merge Sort tuân theo ba bước Divide and Conquer:

Divide: Chia mảng thành hai nửa bằng nhau tại mid
Conquer: Đệ quy sắp xếp từng nửa (cho đến khi chỉ còn 1 phần tử — base case)
Combine: Trộn (merge) hai nửa đã sắp xếp thành một mảng hoàn chỉnh

Toàn bộ "trí tuệ" nằm ở bước merge — dùng kỹ thuật two-pointer, so sánh đầu hai mảng con, lấy phần tử nhỏ hơn đặt vào kết quả.

Trace chi tiết — Merge Sort trên `[38, 27, 43, 3, 9, 82, 10]`

text

                    [38, 27, 43, 3, 9, 82, 10]
                   /                           \
          [38, 27, 43, 3]                [9, 82, 10]
          /              \               /          \
      [38, 27]       [43, 3]        [9, 82]       [10]
      /      \       /     \        /     \
   [38]     [27]  [43]    [3]    [9]    [82]

--- Bắt đầu merge từ dưới lên ---

   [38]+[27] → compare 38 vs 27 → [27, 38]
   [43]+[3]  → compare 43 vs 3  → [3, 43]
   [9]+[82]  → compare 9 vs 82  → [9, 82]
   [10]      → (base case)      → [10]

   [27,38]+[3,43]:
     3 < 27 → lấy 3     → [3]
     27 < 43 → lấy 27   → [3, 27]
     38 < 43 → lấy 38   → [3, 27, 38]
     copy 43             → [3, 27, 38, 43]

   [9,82]+[10]:
     9 < 10 → lấy 9     → [9]
     10 < 82 → lấy 10   → [9, 10]
     copy 82             → [9, 10, 82]

   [3,27,38,43]+[9,10,82]:
     3 < 9  → lấy 3     → [3]
     9 < 27 → lấy 9     → [3, 9]
     10 < 27→ lấy 10    → [3, 9, 10]
     27 < 82→ lấy 27    → [3, 9, 10, 27]
     38 < 82→ lấy 38    → [3, 9, 10, 27, 38]
     43 < 82→ lấy 43    → [3, 9, 10, 27, 38, 43]
     copy 82             → [3, 9, 10, 27, 38, 43, 82] ✓

Visualizer State Transitions

text

VISUALIZER STATES — Merge Sort:
State 1: SPLIT         — mảng chia đôi, hai nửa tách ra (animation)
State 2: BASE_CASE     — phần tử đơn lẻ highlight xanh dương
State 3: MERGE_COMPARE — so sánh đầu hai mảng con (vàng)
State 4: MERGE_PLACE   — phần tử nhỏ hơn đặt vào output (xanh lá)
State 5: MERGE_COMPLETE — mảng con đã merge xong, toàn bộ xanh lá
State 6: DONE          — toàn bộ mảng xanh lá

🎬 Bubble Sort Visualizer

Chưa sắp xếp Đang so sánh Đã sắp xếp

Triển khai polyglot

C++PythonJava

cpp

#include <vector>
#include <algorithm>
using namespace std;

void merge(vector<int>& arr, int left, int mid, int right) {
    vector<int> temp(right - left + 1);
    int i = left, j = mid + 1, k = 0;

    while (i <= mid && j <= right) {
        // <= giữ tính stable: phần tử bằng nhau giữ nguyên thứ tự gốc
        if (arr[i] <= arr[j]) temp[k++] = arr[i++];
        else temp[k++] = arr[j++];
    }
    while (i <= mid) temp[k++] = arr[i++];
    while (j <= right) temp[k++] = arr[j++];

    copy(temp.begin(), temp.end(), arr.begin() + left);
}

void mergeSort(vector<int>& arr, int left, int right) {
    if (left >= right) return;
    int mid = left + (right - left) / 2;  // tránh overflow
    mergeSort(arr, left, mid);
    mergeSort(arr, mid + 1, right);
    merge(arr, left, mid, right);
}

python

def merge_sort(arr: list[int]) -> list[int]:
    """Merge Sort — top-down recursive, trả về mảng mới."""
    if len(arr) <= 1:
        return arr

    mid = len(arr) // 2
    left = merge_sort(arr[:mid])
    right = merge_sort(arr[mid:])
    return _merge(left, right)


def _merge(left: list[int], right: list[int]) -> list[int]:
    result = []
    i = j = 0
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:  # <= giữ tính stable
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result.extend(left[i:])
    result.extend(right[j:])
    return result

java

public class MergeSort {
    public static void mergeSort(int[] arr, int left, int right) {
        if (left >= right) return;
        int mid = left + (right - left) / 2;
        mergeSort(arr, left, mid);
        mergeSort(arr, mid + 1, right);
        merge(arr, left, mid, right);
    }

    private static void merge(int[] arr, int left, int mid, int right) {
        int[] temp = new int[right - left + 1];
        int i = left, j = mid + 1, k = 0;

        while (i <= mid && j <= right) {
            if (arr[i] <= arr[j]) temp[k++] = arr[i++];
            else temp[k++] = arr[j++];
        }
        while (i <= mid) temp[k++] = arr[i++];
        while (j <= right) temp[k++] = arr[j++];

        System.arraycopy(temp, 0, arr, left, temp.length);
    }
}

⚡ Sai lầm thường gặp

Tạo mảng temp mới mỗi lần gọi merge → allocate/deallocate liên tục = memory explosion trên mảng lớn. Cải thiện: allocate một mảng phụ duy nhất ở ngoài và tái sử dụng trong mọi lần merge.

Quick Sort — Nhanh nhất trong thực tế, nguy hiểm nhất khi sai

Nguyên lý hoạt động

Quick Sort đảo ngược thứ tự so với Merge Sort:

Partition: Chọn pivot, chia mảng thành hai phần — nhỏ hơn pivot (trái) và lớn hơn pivot (phải)
Recurse: Đệ quy sắp xếp hai phần
Combine: Không cần! Sau partition, pivot đã đúng vị trí vĩnh viễn

Toàn bộ "trí tuệ" nằm ở bước partition — và đặc biệt là cách chọn pivot.

Chiến lược chọn pivot

Chiến lược	Cách chọn	Ưu điểm	Nhược điểm
First element	`pivot = arr[left]`	Đơn giản	❌ Worst-case trên sorted input
Random	`pivot = arr[random(left, right)]`	Tránh worst-case	Chi phí RNG nhỏ
Median-of-3	Median của `arr[left], arr[mid], arr[right]`	Phân chia cân bằng hơn	Phức tạp hơn một chút

⚠️ Cạm bẫy

Pivot = first element trên sorted input = thảm họa O(n²)

Mảng [1, 2, 3, 4, 5], pivot = 1:

Partition: [] | 1 | [2, 3, 4, 5] → chia n-1:0
Tiếp: pivot = 2 → [] | 2 | [3, 4, 5] → lại n-1:0
Cứ thế... n lần partition, mỗi lần O(n) → O(n²)

Trong production, sorted/nearly-sorted input CỰC KỲ phổ biến (data từ DB đã ORDER BY, log theo timestamp...). Luôn dùng random pivot hoặc median-of-3.

Trace — Lomuto Partition trên `[10, 7, 8, 9, 1, 5]`

text

Lomuto partition — pivot = arr[right] = 5

  [10, 7, 8, 9, 1, 5]   pivot = 5
   i                 j    i = vị trí "biên" phần nhỏ hơn pivot
   ↓                      j duyệt từ left đến right-1

  j=0: arr[0]=10 > 5  → skip
  j=1: arr[1]=7  > 5  → skip
  j=2: arr[2]=8  > 5  → skip
  j=3: arr[3]=9  > 5  → skip
  j=4: arr[4]=1  ≤ 5  → swap arr[0] và arr[4]
       [1, 7, 8, 9, 10, 5]    i → 1

  Swap pivot với arr[i]: swap arr[1] và arr[5]
  [1, 5, 8, 9, 10, 7]
       ↑
     pivot đúng vị trí (index 1)

  Trái: [1]          → đã sorted
  Phải: [8, 9, 10, 7] → đệ quy tiếp

Visualizer State Transitions

text

VISUALIZER STATES — Quick Sort:
State 1: PIVOT_SELECT   — phần tử pivot highlight đỏ
State 2: PARTITION_SCAN — con trỏ i, j quét mảng (mũi tên vàng)
State 3: SWAP           — hai phần tử hoán đổi quanh pivot (cam)
State 4: PIVOT_PLACE    — pivot đặt vào vị trí cuối cùng (xanh lá)
State 5: RECURSE        — mảng con trái/phải highlight để đệ quy
State 6: DONE           — toàn bộ xanh lá

🎬 Bubble Sort Visualizer

Chưa sắp xếp Đang so sánh Đã sắp xếp

Triển khai polyglot — Random Pivot

C++PythonJava

cpp

#include <vector>
#include <cstdlib>
#include <algorithm>
using namespace std;

int partition(vector<int>& arr, int left, int right) {
    // Random pivot: tránh worst-case trên sorted input
    int pivotIdx = left + rand() % (right - left + 1);
    swap(arr[pivotIdx], arr[right]);
    int pivot = arr[right];

    int i = left;
    for (int j = left; j < right; ++j) {
        if (arr[j] <= pivot) {
            swap(arr[i], arr[j]);
            ++i;
        }
    }
    swap(arr[i], arr[right]);
    return i;
}

void quickSort(vector<int>& arr, int left, int right) {
    if (left >= right) return;
    int pivotPos = partition(arr, left, right);
    quickSort(arr, left, pivotPos - 1);
    quickSort(arr, pivotPos + 1, right);
}

python

import random

def quick_sort(arr: list[int], left: int = 0, right: int | None = None) -> None:
    """Quick Sort in-place với random pivot."""
    if right is None:
        right = len(arr) - 1
    if left >= right:
        return

    pivot_pos = partition(arr, left, right)
    quick_sort(arr, left, pivot_pos - 1)
    quick_sort(arr, pivot_pos + 1, right)


def partition(arr: list[int], left: int, right: int) -> int:
    # Random pivot
    pivot_idx = random.randint(left, right)
    arr[pivot_idx], arr[right] = arr[right], arr[pivot_idx]
    pivot = arr[right]

    i = left
    for j in range(left, right):
        if arr[j] <= pivot:
            arr[i], arr[j] = arr[j], arr[i]
            i += 1
    arr[i], arr[right] = arr[right], arr[i]
    return i

java

import java.util.Random;

public class QuickSort {
    private static final Random rng = new Random();

    public static void quickSort(int[] arr, int left, int right) {
        if (left >= right) return;
        int pivotPos = partition(arr, left, right);
        quickSort(arr, left, pivotPos - 1);
        quickSort(arr, pivotPos + 1, right);
    }

    private static int partition(int[] arr, int left, int right) {
        int pivotIdx = left + rng.nextInt(right - left + 1);
        int temp = arr[pivotIdx];
        arr[pivotIdx] = arr[right];
        arr[right] = temp;

        int pivot = arr[right];
        int i = left;
        for (int j = left; j < right; j++) {
            if (arr[j] <= pivot) {
                temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
                i++;
            }
        }
        temp = arr[i];
        arr[i] = arr[right];
        arr[right] = temp;
        return i;
    }
}

🔍 Introsort — Quick Sort "có bảo hiểm"

C++ std::sort() dùng Introsort: bắt đầu bằng Quick Sort, nhưng nếu recursion depth vượt 2 × log₂(n) (dấu hiệu pivot tệ), tự động chuyển sang Heap Sort. Kết hợp tốc độ thực tế của Quick Sort với worst-case guarantee O(n log n) của Heap Sort. Khi partition nhỏ (≤ 16 phần tử), chuyển sang Insertion Sort cho cache-friendliness.

Heap Sort — Chậm nhưng chắc, O(1) space

Nguyên lý hoạt động

Heap Sort dựa trên cấu trúc dữ liệu max-heap — binary tree hoàn chỉnh mà mỗi node ≥ tất cả con cháu.

Build Max-Heap: Biến mảng thành max-heap — O(n) bằng bottom-up heapify
Extract-Max lặp lại: Swap root (max) với phần tử cuối, giảm heap size, sift-down root mới — O(n log n)

Mỗi extract-max đặt phần tử lớn nhất vào cuối mảng (đúng vị trí), giống Selection Sort nhưng tìm max trong O(log n) thay vì O(n).

Tại sao Build-Heap là O(n) chứ không phải O(n log n)?

Đây là câu hỏi phỏng vấn kinh điển. Trực giác sai: "n phần tử × log n mỗi sift-down = O(n log n)." Thực tế:

text

Tầng cuối (n/2 nodes):  sift-down 0 bước  → 0 × n/2
Tầng kế cuối (n/4):     sift-down 1 bước  → 1 × n/4
Tầng tiếp (n/8):        sift-down 2 bước  → 2 × n/8
...
Root (1 node):           sift-down log n   → log(n) × 1

Tổng = n × Σ(k / 2^k) với k từ 0 đến log n ≤ 2n = O(n)

Phần lớn node nằm ở tầng thấp và sift-down ít bước → tổng hội tụ về O(n).

Trace — Heap Sort trên `[4, 10, 3, 5, 1]`

text

Bước 1: Build Max-Heap (bottom-up)
  Mảng:  [4, 10, 3, 5, 1]
  Heap:       4
            /   \
          10     3
         /  \
        5    1

  Heapify node 1 (index 1, value=10): con = 5, 1 → 10 > cả hai → OK
  Heapify node 0 (index 0, value=4):  con = 10, 3 → swap 4 và 10
         10                10
        /  \   sift-down  /  \
       4    3     →      5    3
      / \               / \
     5   1             4   1

  Max-Heap: [10, 5, 3, 4, 1]

Bước 2: Extract-Max lặp lại
  Swap root(10) với cuối(1): [1, 5, 3, 4 | 10]
  Sift-down 1: [5, 4, 3, 1 | 10]

  Swap root(5) với cuối(1):  [1, 4, 3 | 5, 10]
  Sift-down 1: [4, 1, 3 | 5, 10]

  Swap root(4) với cuối(3):  [3, 1 | 4, 5, 10]
  Sift-down 3: [3, 1 | 4, 5, 10] (đã OK)

  Swap root(3) với cuối(1):  [1 | 3, 4, 5, 10]

  Kết quả: [1, 3, 4, 5, 10] ✓

Visualizer State Transitions

text

VISUALIZER STATES — Heap Sort:
State 1: BUILD_HEAP  — các phần tử di chuyển để thỏa mãn heap property
State 2: EXTRACT_MAX — root (max) highlight, swap với phần tử cuối
State 3: SIFT_DOWN   — root mới "chìm" xuống đúng vị trí
State 4: SORTED      — phần tử vừa extract chuyển xanh lá ở cuối mảng
State 5: DONE        — toàn bộ xanh lá

🎬 Bubble Sort Visualizer

Chưa sắp xếp Đang so sánh Đã sắp xếp

Triển khai polyglot

C++PythonJava

cpp

#include <vector>
#include <algorithm>
using namespace std;

void siftDown(vector<int>& arr, int n, int i) {
    int largest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;

    if (left < n && arr[left] > arr[largest])
        largest = left;
    if (right < n && arr[right] > arr[largest])
        largest = right;

    if (largest != i) {
        swap(arr[i], arr[largest]);
        siftDown(arr, n, largest);
    }
}

void heapSort(vector<int>& arr) {
    int n = static_cast<int>(arr.size());

    // Build max-heap: bottom-up, O(n)
    for (int i = n / 2 - 1; i >= 0; --i)
        siftDown(arr, n, i);

    // Extract-max lặp lại
    for (int i = n - 1; i > 0; --i) {
        swap(arr[0], arr[i]);
        siftDown(arr, i, 0);
    }
}

python

def heap_sort(arr: list[int]) -> None:
    """Heap Sort in-place, O(n log n) mọi trường hợp."""
    n = len(arr)

    def sift_down(size: int, root: int) -> None:
        largest = root
        left = 2 * root + 1
        right = 2 * root + 2
        if left < size and arr[left] > arr[largest]:
            largest = left
        if right < size and arr[right] > arr[largest]:
            largest = right
        if largest != root:
            arr[root], arr[largest] = arr[largest], arr[root]
            sift_down(size, largest)

    # Build max-heap: O(n)
    for i in range(n // 2 - 1, -1, -1):
        sift_down(n, i)

    # Extract-max lặp lại
    for i in range(n - 1, 0, -1):
        arr[0], arr[i] = arr[i], arr[0]
        sift_down(i, 0)

java

public class HeapSort {
    public static void heapSort(int[] arr) {
        int n = arr.length;

        // Build max-heap: O(n)
        for (int i = n / 2 - 1; i >= 0; i--)
            siftDown(arr, n, i);

        // Extract-max lặp lại
        for (int i = n - 1; i > 0; i--) {
            int temp = arr[0];
            arr[0] = arr[i];
            arr[i] = temp;
            siftDown(arr, i, 0);
        }
    }

    private static void siftDown(int[] arr, int n, int i) {
        int largest = i;
        int left = 2 * i + 1;
        int right = 2 * i + 2;

        if (left < n && arr[left] > arr[largest]) largest = left;
        if (right < n && arr[right] > arr[largest]) largest = right;

        if (largest != i) {
            int temp = arr[i];
            arr[i] = arr[largest];
            arr[largest] = temp;
            siftDown(arr, n, largest);
        }
    }
}

Tại sao Heap Sort chậm hơn Quick Sort trong thực tế?

Yếu tố	Quick Sort	Heap Sort
Cache locality	Truy cập tuần tự trong partition	Nhảy parent↔child (`i` → `2i+1`)
Số phép so sánh	~1.4n log n (average)	~2n log n (mỗi sift-down so 2 con)
Branch prediction	Partition scan dễ dự đoán	Sift-down khó dự đoán hướng

Kết quả: Heap Sort thua Quick Sort 2-5× trên cùng data, dù cùng O(n log n). Heap Sort chỉ "thắng" khi bạn cần worst-case guarantee + O(1) space — hiếm gặp trong thực tế.

Timsort — Thuật toán mà production tin dùng

Tim Peters' Key Insight (2002)

Dữ liệu thực tế không phải random. Log files đã theo timestamp. Database records có patterns. User lists gần như alphabetical sau vài thao tác. Timsort khai thác điều này.

Cách hoạt động

text

Input: [3, 5, 8, 12, | 9, 7, 4, | 1, 2, 6, 10, 15, 20]
                run 1 ↑   run 2 ↑        run 3 ↑

Bước 1: Quét tìm "natural runs" — dãy con tăng hoặc giảm
  Run 1: [3, 5, 8, 12]      ← ascending, giữ nguyên
  Run 2: [9, 7, 4]          ← descending, đảo → [4, 7, 9]
  Run 3: [1, 2, 6, 10, 15, 20] ← ascending, giữ nguyên

Bước 2: Nếu run quá ngắn (< minrun ≈ 32-64), mở rộng bằng Insertion Sort
  (Insertion Sort tối ưu cho mảng nhỏ + gần sorted)

Bước 3: Merge các run bằng Modified Merge Sort
  - Dùng "galloping mode": khi một run thắng liên tục, skip exponentially
  - Merge stack đảm bảo merge balance (tránh merge run lớn + run rất nhỏ)

Kết quả: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20] ✓

Tại sao production chọn Timsort?

Ngôn ngữ / Engine	Hàm	Dùng Timsort?
Python	`list.sort()`, `sorted()`	✅
Java	`Arrays.sort()` (objects)	✅
V8 Engine (Chrome, Node.js)	`Array.prototype.sort()`	✅
Rust	`slice::sort()` (stable)	✅ (biến thể)
Swift	`Array.sort()`	✅ (biến thể)

Galloping Mode — Tối ưu khi run chênh lệch lớn

Khi merge hai run mà một run liên tục "thắng" (phần tử nhỏ hơn):

text

Merge thường:    so sánh 1-1-1-1-1... → O(n) mỗi phần tử
Galloping mode:  thắng liên tục? → skip 1, 2, 4, 8, 16... rồi binary search
                 → O(log n) cho chuỗi thắng dài

Điều này giải thích tại sao Timsort đạt O(n) trên dữ liệu đã sorted — chỉ cần 1 lần quét để nhận ra toàn bộ là 1 run duy nhất.

💡 HPN Pro Tip

Timsort không phải là thuật toán bạn cần tự implement trong phỏng vấn. Nhưng nếu interviewer hỏi "tại sao Python dùng Timsort thay vì Quick Sort?", câu trả lời là: (1) Timsort stable — quan trọng cho sort(key=...), (2) O(n) trên dữ liệu gần sorted — real-world data thường vậy, (3) real-world data có patterns (runs) mà Timsort exploit, trong khi Quick Sort coi mọi input như random.

Decision Matrix — Khi nào dùng thuật toán nào?

Khi phỏng vấn hoặc thiết kế hệ thống, hãy dùng "decision tree" này:

text

Cần sort?
├── Dùng built-in sort() → Timsort (99% trường hợp, DONE)
│
├── Tự implement (phỏng vấn / competitive / embedded)?
│   ├── Cần stable?
│   │   ├── Có → Merge Sort
│   │   └── Không
│   │       ├── Memory-constrained?
│   │       │   ├── Có → Heap Sort (O(1) space)
│   │       │   └── Không → Quick Sort (nhanh nhất average)
│   │       └── Worst-case guarantee?
│   │           ├── Có → Heap Sort hoặc Merge Sort
│   │           └── Không → Quick Sort (random pivot)
│   │
│   ├── Linked List? → Merge Sort (không cần random access)
│   │
│   └── Data > RAM (external sort)? → Merge Sort variant
│
└── Competitive programming?
    └── std::sort (C++), Arrays.sort (Java), sorted (Python) — DONE

⚡ Đừng "phát minh lại bánh xe"

Trong production, luôn dùng built-in sort trừ khi có lý do cực kỳ đặc biệt. std::sort (C++) là Introsort, sorted() (Python) là Timsort, Arrays.sort() (Java) là Dual-Pivot Quick Sort (primitives) / Timsort (objects). Những implementation này đã được tối ưu hàng nghìn giờ bởi các kỹ sư hàng đầu.

⚡ Operational Complexity — Con số thật

Với n = 1,000,000 phần tử (khoảng 4MB với int32):

Thuật toán	Số phép toán (xấp xỉ)	Thời gian (~1 GHz)	Nhận xét
O(n²) — Bubble/Selection	~10¹²	~16 phút 😱	Không khả thi
O(n log n) — Merge/Quick/Heap	~20 × 10⁶	~20ms ✅	Production-ready
O(n) — Timsort trên sorted data	~10⁶	~1ms 🚀	Best case

text

n = 1,000,000:
  n²        = 1,000,000,000,000  (một nghìn tỷ)
  n log₂ n  =    19,931,569      (hai mươi triệu)
  n         =     1,000,000      (một triệu)

Tỷ lệ: O(n²) / O(n log n) ≈ 50,000×
→ Từ 16 phút xuống 20ms — đó là sức mạnh của O(n log n).

Sai lầm điển hình

❌ Sai lầm 1: Quick Sort pivot = first element trên sorted input

python

# ❌ SAI: pivot luôn là phần tử nhỏ nhất → mỗi partition là (0, n-1) → O(n²)
def bad_partition(arr, left, right):
    pivot = arr[left]  # sorted input → pivot luôn là min
    ...

# ✅ ĐÚNG: random pivot → expected O(n log n) mọi input
def good_partition(arr, left, right):
    pivot_idx = random.randint(left, right)
    arr[pivot_idx], arr[right] = arr[right], arr[pivot_idx]
    pivot = arr[right]
    ...

❌ Sai lầm 2: Quên base case trong Merge Sort → stack overflow

python

# ❌ SAI: quên điều kiện dừng
def merge_sort(arr, left, right):
    mid = (left + right) // 2
    merge_sort(arr, left, mid)      # gọi vô hạn khi left == right
    merge_sort(arr, mid + 1, right)
    merge(arr, left, mid, right)

# ✅ ĐÚNG: base case khi chỉ còn 0 hoặc 1 phần tử
def merge_sort(arr, left, right):
    if left >= right:  # ← base case bắt buộc
        return
    mid = left + (right - left) // 2
    merge_sort(arr, left, mid)
    merge_sort(arr, mid + 1, right)
    merge(arr, left, mid, right)

❌ Sai lầm 3: Nghĩ Heap Sort nhanh hơn Quick Sort vì worst-case tốt hơn

Sai: "Heap Sort O(n log n) worst-case > Quick Sort O(n²) worst-case → Heap Sort nhanh hơn."

Đúng: Worst-case complexity ≠ thực tế performance. Quick Sort nhanh hơn 2-5× do cache locality và ít comparisons. Heap Sort chỉ đảm bảo worst-case, nhưng constant factor lớn hơn nhiều.

❌ Sai lầm 4: Tạo array mới mỗi lần merge

python

# ❌ SAI: mỗi lần merge tạo 2 mảng con mới → O(n log n) total allocations
def merge(arr, left, mid, right):
    left_arr = arr[left:mid+1]    # copy mới
    right_arr = arr[mid+1:right+1]  # copy mới
    ...

# ✅ TỐT HƠN: dùng 1 buffer được allocate trước
def merge_sort_optimized(arr):
    buffer = [0] * len(arr)  # allocate 1 lần
    _sort(arr, buffer, 0, len(arr) - 1)

❌ Sai lầm 5: Dùng Quick Sort cho Linked List

Quick Sort cần random access (arr[i] trong O(1)) cho partition. Linked List chỉ hỗ trợ sequential access → mỗi lần truy cập node thứ i là O(i). Merge Sort là lựa chọn tự nhiên cho Linked List vì chỉ cần sequential access trong merge.

Bài tập luyện tập

🧠 Quiz — Quick Sort Worst Case

🧠 Quiz

Câu hỏi: Quick Sort worst-case O(n²) xảy ra khi nào?

[ ] A. Mảng có tất cả phần tử bằng nhau và dùng random pivot
[ ] B. Mảng hoàn toàn ngẫu nhiên và dùng median-of-3 pivot
[x] C. Mảng đã sắp xếp và pivot luôn là phần tử đầu tiên
[ ] D. Mảng có kích thước là lũy thừa của 2

Giải thích: Khi mảng đã sorted và pivot = first element, mỗi partition chia (0, n-1) → depth = n thay vì log n. Đáp án A sai vì random pivot phân phối đều. Đáp án B sai vì median-of-3 chọn pivot gần median. Đáp án D không liên quan đến pivot quality.

🐛 Spot the Bug — Merge Sort

Tìm bug trong đoạn code sau:

python

def merge_sort(arr, left, right):
    if left >= right:
        return
    mid = (left + right) // 2  # 🐛 Bug ở đây?
    merge_sort(arr, left, mid)
    merge_sort(arr, mid + 1, right)
    merge(arr, left, mid, right)

def merge(arr, left, mid, right):
    temp = []
    i, j = left, mid + 1
    while i <= mid and j <= right:
        if arr[i] < arr[j]:       # 🐛 Bug ở đây?
            temp.append(arr[i])
            i += 1
        else:
            temp.append(arr[j])
            j += 1
    while i <= mid:
        temp.append(arr[i])
        i += 1
    while j <= right:
        temp.append(arr[j])
        j += 1
    arr[left:right + 1] = temp

💡 Gợi ý

Bug 1 (dòng mid): Khi left và right rất lớn, left + right có thể overflow (trong C/C++/Java). Python không bị nhưng C++ sẽ! Nên dùng left + (right - left) // 2.
Bug 2 (dòng so sánh): arr[i] < arr[j] thay vì arr[i] <= arr[j] → mất tính stable! Hai phần tử bằng nhau sẽ ưu tiên phần tử phải (từ mảng sau), đảo ngược thứ tự gốc.

🧩 Parsons Problem — Sắp xếp lại hàm Merge

Sắp xếp các dòng code sau thành hàm merge hoàn chỉnh:

python

# Các dòng bị xáo trộn — hãy sắp xếp lại đúng thứ tự:

    while j <= right:                           # (A)
def merge(arr, left, mid, right):               # (B)
    while i <= mid and j <= right:              # (C)
    arr[left:right + 1] = temp                  # (D)
    i, j = left, mid + 1                        # (E)
        temp.append(arr[j]); j += 1             # (F)
    while i <= mid:                             # (G)
    temp = []                                   # (H)
        if arr[i] <= arr[j]:                    # (I)
            temp.append(arr[i]); i += 1         # (J)
            temp.append(arr[j]); j += 1         # (K)
        else:                                   # (L)
        temp.append(arr[i]); i += 1             # (M)

✅ Đáp án đúng

Thứ tự: B → H → E → C → I → J → L → K → G → M → A → F → D

python

def merge(arr, left, mid, right):               # (B)
    temp = []                                   # (H)
    i, j = left, mid + 1                        # (E)
    while i <= mid and j <= right:              # (C)
        if arr[i] <= arr[j]:                    # (I)
            temp.append(arr[i]); i += 1         # (J)
        else:                                   # (L)
            temp.append(arr[j]); j += 1         # (K)
    while i <= mid:                             # (G)
        temp.append(arr[i]); i += 1             # (M)
    while j <= right:                           # (A)
        temp.append(arr[j]); j += 1             # (F)
    arr[left:right + 1] = temp                  # (D)

Checklist ghi nhớ

✅ Checklist triển khai

Merge Sort

[ ] Divide and Conquer: chia đôi → đệ quy → merge hai nửa đã sorted
[ ] Luôn O(n log n) — best, average, worst
[ ] Stable sort, nhưng cần O(n) extra space
[ ] Lý tưởng cho: linked list, external sort, khi cần stability

Quick Sort

[ ] Partition first, recurse later — pivot đúng vị trí sau partition
[ ] Average O(n log n), worst O(n²) — tránh bằng random/median-of-3 pivot
[ ] In-place (O(log n) stack space), cache-friendly → nhanh nhất thực tế
[ ] KHÔNG stable, KHÔNG dùng cho linked list

Heap Sort

[ ] Build max-heap O(n), extract-max n lần × O(log n) = O(n log n) tổng
[ ] In-place O(1) space, worst-case O(n log n) guarantee
[ ] Cache-unfriendly → chậm hơn Quick Sort 2-5× trong thực tế
[ ] KHÔNG stable

Timsort

[ ] Hybrid: tìm natural runs + Insertion Sort mở rộng + Merge Sort ghép
[ ] Best O(n) trên sorted data, worst O(n log n)
[ ] Stable, dùng bởi Python, Java, V8, Rust, Swift
[ ] Galloping mode tối ưu merge khi run chênh lệch lớn

Quy tắc chọn

[ ] Production → dùng built-in sort() (Timsort/Introsort)
[ ] Cần stable → Merge Sort hoặc Timsort
[ ] Memory-constrained → Heap Sort (O(1)) hoặc Quick Sort (O(log n))
[ ] Worst-case guarantee → Merge Sort hoặc Heap Sort (KHÔNG Quick Sort)
[ ] Linked List → Merge Sort

Liên kết học tiếp

📍 Trang tiếp theo

Bạn đã nắm vững bộ tứ sorting O(n log n) — nền tảng để giải quyết hầu hết bài toán sắp xếp trong phỏng vấn và production. Tiếp theo, chúng ta chuyển sang tìm kiếm — kỹ năng đi đôi với sắp xếp: Tìm kiếm — Linear & Binary Search →

Từ khóa glossary: Merge Sort, Quick Sort, Heap Sort, Timsort, Divide and Conquer, chia để trị, partition, pivot, stable sort, in-place sort, O(n log n), introsort, galloping mode

Tìm kiếm liên quan: thuật toán sắp xếp nhanh, so sánh merge sort quick sort, khi nào dùng heap sort, timsort python java, O(n log n) sorting algorithms

Sắp xếp hiệu quả — Merge, Quick, Heap Sort & Timsort ​

Bức tranh tư duy — Chia để trị như chiến thuật quân sự ​

Bảng so sánh tổng quan ​

Merge Sort — Chia để trị, trộn để thắng ​

Nguyên lý hoạt động ​

Trace chi tiết — Merge Sort trên [38, 27, 43, 3, 9, 82, 10] ​

Visualizer State Transitions ​

🎬 Bubble Sort Visualizer

Triển khai polyglot ​

Quick Sort — Nhanh nhất trong thực tế, nguy hiểm nhất khi sai ​

Nguyên lý hoạt động ​

Chiến lược chọn pivot ​

Trace — Lomuto Partition trên [10, 7, 8, 9, 1, 5] ​

Visualizer State Transitions ​

🎬 Bubble Sort Visualizer

Triển khai polyglot — Random Pivot ​

Heap Sort — Chậm nhưng chắc, O(1) space ​

Nguyên lý hoạt động ​

Tại sao Build-Heap là O(n) chứ không phải O(n log n)? ​

Trace — Heap Sort trên [4, 10, 3, 5, 1] ​

Visualizer State Transitions ​

🎬 Bubble Sort Visualizer

Triển khai polyglot ​

Tại sao Heap Sort chậm hơn Quick Sort trong thực tế? ​

Timsort — Thuật toán mà production tin dùng ​

Tim Peters' Key Insight (2002) ​

Cách hoạt động ​

Tại sao production chọn Timsort? ​

Galloping Mode — Tối ưu khi run chênh lệch lớn ​

Decision Matrix — Khi nào dùng thuật toán nào? ​

⚡ Operational Complexity — Con số thật ​

Sai lầm điển hình ​

❌ Sai lầm 1: Quick Sort pivot = first element trên sorted input ​

❌ Sai lầm 2: Quên base case trong Merge Sort → stack overflow ​

❌ Sai lầm 3: Nghĩ Heap Sort nhanh hơn Quick Sort vì worst-case tốt hơn ​

❌ Sai lầm 4: Tạo array mới mỗi lần merge ​

❌ Sai lầm 5: Dùng Quick Sort cho Linked List ​

Bài tập luyện tập ​

🧠 Quiz — Quick Sort Worst Case ​

🐛 Spot the Bug — Merge Sort ​

🧩 Parsons Problem — Sắp xếp lại hàm Merge ​

Checklist ghi nhớ ​

Liên kết học tiếp ​

📍 Trang tiếp theo ​

Sắp xếp hiệu quả — Merge, Quick, Heap Sort & Timsort

Bức tranh tư duy — Chia để trị như chiến thuật quân sự

Bảng so sánh tổng quan

Merge Sort — Chia để trị, trộn để thắng

Nguyên lý hoạt động

Trace chi tiết — Merge Sort trên `[38, 27, 43, 3, 9, 82, 10]`

Visualizer State Transitions

Triển khai polyglot

Quick Sort — Nhanh nhất trong thực tế, nguy hiểm nhất khi sai

Nguyên lý hoạt động

Chiến lược chọn pivot

Trace — Lomuto Partition trên `[10, 7, 8, 9, 1, 5]`

Visualizer State Transitions

Triển khai polyglot — Random Pivot

Heap Sort — Chậm nhưng chắc, O(1) space

Nguyên lý hoạt động

Tại sao Build-Heap là O(n) chứ không phải O(n log n)?

Trace — Heap Sort trên `[4, 10, 3, 5, 1]`

Visualizer State Transitions

Triển khai polyglot

Tại sao Heap Sort chậm hơn Quick Sort trong thực tế?

Timsort — Thuật toán mà production tin dùng

Tim Peters' Key Insight (2002)

Cách hoạt động

Tại sao production chọn Timsort?

Galloping Mode — Tối ưu khi run chênh lệch lớn

Decision Matrix — Khi nào dùng thuật toán nào?

⚡ Operational Complexity — Con số thật

Sai lầm điển hình

❌ Sai lầm 1: Quick Sort pivot = first element trên sorted input

❌ Sai lầm 2: Quên base case trong Merge Sort → stack overflow

❌ Sai lầm 3: Nghĩ Heap Sort nhanh hơn Quick Sort vì worst-case tốt hơn

❌ Sai lầm 4: Tạo array mới mỗi lần merge

❌ Sai lầm 5: Dùng Quick Sort cho Linked List

Bài tập luyện tập

🧠 Quiz — Quick Sort Worst Case

🐛 Spot the Bug — Merge Sort

🧩 Parsons Problem — Sắp xếp lại hàm Merge

Checklist ghi nhớ

Liên kết học tiếp

📍 Trang tiếp theo