排序算法——堆排序
一、介绍
「堆排序heapsort」是一种基于堆数据结构实现的高效排序算法。我们可以利用已经学过的“建堆操作”和“元素出堆操作”实现堆排序。
1. 输入数组并建立小顶堆,此时最小元素位于堆顶。
2. 不断执行出堆操作,依次记录出堆元素,即可得到从小到大排序的序列。
以上方法虽然可行,但需要借助一个额外数组来保存弹出的元素,比较浪费空间。在实际中,我们通常使用一种更加优雅的实现方式。
二、算法流程
设数组的长度为𝑛,堆排序的流程如下所示。
1. 输入数组并建立大顶堆。完成后,最大元素位于堆顶。
2. 将堆顶元素(第一个元素)与堆底元素(最后一个元素)交换。完成交换后,堆的长度减1,已排序元素数量加1。
3. 从堆顶元素开始,从顶到底执行堆化操作(SiftDown)。完成堆化后,堆的性质得到修复。
4. 循环执行第2.和3.步。循环𝑛−1轮后,即可完成数组排序。
三、完整代码
在代码实现中,使用了与堆相同的从顶至底堆化sift_down()函数。值得注意的是,由于堆的长度 会随着提取最大元素而减小,因此我们需要给sift_down()函数添加一个长度参数𝑛,用于指定堆的当前有效长度。
def sift_down(nums: list[int], n: int, i: int):"""堆的长度为 n ,从节点 i 开始,从顶至底堆化"""while True:# 判断节点 i, l, r 中值最大的节点,记为 mal = 2 * i + 1r = 2 * i + 2ma = iif l < n and nums[l] > nums[ma]:ma = lif r < n and nums[r] > nums[ma]:ma = r# 若节点 i 最大或索引 l, r 越界,则无须继续堆化,跳出if ma == i:break# 交换两节点nums[i], nums[ma] = nums[ma], nums[i]# 循环向下堆化i = madef heap_sort(nums: list[int]):"""堆排序"""# 建堆操作:堆化除叶节点以外的其他所有节点for i in range(len(nums) // 2 - 1, -1, -1):sift_down(nums, len(nums), i)# 从堆中提取最大元素,循环 n-1 轮for i in range(len(nums) - 1, 0, -1):# 交换根节点与最右叶节点(交换首元素与尾元素)nums[0], nums[i] = nums[i], nums[0]# 以根节点为起点,从顶至底进行堆化sift_down(nums, i, 0)"""Driver Code"""
if __name__ == "__main__":nums = [4, 1, 3, 1, 5, 2]heap_sort(nums)print("堆排序完成后 nums =", nums)
四、算法特性
‧ 时间复杂度𝑂(𝑛log𝑛)、非自适应排序:建堆操作使用𝑂(𝑛)时间。从堆中提取最大元素的时间复杂度为𝑂(log𝑛),共循环𝑛−1轮。
‧ 空间复杂度𝑂(1)、原地排序:几个指针变量使用𝑂(1)空间。元素交换和堆化操作都是在原数组上进行的。
‧ 非稳定排序:在交换堆顶元素和堆底元素时,相等元素的相对位置可能发生变化。