当前位置 博文首页 > KrisChung博客:python--堆(heap)与堆排序

    KrisChung博客:python--堆(heap)与堆排序

    作者:[db:作者] 时间:2021-09-22 16:54

    什么是堆

    堆是一种完全二叉树,有最大堆和最小堆两种

    1.最大堆:对于每个非叶子节点V, V的值都比它的两个孩子大,称为 最大堆特性(heap order property)最大堆里的根总是存储最大值, 最小的值存储在叶节点
    2.最小堆:和最大堆相反,每个非叶子节点V,V的两个孩子的值都比它大

    这里写图片描述

    关于堆的操作

    堆提供了很有限的几个操作:

    1.插入新的值。插入比较麻烦的就是需要维持堆的特性。需要sift-up操作,具体在代码中实现
    2.获取并移除根节点的值。每次我们都可以获取最大值或最小值。这个时候需要把底层最右边的节点值替换到root节点之后执行sift-down操作

    堆的表示

    这里用数组实现堆

    这里写图片描述

    仔细观察下,因为完全二叉树的特性,树不会有间隙。对于数组里的一个下标 i ,我们可以得到它的父亲和孩子的节点对应的下标:

    parent = int( (i-1) / 2 ) #取整
    left = 2 * i +1
    right = 2 * i + 2
    超出下标表示没有对应的孩子节点

    代码实现

    关于add()方法的实现原理

    这里写图片描述

    关于siftup()递归操作的原理图

    这里写图片描述

    关于extract()方法的原理图

    这里写图片描述

    
    # -*- coding:utf-8 -*-
    
    ####################################
        # heap 实现
    ####################################
    
    class Array(object):
        def __init__(self,size=32):
            self._size = size
            self._items = [None] * size
    
        def __getitem__(self,index):
            return self._items[index]
    
        def __setitem__(self,index,value):
            self._items[index] = value
    
        def __len__(self):
            return self._size
    
        def clear(self,value=None):
            for i in range(self._items):
                self._items[i] = value
    
        def __iter__(self):
            for item in self._items:
                yield item
    
    
    '''
        初始化堆结构
    '''
    class MaxHeap(object):
        def __init__(self,maxsize=None):
            self.maxsize = maxsize
            self._elements = Array(maxsize)
            self._count = 0
    
        def __len__(self):
            return self._count
    
        def add(self,value):
            if self._count >= self.maxsize:
                raise Exception('full')
            #将插入的值value给数组最后一值
            self._elements[self._count] = value
            #堆的容量加一
            self._count += 1
            self._siftup(self._count-1)
    
        def _siftup(self,ndx):      #递归交换直到满足最大堆特性
            if ndx > 0:
                #获取添加节点的父节点的下标值
                parent = int((ndx-1)/2)
                #如果添加节点的值大于父节点的值
                if self._elements[ndx] > self._elements[parent]:
                    self._elements[ndx],self._elements[parent] = self._elements[parent],self._elements[ndx]
                    self._siftup(parent)
    
    
    
    
        def extract(self):
            if self._count <= 0:
                raise Exception('empty')
            #获取根节点的值
            value = self._elements[0]
            #将堆最后一个叶子节点作为root节点
            self._elements[0] = self._elements[self._count]
            self._siftdown(0)
            return value
    
        def _siftdown(self,ndx):
            #获取左右孩子节点的下标
            left = 2 * ndx + 1
            right = 2 * ndx + 2
            #默认ndx为最大
            largest = ndx
    
            if(left < self._count and   #有左孩子
                self._elements[left] >= self._elements[largest] and
                self._elements[left] >= self._elements[right]):     #左孩子 > 右孩子
                largest = left
    
            elif right < self._count and self._elements[right] >= self._elements[largest]:
                largest = right
    
            if largest != ndx:
                self._elements[ndx],self._elements[largest] = self._elements[largest],self._elements[ndx]
                self._siftdown(largest)
    
    def test_max_heap():
        import random
        n = 5
        h = MaxHeap(n)
        for i in range(n):
            h.add(i)
        for i in reversed(range(n)):
            assert i == h.extract()
    
    
    
    '''
        实现堆排序
        上面我们实现了最大堆,每次我们都能extract一个最大的元素了,于是一个倒序排序函数就能很容易写出来了:
    '''
    def heapsort_reverse(array):
        length = len(array)
        maxheap = MaxHeap(length)
        for i in array:
            maxheap.add(i)
        res = []
        for i in range(length):
            res.append(maxheap.extract())
        return res
    
    
    def test_heapsort_reverse():
        import random
        l = list(range(10))
        random.shuffle(1)
        assert heapsort_reverse(l) == sorted(l,reverse=True)
    
    
    
    
    
    
    

    关于 python 里的 heapq

    python 其实自带了 heapq 模块,用来实现堆的相关操作,原理是类似的,可以阅读相关文档

    练习

    1.尝试实现一个最小堆
    2.我们实现的堆排序是inplace的吗,如果不是,你能改成inplace的吗?
    3.这里我们用最大堆实现了一个heapsort_reverse函数,请你实现一个正序排序的函数.似乎不止一种方式

    cs
    下一篇:没有了