社区学习工具库休闲

简体中文

首页 > 后端开发 > Python教程 > 最大K个数问题的Python版解法

最大K个数问题的Python版解法

高洛峰

发布： 2017-03-02 11:16:16

原创

1235 人浏览过

TopK问题,即寻找最大的K个数,这个问题非常常见,比如从1千万搜索记录中找出最热门的10个关键词.

方法一:
先排序,然后截取前k个数.
时间复杂度：O(n*logn)+O(k)=O(n*logn)。
这种方式比较简单粗暴，提一下便是。

方法二：最大堆

我们可以创建一个大小为K的数据容器来存储最小的K个数，然后遍历整个数组，将每个数字和容器中的最大数进行比较，如果这个数大于容器中的最大值，则继续遍历，否则用这个数字替换掉容器中的最大值。这个方法的理解也十分简单，至于容器的选择，很多人第一反应便是最大堆，但是python中最大堆如何实现呢？我们可以借助实现了最小堆的heapq库，因为在一个数组中，每个数取反，则最大数变成了最小数，整个数字的顺序发生了变化，所以可以给数组的每个数字取反，然后借助最小堆，最后返回结果的时候再取反就可以了，代码如下：

import heapq
def get_least_numbers_big_data(self, alist, k):
  max_heap = []
  length = len(alist)
  if not alist or k <= 0 or k > length:
    return
  k = k - 1
  for ele in alist:
    ele = -ele
    if len(max_heap) <= k:
      heapq.heappush(max_heap, ele)
    else:
      heapq.heappushpop(max_heap, ele)

  return map(lambda x:-x, max_heap)


if __name__ == "__main__":
  l = [1, 9, 2, 4, 7, 6, 3]
  min_k = get_least_numbers_big_data(l, 3)

登录后复制

方法三：quick select

quick select算法.其实就类似于快排.不同地方在于quick select每趟只需要往一个方向走.
时间复杂度:O(n).

def qselect(A,k): 
  if len(A)<k:return A 
  pivot = A[-1] 
  right = [pivot] + [x for x in A[:-1] if x>=pivot] 
  rlen = len(right) 
  if rlen==k: 
    return right 
  if rlen>k: 
    return qselect(right, k) 
  else: 
    left = [x for x in A[:-1] if x<pivot] 
    return qselect(left, k-rlen) + right 
 
for i in range(1, 10): 
  print qselect([11,8,4,1,5,2,7,9], i)

登录后复制

更多最大K个数问题的Python版解法相关文章请关注PHP中文网！

相关标签：

Python 算法

来源：php.cn

上一篇：Python中global语句下全局变量的值的修改下一篇：Python中的多行注释文档编写风格

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

html设置加粗、倾斜、下划线、删除线等字体效果示例介绍

1970-01-01 08:00:00
实现一个 Java 版的 Redis

1970-01-01 08:00:00
最简单的微信小程序Demo

1970-01-01 08:00:00
python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

1970-01-01 08:00:00
微信小程序：如何实现tabs选项卡效果示例

1970-01-01 08:00:00
Python构造自定义方法来美化字典结构输出

1970-01-01 08:00:00
HTML5:使用Canvas实时处理Video

1970-01-01 08:00:00
Asp.net使用SignalR实现发送图片

1970-01-01 08:00:00
微信小程序开发教程-App()和Page()函数概述

1970-01-01 08:00:00
详解python redis使用方法

1970-01-01 08:00:00

最新问题

使用 window.open() 和 data 打开计算文档：scheme 我有一个在浏览器中运行的网页，该网页生成一个计算的HTML文档，我想在新的浏览器选项卡中打开该文档。简单而肮脏的方法是这样做：constw=window.open('','_bla...

来自于 2024-04-06 15:06:34

0

1

378

React Three Fiber：为什么我的滚动事件有滞后？在ReactThreeFiber中，我有一个React组件，可以生成一个精灵，我希望该精灵在相机变焦下保持不变。该算法似乎有效（大小似乎不随时间变化），但我可以明显看到它在放大和缩...

来自于 2024-04-06 13:39:24

0

1

410

PDF文件能够运行HTML5和Javascript吗？我有一个愚蠢的想法，想尝试制作一个在任何计算机上都不会被阻止的程序，因为它将嵌入在PDF中（我听说Javascript可以在PDF中运行）。它将在PDF文件中运行HTML5和Jav...

来自于 2024-04-05 12:57:00

0

1

456

使用 Eloquent 查询对用户进行分组（总用户、管理员用户、控制操作员、警卫）我有一个查询，其中计算所有用户，具有角色“admin”的用户总数，具有角色“control_operator”的用户总数和具有角色“guard”的用户总数。查询正在工作，但有一个我...

来自于 2024-04-05 12:11:26

0

1

332

我的乘法 (*) 命令不计算我的星号不起作用，当我执行calc()函数并执行乘法标记（即星号）时，该函数不起作用我想尽快解决这个问题，因为我正在学习编程，我需要你帮助解决--标记大小：计算(var(--cel...

来自于 2024-04-04 21:18:17

0

1

315

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1425018
php入门教程之一周学会PHP

4271263
JAVA 初级入门视频教程

2551755
小甲鱼零基础入门学习Python视频教程

508450
PHP 零基础入门教程

863984

最新下载

更多>

网站特效

网站源码

网站素材

前端模板