前言
随着行业的发展,编程能力逐渐成为软件测试从业人员的一项基本能力。因此在笔试和面试中常常会有一定量的编码题,主要考察以下几点。
- 基本编码能力及思维逻辑
- 基本数据结构(顺序表、链表、队列、栈、二叉树)
- 基本算法(排序、查找、递归)及时间复杂度
除基本算法之外,笔试面试中经常会考察以下三种思想:
- 哈希
- 递归
- 分治
哈希
哈希即Python中的映射类型,字典和集合,键值唯一,查找效率高,序列(列表、元祖、字符串)的元素查找时间复杂度是O(n),而字典和集合的查找只需要O(1)。
因此哈希在列表问题中主要有两种作用:
去重
优化查找效率
例题1:列表去重#
列表去重在不考虑顺序的情况下可以直接使用set()转换(转换后会自动排序),需要保持顺序可以使用字典构建的fromkeys()方法,利用字典键值的唯一性去重。
不考虑顺序:
l = [2,1,2,3,4,5,6,6,5,4,3,2,1] result = list(set(l)) print(result)
运行结果:
[1, 2, 3, 4, 5, 6]
考虑顺序:
l = [2,1,2,3,4,5,6,6,5,4,3,2,1] result = list({}.fromkeys(l).keys()) print(result)
运行结果:
[2, 1, 3, 4, 5, 6]
例题2:分组
一串字母数字组合的字符串,找出相同的字母或数字,并按照个数排序。
l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1] set1 = set(l) result = [(item, l.count(item)) for item in set1] result.sort(key=lambda x:x[1], reverse=True) print(result)
这里使用哈希的键值不重复性。当然也可以使用python自带的groupby函数,代码如下:
from itertools import groupby l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1] l.sort(key=lambda x: str(x)) # 分组前需要先排序 result = [] for item, group in groupby(l, key=lambda x: str(x)): result.append((item, len(list(group)))) result.sort(key=lambda x:x[1], reverse=True) print(result)
例题3:海量数据找出top K的数据#
对于小数据量可以使用排序+切片,而对于海量数据,需要考虑服务器硬件条件。即要考虑时间效率,也要考虑内存占用,同时还要考虑数据特征。如果大量的重复数据,可以先用哈希进行去重来降低数据量。
这里我们使用生成器生成1000万个随机整数,求最大的1000个数,生成随机数的代码如下:
import random import time n = 10000 * 1000 k = 1000 print(n) def gen_num(n): for i in range(n): yield random.randint(0, n) l = gen_num(n)
不限内存可以直接使用set()去重+排序
start = time.time() l = list(set(l)) result = l[-k:] result.reverse() print(time.time()-start)
1000w个数据会全部读入内存,set后列表自动为递增顺序,使用切片取-1000到最后的即为top 1000的数
使用堆排可以节省一些内存
start = time.time() result = heapq.nlargest(k, l) print(time.time()-start)
这里是用来Python自带的堆排库heapq。使用nlargest(k,l)可以取到l序列,最大的k个数。
较小内存可以分治策略,使用多线程对数据进行分组处理(略)
例题4:两数之和#
l=[1,2,3,4,5,6,7,8] 数据不重复,target=6,快速找出数组中两个元素之和等于target 的数组下标。
注意,不要使用双重循环,暴力加和来和target对比,正确的做法是单层循环,然后查找target与当前值的差,是否存在于列表中。
但是由于列表的in查询时间复杂度是O(n),即隐含了一层循环,这样效率其实和双重循环是一样的,都是O(n^2)。
这里就可以使用哈希来优化查询差值是否在列表中操作,将O(n)降为O(1),因此总体的效率就会变成O(n^2)->O(n)。
l = [1,2,3,4,5,6,7,8] set1 = set(list1) # 使用集合已方便查找 target = 6 result = [] for a in list1: b = target - a if a < b < target and b in set1: # 在集合中查找,为避免重复,判断a为较小的那个值 result.append((list1.index(a), list1.index(b))) # 列表index取下标的操作为O(1) print(result)
递归问题
递归是一种循环调用自身的函数。可以用于解决以下高频问题:
- 阶乘
- 斐波那切数列
- 跳台阶、变态跳台阶
- 快速排序
- 二分查找
- 二叉树深度遍历(前序、中序、后序)
- 求二叉树深度
- 平衡二叉树判断
- 判断两颗树是否相同
递归是一种分层推导解决问题的方法,是一种非常重要的解决问题的思想。递归可快速将问题层级化,简单化,只需要考虑出口和每层的推导即可。
如阶乘,要想求n!,只需要知道前一个数的阶乘(n-1)!,然后乘以n即可,因此问题可以转为求上一个数的阶乘,依次向前,直到第一个数。
举个通俗的例子:
A欠你10万,但是他没那么多钱,B欠A 8万,C欠B 7万 C现在有钱。因此你要逐层找到C,一层一层还钱,最后你才能拿到属于你的10万。
Python,自动化测试,面试题
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]