这篇文章主要介绍了Python文本处理简单易懂方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
自从认识了python这门语言,所有的事情好像变得容易了,作为小白,逗汁儿今天就为大家总结一下python的文本处理的一些小方法。
话不多说,代码撸起来。
python大小写字符互换
在进行大小写互换时,常用到的方法有4种,upper()、lower()、capitalize() 和title()。
str = "www.dataCASTLE.com" print(str.upper())# 把所有字符中的小写字母转换成大写字母 print(str.lower())# 把所有字符中的大写字母转换成小写字母 print(str.capitalize())# 把第一个字母转化为大写字母,其余小写 print(str.title())# 把每个单词的第一个字母转化为大写,其余小写 WWW.DATACASTLE.COM www.datacastle.com Www.datacastle.com Www.Datacastle.Com
还可以同时进行大小写互换:
s="hGdssWW678qqfdDDD777f8888sD8FJJss jjYYhVV #sh&" def fn(x): if x.is lower(): return x.upper() elif x.is upper(): return x.lower() else: return x result=''.join([fn(r) for r in list(s)]) print(result) HgDSSww678QQFDddd777F8888Sd8fjjSS JJyyHvv #SH&
在s当中,不仅有大小写字母,还有数字,符号作为干扰,运用代码成功将大小写进行了互换。
行列互换
01 :insert进行A行与N行的互换
with open('D: .txt','r') as f: txt=f.readlines() txt.insert(4,txt[1])#第二行插入第五行的位置 del(txt[1])#删除原来的第二行 print(txt) 1 A 一 3 C 三 4 D 四 2 B 二 5 E 五 6 F 六
02: 矩阵的行列互换
matrix = [[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3],] trans = [] for i in range(4): trans.append([row[i] for row in matrix]) print('', trans) [[1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3]]
关于行列互换的情况,python有一个很好用的库pandas,其中的操作非常简便,可以到之前的文章”十分钟上手pandas“中查看。
实现快速排序
快排的思想:首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。
01:超级"简短"的python实现的快速排序,一行代码轻松实现快速排序。
def quickSort(arg): if(arg==[]): return [] return quickSort([i for i in arg[1:] if i<=arg[0]])+[arg[0]]+quickSort([i for i in arg[1:] if i>arg[0]]) print quickSort([11,22,8,23,7,33,13,28,66,777]) [7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
02:一般快排实现
def quicksort(array, left, right): #建立递归终止条件 if left >= right: return low = left#low为序列左边要移动的游标 high = right#high为序列右边要移动的游标 key = array[low]#将左边的数设为基准元素 while left < right: # 当left与right未重合,并且比基准元素要大,就将游标向左移动 while left < right and array[right] > key: right -= 1 # 如果比基准元素小,就跳出循环,并且把其放在基准元素左边 array[left] = array[right] # 当low与last未重合,并且比基准元素要小,就将游标向右移动 while left < right and array[left] <= key: left += 1 # 如果比基准元素大,就跳出循环,并且把其放在基准元素右边 array[right] = array[left] # 当low与last相等,就是基准元素的排序位置 array[right] = key # 对排序好的元素左右两边的序列进行递归 quicksort(array, low, left - 1) quicksort(array, left + 1, high) array = [11,22,8,23,7,33,13,28,66,777] print("Quick Sort: ") quicksort(array,0,len(array)-1) print(array) [7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
03:《算法导论》中的快排程序
def quicksort(array, l, r): if l < r: q = partition(array, l, r) quick_sort(array, l, q - 1) quick_sort(array, q + 1, r) def partition(array, l, r): x = array[r] i = l - 1 for j in range(l, r): if array[j] <= x: i += 1 array[i], array[j] = array[j], array[i] array[i + 1], array[r] = array[r], array[i+1] return i + 1 array = [11,22,8,23,7,33,13,28,66,777] print("Quick Sort: ") quicksort(array,0,len(array)-1) print(array) [7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
04:python对list有一个内置函数sorted()排序
a = [11,22,8,23,7,33,13,28,66,777] b=sorted(a) print(b) print(a) [7, 8, 11, 13, 22, 23, 28, 33, 66, 777] [11, 22, 8, 23, 7, 33, 13, 28, 66, 777]
sorted虽然是使用函数方法进行排序,但是效果非常好。使用sorted函数进行排序,不会改变a原有的排序,并且当文本中有其余字母符号等干扰时,也可以成功的将数字进行排序。
文本对齐
有些时候我们得到的文本可能是混乱的,需要进行对齐处理,关于对齐有以下几种方法:
01:format格式化对齐
# format格式化对齐 def f1(): with open("D: .txt","r") as f: for s in f: l=s.rsplit () #左对齐,填充符号自定 t='{0:<5} {1:<7} {2}'.format(l[0],l[1],l[2]) print(str(t)) f1() 111 ABC 西瓜 22222 AABBC 水蜜桃 3333 CSDDGFF 香蕉 44 QQQSED 波罗蜜
02:just对齐
#just对齐 r='' def f2(): f=open("D: .txt","r") for s in f: l=s.rsplit() #通过指定分隔符对字符串进行切片 print(l[0].ljust(5," "),l[1].ljust(7," "),l[2]) f2() 111 ABC 西瓜 22222 AABBC 水蜜桃 3333 CSDDGFF 香蕉 44 QQQSED 波罗蜜
分行输出
01:正则表达式分行输出
#正则表达式 a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九" import re reg=["[a-z]","[A-Z]","d","[^da-zA-Z]"] #compile和findall一起使用,返回一个列表 for s in reg: rega=re.compile(s) s=re.findall(rega,a) print("".join(s)) abcdefghi ABCDEFGHI 123456789 一二三四五六七八九
02:string方法分行输出
#string方法 a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九" import string ta=tb=tc=td='' la=string.ascii_lowercase#la为小写字母 ua=string.ascii_uppercase#ua为大写字母 nb=string.digits#nb为0~9的数字 ub="一二三四五六七八九" #分别从a中找出小写、大写字母、数字并进行分行输出 for s in a: if s in la: ta=ta+s if s in ua: tb=tb+s if s in nb: tc=tc+s if s in ub: td=td+s print(ta) print(tb) print(tc) print(td) abcdefghi ABCDEFGHI 123456789 一二三四五六七八九
好了,今天的分享就到这里。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
Python,文本,处理,方法
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新日志
- 明达年度发烧碟MasterSuperiorAudiophile2021[DSF]
- 英文DJ 《致命的温柔》24K德国HD金碟DTS 2CD[WAV+分轨][1.7G]
- 张学友1997《不老的传说》宝丽金首版 [WAV+CUE][971M]
- 张韶涵2024 《不负韶华》开盘母带[低速原抓WAV+CUE][1.1G]
- lol全球总决赛lcs三号种子是谁 S14全球总决赛lcs三号种子队伍介绍
- lol全球总决赛lck三号种子是谁 S14全球总决赛lck三号种子队伍
- 群星.2005-三里屯音乐之男孩女孩的情人节【太合麦田】【WAV+CUE】
- 崔健.2005-给你一点颜色【东西音乐】【WAV+CUE】
- 南台湾小姑娘.1998-心爱,等一下【大旗】【WAV+CUE】
- 【新世纪】群星-美丽人生(CestLaVie)(6CD)[WAV+CUE]
- ProteanQuartet-Tempusomniavincit(2024)[24-WAV]
- SirEdwardElgarconductsElgar[FLAC+CUE]
- 田震《20世纪中华歌坛名人百集珍藏版》[WAV+CUE][1G]
- BEYOND《大地》24K金蝶限量编号[低速原抓WAV+CUE][986M]
- 陈奕迅《准备中 SACD》[日本限量版] [WAV+CUE][1.2G]