在上篇博客中,我们已经实现了水平投影和垂直投影图的绘制。接下来,我们可以根据获得的投影数据进行图像的分割,该法用于文本分割较多,所以此处依然以上次的图为例。
先把上次的两幅图搬过来,方便讲解。
上面两图分别从垂直和水平方向描述了图像中文本的分布。我们想象一下,将两幅图重叠起来(当然这里比例要调整下),那么我们就能得到四个重叠的白块,而这些白块所处的位置正是原图中文本的位置。所以接下来的任务就是,找出这些白块的坐标,此处白块近似矩形,所以我们要求矩形的四个坐标。
下面看代码。
#根据水平投影值选定行分割点 inline = 1 start = 0 j = 0 for i in range(0,height): if inline == 1 and z[i] >= 150 : #从空白区进入文字区 start = i #记录起始行分割点 print i inline = 0 elif (i - start > 3) and z[i] < 150 and inline == 0 : #从文字区进入空白区 inline = 1 hfg[j][0] = start - 2 #保存行分割位置 hfg[j][1] = i + 2 j = j + 1
确定行分割点的原理就是判断每一行的像素点数是否足够。我们可以从水平投影图中看出,白块是有文字的地方(原图是黑字白底,只是画投影图时选用白块黑底),即前面几行,灰度值为0的点的个数N很少,所以当遇到文字区时,N会很大,根据这一点,我们确定进入文字区的坐标(A1,B1)。然后,当从文字区出来时,N又变的很小,我们再记下它的坐标(A1,B2)。同理,我们可以确定列分割点。
incol = 1 start1 = 0 j1 = 0 z1 = hfg[p][0] z2 = hfg[p][1] for i1 in range(0,width): if incol == 1 and v[i1] >= 20 : #从空白区进入文字区 start1 = i1 #记录起始列分割点 incol = 0 elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #从文字区进入空白区 incol = 1 lfg[j1][0] = start1 - 2 #保存列分割位置 lfg[j1][1] = i1 + 2 l1 = start1 - 2 l2 = i1 + 2 j1 = j1 + 1
最后根据矩形的坐标将文本在图中框出来。附上完整代码。
import cv2 import numpy img = cv2.imread('D:/0.jpg',cv2.COLOR_BGR2GRAY) height, width = img.shape[:2] #print height, width #resized = cv2.resize(img, (2*width,2*height), interpolation=cv2.INTER_CUBIC) gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) (_, thresh) = cv2.threshold(gray, 140, 255, cv2.THRESH_BINARY) #使文字增长成块 kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2, 2))#形态学处理,定义矩形结构 closed = cv2.erode(thresh, None, iterations = 7) #cv2.imshow('erode',closed) height, width = closed.shape[:2] #print height, width z = [0]*height v = [0]*width hfg = [[0 for col in range(2)] for row in range(height)] lfg = [[0 for col in range(2)] for row in range(width)] box = [0,0,0,0] #水平投影 a = 0 emptyImage1 = numpy.zeros((height, width, 3), numpy.uint8) for y in range(0, height): for x in range(0, width): cp = closed[y,x] #if np.any(closed[y,x]): if cp == 0: a = a + 1 else : continue z[y] = a #print z[y] a = 0 #根据水平投影值选定行分割点 inline = 1 start = 0 j = 0 for i in range(0,height): if inline == 1 and z[i] >= 150 : #从空白区进入文字区 start = i #记录起始行分割点 #print i inline = 0 elif (i - start > 3) and z[i] < 150 and inline == 0 : #从文字区进入空白区 inline = 1 hfg[j][0] = start - 2 #保存行分割位置 hfg[j][1] = i + 2 j = j + 1 #对每一行垂直投影、分割 a = 0 for p in range(0, j): for x in range(0, width): for y in range(hfg[p][0], hfg[p][1]): cp1 = closed[y,x] if cp1 == 0: a = a + 1 else : continue v[x] = a #保存每一列像素值 a = 0 #print width #垂直分割点 incol = 1 start1 = 0 j1 = 0 z1 = hfg[p][0] z2 = hfg[p][1] for i1 in range(0,width): if incol == 1 and v[i1] >= 20 : #从空白区进入文字区 start1 = i1 #记录起始列分割点 incol = 0 elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #从文字区进入空白区 incol = 1 lfg[j1][0] = start1 - 2 #保存列分割位置 lfg[j1][1] = i1 + 2 l1 = start1 - 2 l2 = i1 + 2 j1 = j1 + 1 cv2.rectangle(img, (l1, z1), (l2, z2), (255,0,0), 2) cv2.imshow('result', img) cv2.waitKey(0)
代码中注释掉的一些代码,有的是我做的一些小变动,有的是观察中间值。大家可自行查看。
最后放上结果图。
由于文本的坐标已经有了,还可以把这些文本块截取下来,用一下PIL或者OPENCV就好了,此处就不做了。
以上这篇Python实现投影法分割图像示例(二)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
Python,投影法,分割,图像
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新日志
- 明达年度发烧碟MasterSuperiorAudiophile2021[DSF]
- 英文DJ 《致命的温柔》24K德国HD金碟DTS 2CD[WAV+分轨][1.7G]
- 张学友1997《不老的传说》宝丽金首版 [WAV+CUE][971M]
- 张韶涵2024 《不负韶华》开盘母带[低速原抓WAV+CUE][1.1G]
- lol全球总决赛lcs三号种子是谁 S14全球总决赛lcs三号种子队伍介绍
- lol全球总决赛lck三号种子是谁 S14全球总决赛lck三号种子队伍
- 群星.2005-三里屯音乐之男孩女孩的情人节【太合麦田】【WAV+CUE】
- 崔健.2005-给你一点颜色【东西音乐】【WAV+CUE】
- 南台湾小姑娘.1998-心爱,等一下【大旗】【WAV+CUE】
- 【新世纪】群星-美丽人生(CestLaVie)(6CD)[WAV+CUE]
- ProteanQuartet-Tempusomniavincit(2024)[24-WAV]
- SirEdwardElgarconductsElgar[FLAC+CUE]
- 田震《20世纪中华歌坛名人百集珍藏版》[WAV+CUE][1G]
- BEYOND《大地》24K金蝶限量编号[低速原抓WAV+CUE][986M]
- 陈奕迅《准备中 SACD》[日本限量版] [WAV+CUE][1.2G]