python3.4爬虫demo

脚本专栏 2024/11/6 佚名

3 2 1

圆月山庄资源网 Design By www.vgjia.com

python 3.4 所写爬虫

仅仅是个demo，以百度图片首页图片为例。能跑出图片上的图片；

使用 eclipse pydev 编写：

from SpiderSimple.HtmLHelper import *
import imp
import sys
imp.reload(sys) 
#sys.setdefaultencoding('utf-8')  
html = getHtml('http://image.baidu.com/')
try:
  getImage(html)
  exit()
except Exception as e:
  print(e)

HtmlHelper.py文件

上面的 SpiderSimple是自定义的包名

from urllib.request import urlopen,urlretrieve
#正则库
import re
#打开网页
def getHtml(url):
  page = urlopen(url)        
  html = page.read()
  return html
#用正则爬里面的图片地址  
def getImage(Html):
  try:
    #reg = r'src="/UploadFiles/2021-04-08/(.+">

要注意个大问题，python 默认编码的问题。
有可能报UnicodeDecodeError: 'ascii' codec can't decode byte 0x"htmlcode">

echo off
set PYTHONIOENCODING=utf8
python -u %1


然后重启电脑。
总结
以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对的支持。如果你想了解更多相关内容请查看下面相关链接


                                
                                    python爬虫demo,python3.4爬虫demo 
                                
                                    标签：
                                        python爬虫demo,python3.4爬虫demo
                                     

                                圆月山庄资源网 Design By www.vgjia.com


                        
                            
                                广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）

                                免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！
                                如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com
                            
                        
                        
                            
                                
                                    上一篇
                                    python 通过类中一个方法获取另一个方法变量的实例
                                
                            
                            
                                
                                    下一篇
                                    对Python 获取类的成员变量及临时变量的方法详解
                                
                            
                        
                        
                        圆月山庄资源网 Design By www.vgjia.com
                        
                            
                                
                                
                                    评论“python3.4爬虫demo”
                                
                            
                            
                                
                                    
                                        
                                            
                                                
                                                    
                                                
                                                
                                                    
                                                
                                                
                                                    
                                                    
                                                    
                                                
                                                
                                                     再想想
                                                    
                                                    
                                                    
                                                    
                                                    
                                                
                                            
                                            
                                        
                                    
                                    
                                    
                                        暂无评论...


                    
                        
                            
                                
                                    
                                        
                                    
                                    
                                        
                                            
                                        
                                    
                                
                                
                                    www.vgjia.com
                                            
                                                圆月山庄资源网 
                                    
                                    
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                    
                                    
                                    
                                        
                                            139,976互联网资源
                                        
                                        
                                            144,792高清电影
                                        
                                        
                                            21,817无损音乐
                                        
                                        
                                            631,128技术资源
                                        
                                    
                                
                            
                            
                                最新文章
                                
                                    
                                         
                                       
                                            
                                                
                                            
                                            
                                                
                                                    转载一个别人收藏的精典网站Ruby,HIBERNATE
                                                
                                                
                                                    
                                                        2024/11/6
                                                        
                                                         56
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    可与Spreadsheets媲美的在线表格系统:EditG
                                                
                                                
                                                    
                                                        2024/11/6
                                                        
                                                         34
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    cygwin使用心得
                                                
                                                
                                                    
                                                        2024/11/6
                                                        
                                                         73
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    脚本的DVD开发
                                                
                                                
                                                    
                                                        2024/11/6
                                                        
                                                         28
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    局域网设置自动配置脚本文件的写法与用途
                                                
                                                
                                                    
                                                        2024/11/6
                                                        
                                                         15


            
            
                
                    
                        
                            更新日志
                        
                        
                            
                                
                                    2024年11月06日
                                
                                                    
                        
 
                            群星《梦境草原》汽车专用测试碟【WAV+CUE】
 
                            【绝版天碟】阿格丽奇《柴科夫斯基-第一钢琴协奏曲》1982[WAV]
 
                            HIFI劲爆慢摇-群星《路虎在路上2CD》WAV
 
                            谭咏麟《第一滴泪》蜚声环球系列限量版[低速原抓WAV+CUE]
 
                            孙露 《声色扰人》索尼蓝光BSCD版[低速原抓WAV+CUE][1.1G]

                        
                    
                    
                        2024年11月06日
                    
                    
                        
 
                            雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
 
                            罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
 
                            草蜢.1993-宝贝对不起（国）【宝丽金】【WAV+CUE】
 
                            杨培安.2009-抒·情（EP）【擎天娱乐】【WAV+CUE】
 
                            周慧敏《EndlessDream》[WAV+CUE]
 
                            彭芳《纯色角3》2007[WAV+CUE]
 
                            江志丰2008-今生为你[豪记][WAV+CUE]
 
                            罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
 
                            群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
 
                            群星《网易云英文歌曲播放量TOP100》[MP3][1G]
 
                            方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
 
                            李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
 
                            王大文.2019-国际太空站【环球】【FLAC分轨】
 
                            群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
 
                            童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]

                        
                    
                            
                        
                    
                
            
            
                
                    友情链接 
                
                    
                        杰晶网络
                        DDR爱好者之家
                        桃源资源网
                        杰网资源
                        富贵资源网
                        南强小屋
                        铁雪资源网
                        幽灵资源网
                        万梅资源网
                        狼山资源网
                        白云岛资源网
                        昆仑资源网
                        相思资源网
                        明霞山资源网
                        内蒙古资源网
                        黑松山资源网
                        茶园资源网
                        饿虎岗资源网
                        大旗谷资源网
                        常春岛资源网
                        岱庙资源网
                        兴国资源网
                        快活林资源网
                        蝙蝠岛资源网
                        帝王谷资源网
                        白云城资源网
                        伏龙阁资源网
                        清风细雨楼
                        天枫庄资源网
                        圆月山庄资源网
                        无争山庄资源网
                        神水资源网
                        移花宫资源网
                        神剑山庄资源网
                        无为清净楼资源网
                        金钱帮资源网
                        丐帮资源网
                        华山资源网
                        极乐门资源网
                        小李飞刀资源网
                        凤求凰客栈
                        风云阁资源网
                        金狮镖局
                        鸳鸯亭资源网
                        千金楼资源网
                        更多链接
                    
                
            
            
                
                    
                        
                    
                    
                        
                    
                
                
                    
                        Copyright © 2006~2023
                        圆月山庄资源网   Design by www.vgjia.com  手机版