标题:python2.7 爬虫中urllib.urlretrieve()下载文件路径问题
只看楼主
廉价的咖啡
Rank: 2
来 自:湖北 荆门
等 级:论坛游民
威 望:2
帖 子:53
专家分:17
注 册:2014-10-9
结帖率:72.73%
已结贴  问题点数:30 回复次数:2 
python2.7 爬虫中urllib.urlretrieve()下载文件路径问题
各位朋友你们好!在下是一名热爱python的小白,在爬虫中遇到了将图片指定存储文件夹所出现无法下载的问题。
源代码如下:
#coding=utf-8
import urllib
import re

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = (reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'c:\\xixi.jpg',%x)
        x+=1

html = getHtml("http://tieba.baidu.com/p/2460150866")
print getImg(html)

这是一个简单的爬虫程序,在这里我使用了urllib.urlretrieve()函数对远程图片进行下载, 使用urllib.urlretrieve(imgurl,'%s.jpg' % x)时,能够成功将图片下载到桌面中,我想下载到c:\\xixi文件夹下,当我使用了urllib.urlretrieve(imgurl,'c:\\xixi.jpg',%x)时,却无法使用,出现的问题有invalid syntax或者是程序在python shell能够运行但在界面中出现三个'>>>'就不动了,再开文件及中,却没有任何东西。

求各位朋友能帮帮我,这个问题困扰了我几天了,拜托各位了

搜索更多相关主题的帖子: 下载文件 源代码 python return 文件夹 
2016-09-30 23:27
Valenciax
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:11
帖 子:337
专家分:2462
注 册:2016-5-15
得分:30 
urllib.urlretrieve(imgurl,'c:\\xixi.jpg',%x)
改作
urllib.urlretrieve(imgurl,'c:\\'+ str(x)+'.jpg')
2016-10-01 07:47
廉价的咖啡
Rank: 2
来 自:湖北 荆门
等 级:论坛游民
威 望:2
帖 子:53
专家分:17
注 册:2014-10-9
得分:0 
回复 2楼 Valenciax
谢谢你的帮助,经过多次的尝试,我发现python真的对大小写挺敏感的,之前的图片的爬虫,在保存地址上面,当写道 urllib.urlretrieve(imgurl,'C:\xixi\%s.jpg' % x)会出现错误,但是经过发现,系统对‘\’后面接小写字母比较敏感,当换成urllib.urlretrieve(imgurl,'C:\XIXI\%s.jpg' % x),小写换成大写就能够成功

就在这一刻,你的对手依旧不停的翻动书页。
2016-10-01 19:29



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-469369-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.768809 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved