标题:想编个指定网页自动保存的工具,我应该学些什么东西?
只看楼主
随风而行lulu
Rank: 2
等 级:论坛游民
帖 子:59
专家分:60
注 册:2014-9-6
结帖率:50%
已结贴  问题点数:50 回复次数:4 
想编个指定网页自动保存的工具,我应该学些什么东西?
学编程的目的就是编一些小工具,实现自动、批量的操作,不用来找工作。
大致就是这方面的,采集网页上的资料,比如豆瓣网某个人的某个相册,豆瓣电影某部电影的剧照,下载某个blog中的某个栏目。

我想象中的软件界面是这个样子的,类似一个浏览器,里面有地址栏,同时有各种参数的输入框/参数列表选择。

现在还在学C,比较迷茫接下来还要学什么,才可以写软件?
搜索更多相关主题的帖子: 找工作 学什么 学编程 地址栏 浏览器 
2014-09-29 00:18
wp231957
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
来 自:神界
等 级:版主
威 望:422
帖 子:13681
专家分:53296
注 册:2012-10-18
得分:25 
关注中。。。。。。

DO IT YOURSELF !
2014-09-29 09:03
fragileeye
Rank: 5Rank: 5
等 级:职业侠客
威 望:2
帖 子:107
专家分:387
注 册:2011-5-21
得分:25 
你说的就是爬虫啊,你用C API也可以来做,不过比较费时间。
用python啊。
urllib库,分分钟拿下。
2014-09-29 20:24
随风而行lulu
Rank: 2
等 级:论坛游民
帖 子:59
专家分:60
注 册:2014-9-6
得分:0 
回复 3 楼 fragileeye
你好!urllib库可以实现这么复杂的操作吗?还需不需要别的什么库?
应该是爬虫吧,我也不知道。
参数是在软件界面由用户临时输入的。
可以保存当前进度,不重复保存。
至于GUI库,听说wxPython和PyQt,还不清楚哪个更适合我。

拿当前的python论坛来说吧,保存回复数超过5的帖子,以及某个作者发表的帖子。
这个用肉眼观察很好识别,然后加上N次循环的重复的动作,不停的下一页和另存为、确定等等。
我不追求太高的效率,像按键精灵那样的本办法都可以接受,不过像按键精灵那种直接霸占一台电脑,太奢侈了。
2014-10-01 23:53
随风而行lulu
Rank: 2
等 级:论坛游民
帖 子:59
专家分:60
注 册:2014-9-6
得分:0 
回复 2 楼 wp231957
谢谢!
2014-10-01 23:53



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-436720-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.021100 second(s), 8 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved