标题:抓取page时遇到的javascript问题
只看楼主
panghaoyu
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2013-9-1
结帖率:0
已结贴  问题点数:20 回复次数:2 
抓取page时遇到的javascript问题
大家好,

我在使用工具抓取网页时遇到了问题:

我要抓取的网页中包含下面的代码片段

<div class="jsmenu" id="searchmenu">
    <ul>
      <li id="1_1" class="">
        <a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>
      </li>
      <li id ="1_2" class="active">
        <a href="javascript:ChangeTab('normol',2);SubmitTab('','SCAB','normol','',2);" title="BBB">standar</a>
      </li>
      <li id="1_3" class ="">
        <a href="javascript:ChangeTab('special',3);SubmitTab('','SCAB','special','',3);" title="CCC">special</a>
      </li>
    </ul>

... ... ....


我尝试了很多工具,诸如 TeleportUltra 、Offline_Explorer_Enterprise 等 都无法下载

<a href="javascript:ChangeTab 。。。 对应的链接页面,这些工具似乎都不会 解析 <a href="javascript:ChangeTab 的内容

不能打开并下载这些页面。还有其他什么工具可以用吗,或者编程的思路也行。

希望大家能指点指点我,先谢谢各位了。

另外,我的目标是 抓取  http URL 对应页面的所有内容,包括 css,js,images等,还要 上面提到的 <a href="javascript:ChangeTab

里面的内容,也就是整个页面的镜像 ,full page
搜索更多相关主题的帖子: javascript search active title 网页 
2013-09-02 00:05
诸葛修勤
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:11
帖 子:549
专家分:1955
注 册:2010-10-28
得分:10 
不能下载 也可以保存一份 不就可以了?  随便开启浏览器的调试都可以获取到这些资源通过访问
2013-09-03 01:05
月暗
Rank: 2
来 自:湖北黄冈
等 级:论坛游民
帖 子:17
专家分:81
注 册:2012-11-3
得分:10 
javascript是客户端运行的,

 <a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>这个连接会执行函数ChangeTab('quick',1)和SubmitTab('','SCAB','quick','',1);

要跳转的话大概在js代码里面有句window.location.href="xxx"。就跳转到xxx页面去了,你可以找下目标页面。

听说有个大婶叫舔罩,那些求大神的人,求的是她么?
\u6f
2013-09-04 21:01



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-419953-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.016994 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved