标题:如何爬取对应信息?
只看楼主
likepy
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2018-11-13
 问题点数:0 回复次数:1 
如何爬取对应信息?
                            <dl>
                    <dt>
                        <a href="http://college. target="_blank"><img src="http://college. onerror="this.src='http://college.'" width="63" height="63" alt="上海市广播电视大学" /></a><strong title="上海市广播电视大学" class="blue"><a href="http://college. target="_blank">上海市广播电</a></strong>                    </dt>
                    <dd>
                        <div class="right">
                            <p><a class="org" href="javascript:void(0);" onclick="javascript:setpk('617','上海市广播电视大学');">+高校对比</a></p>
                            <p class="topMargin20"><a class="btn_gary" href="http://college. target="_blank">进入主页</a></p>
                        </div>
                        <ul>
                            <li>高校所在地:上海</li>
                            <li>院校特色:——</li>
                            <li>高校类型:语言</li>
                            <li>高校隶属:——</li>
                            <li>高校性质:其它</li>
                            <li>学校网址:——</li>
                        </ul>
                    </dd>
                </dl>


问:如何爬取对应的‘上海市广播电视大学’,这个名词?
names = soup.find_all('p',class_ = "onclick")
for name in names:
    print (name.get_text())
这个为什么爬取不了?
搜索更多相关主题的帖子: href http com 上海 class 
2018-11-13 21:19
likepy
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2018-11-13
得分:0 
使用Xpath
具体可以搜索知乎相关的
爬虫入门到精通-网页的解析(xpath),推荐
2018-11-14 21:17



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-491236-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.502534 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved