标题:爬虫问题,无法获取audio 的 src
只看楼主
user_ppthon
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2018-3-10
 问题点数:0 回复次数:1 
爬虫问题,无法获取audio 的 src
我用python 3.6.4 抓取酷狗音乐的时候遇到无法解析的问题。代码如下:

import requests
from bs4 import BeautifulSoup
import bs4

def getHTMText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text        
    except:
        return ""   
            
def get_song_url(url):
    song_url = ""
    html = getHTMText(url)
    if(html):
       soup = BeautifulSoup(html,"html.parser")# 我换了解析器也不行
       song_url = soup.find(id="myAudio")
       if isinstance(song_url,bs4.element.Tag):
           print(type(song_url))
           print(song_url)
    else:
       return(song_url)

def main():
    url = "http://www.
   get_song_url(url)   
   
main()

'''
运行结果:
<class 'bs4.element.Tag'>
<audio class="music" id="myAudio" src="">
<!-- <p class="myAudiohide">你的浏览器不支持<code>audio</code>标签.</p> -->
</audio>

用开发者工具抓取audio tag的内容如下:
<audio class="music" id="myAudio" src="http://fs.w. preload="auto">
            <!-- <p class="myAudiohide">你的浏览器不支持<code>audio</code>标签.</p> -->
        </audio>

我想获取audio的src
'''
谢啦!
搜索更多相关主题的帖子: 获取 audio url html class 
2018-03-10 19:55
coolinglive
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2019-6-20
得分:0 
我是小白,在学习中,我现在也苦脑这个问题,百度无果,请问您这问题有解决吗?
2019-06-20 11:01



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-485144-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.260095 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved