标题:有大佬了解过“速卖通”网站的反爬机制吗?
只看楼主
bin376240554
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2019-8-14
 问题点数:0 回复次数:3 
有大佬了解过“速卖通”网站的反爬机制吗?
程序代码:
import requests
from lxml import extree

url = 'https://www.'

headers = {'User-Agent': 'Mizilla/5.0}

html_text = requests.get(url=url, headers=headers).text
html = extree.HTML(html_text)
print(html)


这里只能获取部分网页内容,哪位大佬了解速卖通的反爬机制
搜索更多相关主题的帖子: 网站 机制 import url html 
2019-08-26 16:16
bakchoi
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2019-9-2
得分:0 
这个貌似需要先模拟登陆?
2019-09-02 14:17
南山剑客
Rank: 2
等 级:论坛游民
威 望:4
帖 子:51
专家分:60
注 册:2019-8-6
得分:0 
javascript生成的内容,requests库爬不到,得用selenium库

我傻我快乐 仗剑走天涯
2019-09-02 14:26
南山剑客
Rank: 2
等 级:论坛游民
威 望:4
帖 子:51
专家分:60
注 册:2019-8-6
得分:0 
https://selenium-python.

我傻我快乐 仗剑走天涯
2019-09-02 14:27



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-496574-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.293608 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved