pd.read_html爬取网页特殊汉字问题 - Python论坛 - 编程论坛档案馆

编程论坛 → 开发语言 → 『 Python论坛』 → pd.read_html爬取网页特殊汉字问题

标题：pd.read_html爬取网页特殊汉字问题

只看楼主

contentzhh

帅哥哟，离线，有人找我吗？

Rank: 1

等　级：新手上路
帖　子：3
专家分：0
注　册：2020-7-12

问题点数：0 回复次数：2

pd.read_html爬取网页特殊汉字问题

url2="http://data.,2020-01-03,000018.html"
tb = pd.read_html(url2)[1]
tb1=pd.read_html(url2)[2]

爬取数据时遇 “光大证券股份有限公司佛山顺德北滘证券营业部”中的特殊汉字 “滘” 中断，那位高手帮忙解决一下

搜索更多相关主题的帖子: 网页　数据　中断　汉字　有限公司　

发帖时间

2020-07-12 17:06

contentzhh

帅哥哟，离线，有人找我吗？

Rank: 1

等　级：新手上路
帖　子：3
专家分：0
注　册：2020-7-12

得分:0

回复楼主 contentzhh

自己解决了tb = pd.read_html(url2,encoding="gb18030")[1]

发帖时间

2020-07-14 14:18

sssooosss

帅哥哟，离线，有人找我吗？

Rank: 9

Rank: 9

Rank: 9

等　级：禁止访问
威　望：3
帖　子：664
专家分：1115
注　册：2019-8-27

得分:0

厉害，自己解决的问题印象更深刻

发帖时间

2020-07-20 08:46

参与讨论请移步原网站贴子：https://bbs.bccn.net/thread-502499-1-1.html

关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有，并保留所有权利。

Powered by Discuz, Processed in 0.363406 second(s), 8 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved