求助大神关于python爬虫的问题
刚学python,不太会爬虫,现在想要爬取古诗文网的古诗的标题和正文,希望大佬帮忙看一下,跪谢
程序代码:import requests
import re
from bs4 import BeautifulSoup
rex1=(r'\(.*?\)')
for i in range(1):
url='http://www.'+str(i+1)
web_data = requests.get(url)
soup=BeautifulSoup(web_data.text,'lxml')
context=soup.select('div[class="main3"]')[0].select('div[class="typeleft"]')[0].select('div[class="sons"]')
title=context[0].select('strong')[0].text
print(title)这个是想要爬取标题的,但是只能抓到乱码,如图
然后网站是这样的
如果我想爬取这个正文的画应该怎么写代码呢?
跪谢!!!!
[此贴子已经被作者于2019-12-26 22:58编辑过]




