标题:关于python的正则匹配后 输出 中文的问题
只看楼主
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
结帖率:100%
已结贴  问题点数:0 回复次数:4 
关于python的正则匹配后 输出 中文的问题
小弟初学python  ,  写了个小代码发现有问题 请各位帮忙看看,代码如下:

# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a


输出结果:

['\xe4\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe5\xb9\x95123-12\xe4\xb8\x8a\xe7\x9a\x84\xe7\x9c\x8b\xe6\xb3\x95']
我想让他输出的是中文, 我该怎么做呢?
搜索更多相关主题的帖子: 正则 中文 python 输出 
2010-04-01 12:00
外部三电铃
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:那一年
等 级:贵宾
威 望:55
帖 子:2004
专家分:7306
注 册:2007-12-17
得分:15 
程序代码:
# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0]

注意最后一行,a是一个列表

那一年,苍井空还是处女
2010-04-01 12:17
外部三电铃
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:那一年
等 级:贵宾
威 望:55
帖 子:2004
专家分:7306
注 册:2007-12-17
得分:5 
如果python文件是utf-8编码的,程序应该这样写

程序代码:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import string
import re
data = u'<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0].encode("gb2312")


那一年,苍井空还是处女
2010-04-01 12:21
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
得分:0 
回复 2楼 外部三电铃
非常感谢, 用a[0]就解决了!
2010-04-01 12:51
a515200
Rank: 2
等 级:论坛游民
威 望:1
帖 子:18
专家分:94
注 册:2010-7-11
得分:0 
可以这样


for i in re.findall(('<td valign="top" class="black">(.*?)</td>',re.U),'<td valign="top" class="black">中文字幕123-12上的看法</td>',re.U):
   print i



[ 本帖最后由 a515200 于 2010-9-12 23:54 编辑 ]
2010-09-12 23:46



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-301278-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 1.162920 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved