关于python的正则匹配后输出中文的问题 - Python论坛

编程论坛 → 开发语言 → 『 Python论坛』 → 关于python的正则匹配后输出中文的问题

标题：关于python的正则匹配后输出中文的问题

只看楼主

cloud_baby

等　级：新手上路
帖　子：5
专家分：0
注　册：2010-4-1
结帖率：100%

楼主

已结贴√ 问题点数：0 回复次数：4

关于python的正则匹配后输出中文的问题

小弟初学python ，写了个小代码发现有问题请各位帮忙看看，代码如下：

# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a

输出结果：

['\xe4\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe5\xb9\x95123-12\xe4\xb8\x8a\xe7\x9a\x84\xe7\x9c\x8b\xe6\xb3\x95']
我想让他输出的是中文，我该怎么做呢？

搜索更多相关主题的帖子: 正则　中文　 python　输出　

2010-04-01 12:00

外部三电铃

来　自：那一年
等　级：贵宾
威　望：55
帖　子：2004
专家分：7306
注　册：2007-12-17

第 2 楼

得分:15

程序代码：

# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0]

注意最后一行，a是一个列表

那一年，苍井空还是处女

2010-04-01 12:17

外部三电铃

来　自：那一年
等　级：贵宾
威　望：55
帖　子：2004
专家分：7306
注　册：2007-12-17

第 3 楼

得分:5

如果python文件是utf-8编码的，程序应该这样写

程序代码：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import string
import re
data = u'<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0].encode("gb2312")

那一年，苍井空还是处女

2010-04-01 12:21

cloud_baby

等　级：新手上路
帖　子：5
专家分：0
注　册：2010-4-1

第 4 楼

得分:0

回复 2楼外部三电铃

非常感谢，用a[0]就解决了！

2010-04-01 12:51

a515200

等　级：论坛游民
威　望：1
帖　子：18
专家分：94
注　册：2010-7-11

第 5 楼

得分:0

可以这样

for i in re.findall(('<td valign="top" class="black">(.*?)</td>',re.U),'<td valign="top" class="black">中文字幕123-12上的看法</td>',re.U):
print i

[ 本帖最后由 a515200 于 2010-9-12 23:54 编辑 ]

2010-09-12 23:46

参与讨论请移步原网站贴子：https://bbs.bccn.net/thread-301278-1-1.html