标题:怎样用C#截取网页的某一块的文字?(已解决)
只看楼主
chenjin145
Rank: 1
等 级:禁止访问
帖 子:3922
专家分:0
注 册:2006-7-12
得分:0 
竊取 订阅运势 下一页之間就行了

[url=javascript:alert(1);] [div]fdgfdgfdg\" on\"[/div] [/url]
2006-08-23 13:53
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
得分:0 
恩,谢谢
2006-08-23 13:57
№→傻魚兒
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2006-8-30
得分:0 
以下是引用live41在2006-8-23 13:30:24的发言:

string firstPage = "http://www.go108.com.cn/go108_daystar.php?starname=7";
//string secondPage = "http://www.go108.com.cn/go108_daystar.php?starname=7&page=2";

try
{
WebClient astoWebClient = new WebClient();

//获取或设置用于对向Internet资源的请求进行身份验证的网络凭据。
astoWebClient.Credentials = CredentialCache.DefaultCredentials;

Byte[] pageData = astoWebClient.DownloadData(firstPage);//从指定网站下载数据

string pageHtml = Encoding.Default.GetString(pageData); //获取的网站页面采用的是GB2312格式
//string pageHtml = Encoding.UTF8.GetString(pageData); //获取的网站页面采用的是UTF-8格式

pageHtml = pageHtml.Trim(); //先去掉头部多余的空格

int m = pageHtml.IndexOf("订阅运势"); //找出"订阅运势"的位置
string pageText = pageHtml.Remove(0, m+18); //删除"订阅位置"以上的html文本

int n = pageText.IndexOf("下一页"); //找出"下一页"的位置
string keyText = pageText.Remove(n-86); //删除"下一页"以下的html文本

//利用Split方法把关键html文本分开成字符串数组
string[] strs = keyText.Split(new char[] { '<', '>' }); //char spliter[] = { '<', '>' };
for(int i = 0; i<strs.Length; i++)
{
//MessageBox.Show(strs[i]);

if(strs[i]==" ") //删除<br> <span class='STYLE4'>之间多余的空格
continue;

if(strs[i].IndexOf("br") > -1) //遇到br就换行
{
richTextBox1.AppendText("\n");
}
else
{
if(strs[i].IndexOf("span") > -1) //遇到span不处理
{
}
else
{
richTextBox1.AppendText(strs[i]); //输出关键的文本
}
}
}

/*
using(StreamWriter sw = new StreamWriter("f:\\ouput.html")) //将获取的内容写入文本
{
sw.Write(pageHtml);
}
*/
}
catch(WebException webEx)
{
MessageBox.Show(webEx.ToString());
}



大哥,你能否写一下,引用了些什么类...


死亡并不可怕,可怕的是我们在死亡面前轻易就放弃自己..博客地址:http://haijiang.
2006-08-30 17:15
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
得分:0 
我把代码传了上来,是.net 2003的
2006-09-02 15:50
大漠小鸟
Rank: 1
等 级:新手上路
帖 子:12
专家分:0
注 册:2006-9-3
得分:0 
拜托...
c斑竹的繁体字看起来好累...
2006-09-03 20:32



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-85309-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.077281 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved