标题:关于筛选文本关键内容
只看楼主
woa
Rank: 1
等 级:新手上路
帖 子:159
专家分:0
注 册:2008-12-4
结帖率:85.37%
已结贴  问题点数:20 回复次数:5 
关于筛选文本关键内容

查找网页源码内的图片,歌曲之类的,现在可以用webbrowser读到源码,如何筛选出来!
搜索更多相关主题的帖子: 文本 筛选 关键 
2009-12-17 13:32
风吹过b
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:364
帖 子:4912
专家分:29900
注 册:2008-10-15
得分:20 
有二种方法:
一种方法是使用 HTML 对象.你去查一下这些对象的引用方法就可以了.列出所有的对象,然后过滤一下 链接的后缀就可以了.

Dim i As Long
With WebBrowser1.Document
        List1.Clear
        For i = 0 To .links.length - 1
             List1.AddItem .links(i)
        Next i
End With

第二种就是自己分析 HTML 源代码
凡是发现符合URL格式的字串,就取下来.
字串分解,按
 < 、 > 、 空格 分格的字串,然后再进行处理一下。


授人于鱼,不如授人于渔
早已停用QQ了
2009-12-17 14:51
woa
Rank: 1
等 级:新手上路
帖 子:159
专家分:0
注 册:2008-12-4
得分:0 
第二种方法具体函数是什么
2009-12-17 15:24
风吹过b
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:364
帖 子:4912
专家分:29900
注 册:2008-10-15
得分:0 
第二种方法,没有具体函数,自己分析 HTML 源文件,当做一个超长的字符串来处理就是了.

大概原理就是这样的.
图片,搜索 .jpg
音乐,搜索 .mp3 或其它后缀.

找到后,然后向前搜索 href=, 然后向后搜索 > 或 空格,
这中间部分就你所需要的部分.

一般建议用第一种方法

授人于鱼,不如授人于渔
早已停用QQ了
2009-12-17 16:55
woa
Rank: 1
等 级:新手上路
帖 子:159
专家分:0
注 册:2008-12-4
得分:0 
不好意思,我好像不知不觉学了第二种方法了。。

我先将 .jpg 用replace 替换成 .jpghttp://

然后又用
Dim stra As String, i As Long
Dim tArray() As String
stra = Text1.Text
tArray = Split(stra, "http://")
For i = 0 To UBound(tArray)
Open "1.txt" For Append As #1
Print #1, tArray(i)
Close #1
Next

分割,结果图片分割出独立成一行了
现在怎么帮图片再提取出来。。
2009-12-17 20:37
woa
Rank: 1
等 级:新手上路
帖 子:159
专家分:0
注 册:2008-12-4
得分:0 
不用replace,绕路了,发现直接可以mid筛选出来。。。。再去研究第一种方法去
2009-12-19 23:33



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-293768-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.602531 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved