标题:求助: 网页源码下载、整理综合问题
只看楼主
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
结帖率:97.22%
已结贴  问题点数:20 回复次数:9 
求助: 网页源码下载、整理综合问题
一些编程技术BBS的文章,必需登入后,才能复制程序代码。。。
于是,就想到了,下载网页源码,来获取文章中的程序代码。。。

可是,我水平太有限。
只会使用String^->Substring()和String^->Replace()俩个函数来整理下载的源代码。
然后,保存为txt文本文件。

文本文件,很不方便。。。。
1,文本文件,没有了插图。
2,文本文件,每一行就是文章一段落,一段没结束文本文档,不会自动换行。
3,网页编程技术文章,“程序代码”部分,都有行号和底纹颜色,哪些是“程序代码”部分一目了然。。。。。



所以,如何解决这3个问题。
最好,使用Word2007,加入插图,
Word,可以自动换行。
“程序代码”部分添加行号和底纹颜色



这只是初步想,如何实际,一窍不通。。。。。
还要麻烦大家。。。。。。。。

下载的源码文件
下载源码.txt (151.51 KB)



整理后的源码文件
整理源码.txt (7.64 KB)






[此贴子已经被作者于2023-3-27 18:05编辑过]

搜索更多相关主题的帖子: 文本文件 代码 网页 源码 文章 
2023-03-27 16:28
wp231957
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:神界
等 级:版主
威 望:422
帖 子:13681
专家分:53296
注 册:2012-10-18
得分:14 
有些东西根本就不在源码里 哦

DO IT YOURSELF !
2023-03-29 16:56
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
得分:0 
回复 2楼 wp231957
傻子都知道,这只是一种文本格式。。。
不是,文本的内容。。。。
为什么要使用Word,不就是看Word可以支持很多种文本格式吗???


我只 人工使用Word添加页面背景色。
不会使用程序代码添加页面背景色。

如何,添加行号。就更不会了。。。。。
2023-03-30 04:07
wp231957
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:神界
等 级:版主
威 望:422
帖 子:13681
专家分:53296
注 册:2012-10-18
得分:0 
回复 3楼 追梦人zmrghy
你连代码从哪里下载都不知道,就研究如何修饰,不觉得没意义吗

DO IT YOURSELF !
2023-03-30 06:20
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
得分:0 
回复 4楼 wp231957
开始 <div id=\"content_views\" class=\"htmledit_views\">
结束 <div id=\"treeSkill\">

源码开始 <pre><code>
源码结束</code></pre>


大同小异,差不多。
太低能的问题。。。。。



能不能讲些,小学生的问题,不要总是讲幼儿园(学前班)的问题。。。

[此贴子已经被作者于2023-3-30 12:58编辑过]

2023-03-30 12:42
wp231957
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:神界
等 级:版主
威 望:422
帖 子:13681
专家分:53296
注 册:2012-10-18
得分:0 
回复 5楼 追梦人zmrghy
bbs需要登录,这就需要一个账号密码,登录方式或带cookie登录,或用无头浏览器
只有你能拿到目标资料,才能继续进行下一步的研究

DO IT YOURSELF !
2023-03-30 13:43
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
得分:0 
回复 6楼 wp231957
我问的是,如何使用程序代码设置Word文档格式。(添加页面底纹色,和行号)。。。。。
代码已经可以整理成txt文本文件了。。。
你还说,不知道程序代码,从哪里下载的。。。。


如果不是BBS就是博客。
反正,不登入,就不让复制程序代码。
可以,从网页源码中读出来。。。。
但文本格式,想做到像网页那样,程序代码一目了然,太难了。

我除了BBS和BLOGS也不看其它的,编程技术文章。。。。

[此贴子已经被作者于2023-3-30 14:06编辑过]

2023-03-30 13:59
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
得分:0 
回复 6楼 wp231957
Accept: */*
Accept-Encoding: identity;q=1, *;q=0
Accept-Language: zh-CN,zh;q=0.9
Connection: keep-alive
Host: v26-web.
Range: bytes=0-
Referer: https://v26-web.
Sec-Fetch-Dest: video
Sec-Fetch-Mode: no-cors
Sec-Fetch-Site: same-origin
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36


就是找不到cookie:
2023-03-30 14:09
wp231957
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:神界
等 级:版主
威 望:422
帖 子:13681
专家分:53296
注 册:2012-10-18
得分:0 
回复 7楼 追梦人zmrghy
不考虑python吗    我感觉c 写这些东西  有些弱

DO IT YOURSELF !
2023-03-30 14:53
追梦人zmrghy
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:399
专家分:190
注 册:2021-4-9
得分:0 
回复 9楼 wp231957
python学了几天了,
感觉,太别扭。
没有{},
多一个空格就出错,
少一个空格也出错。。。
2023-03-30 20:55



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-511696-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.371790 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved