千岛湖森林氧吧好吗:用BAT批处理能处理文本内容吗?

来源:百度文库 编辑:中科新闻网 时间:2024/05/10 05:40:16
这是要处理的内容:
<td align="center"><h1>您查询的IP:61.149.140.39</h1></td>
<td align="center"><ul class="ul1"><li>查询结果1:北京市 网通</li><li>查询结果2:北京市通州区 /海淀区网通ADSL</li></ul></td>

------请问用批处理怎么将上面的内容简化成这样:
您查询的IP:61.149.140.39
查询结果1:北京市 网通
查询结果2:北京市通州区 /海淀区网通ADSL

-------要求一定要用批处理来解决,其实的我的就是要把HTM代码去
要求一定要用批处理来解决,其实我的意思就是要把内容里htm代码去掉

我建议你使用命令行版的html2txt类工具,这要简单得多。
如果一定要使用脚本,也可以借助sed/gawk这些第三方工具大大简化脚本。
如果无法使用第三方工具,则可以试用以下批处理脚本,它要求所处理的HTML内容是固定的格式,也即标签数目不变。在WinXP CMD中测试通过。

-------------------------------------------------------------
:: cutTag.cmd - cut HTML tag in HTML tags
:: Will Sort - 2006-05-19 - CMD@WinXP
:: 测试数据文件 ipdata.htm,运行结果文件 ipdata.txt
:: 测试数据ipdata.htm内容:
:: <td align="center"><h1>您查询的IP:61.149.140.39</h1></td>
:: <td align="center"><ul class="ul1"><li>查询结果1:北京市 网通</li><li>查询结果2:北京市通州区 /海淀区网通ADSL</li></ul></td>
@echo off & setlocal EnableDelayedExpansion
for /f "delims=<> tokens=1,2,3,4,5,6,7,*" %%a in (ipdata.htm) do (
if "!l1!"=="" (set l1=%%c) else (set l2=%%d&&set l3=%%g)
)
for %%e in ("!l1!" "!l2!" "!l3!") do echo %%~e >>ipdata.txt
-------------------------------------------------------------

你想用在那?用VBSCRIPT还差不多.

你想用在那?用VBSCRIPT还差不多.

你想用在那?用VBSCRIPT还差不多.

可以写一个小程序来解决啊。 用java可以吗? 如果行,我做一个给你用 :)

<style type=text/css>.baidu{font-size:14px;line-height:1.5;}a{color:#0000cc;}
a.t{color: #006633;font-size:14px;text-decoration:none;}a.cn {color:#555555;}</style>
<script language="JavaScript" type="text/JavaScript" src="http://zhidao.baidu.com/q?ct=18&cid=65536&tn=fcuqlall&lm=4&rn=10"></script>