软件工具是指为支持计算机软件的开发、维护、模拟、移植或管理而研制的程序系统。它是为专门目的而开发的,在软件工程范围内也就是为实现软件生存期中的各种处理活动(包括管理、开发和维护)的自动化和半自动化而开发的程序系统。电脑软件工具的种类繁多,软件工具分为六类:模拟工具、开发工具、测试和评估工具、运行和维护工具、性能质量工具和程序设计支持工具。
风越批量文本提取网页采集器是一款很实用的网页采集软件,可以批量提取HTML/DOC/RTF/TXT等文件中的文本信息。
功能特色
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。
支持从其它网站直接提取文本内容,生成所需数据库文件
支持GB2312/UTF-8多种编码
可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。
可设置提取文件的间隔,避免下载网页过快,服务器不响应
提供多种查找、获取信息的方式
提取文件中全部email邮件地址
提取文件中全部互联网址(无参数)
提取文件中全部互联网址(带参数)
提取HTML文件中body的文本内容
提取HTML文件中title与body的文本内容
提取HTML文件中textarea的文本内容
提取HTML网页的显示文本内容
提取DOC/RTF等文件中全部文本内容
提取DOC/RTF等文件中全部文本内容(自动分析标题)
并可自定义正则表达式获取信息
更新内容
增加提取种类
开发软件工具的最终目的是为了提高软件生产率和改善软件的质量。