出版时间:2002-7 出版社:电子工业出版社 作者:美 Heaton J. 页数:420 字数:700000
Tag标签:无
内容概要
这是一本研究如何实现具有Web访问能力的网络机器人的书。该书从Internet编程的基本原理出发,深入浅出、循序渐进地阐述了网络机器人程序Spider、Bot、Aggregator的实现技术,并分析了每种程序的优点及适用场合。本书提供了大量的有效源代码,并对这些代码进行了详细的分析。通过本书的介绍,你可以很方便地利用这些技术,设计并实现网络蜘蛛或网络信息搜索器等机器人程序。
读者对象:适合于具有一定Java编程基础的软件开发人员阅读,也可供Web开发人员作为技术参考资料使用。
书籍目录
目 录
第1章 Java套接字编程技术
套接字家族
网络编程
Java I/O编程技术
代理的问题
Java中的套接字编程
客户端套接字
服务器套接字
小结
第2章 分析超文本传输协议
地址格式
使用套接字进行HTTP编程
Bot包的HTTP类组
实现细节
小结
第3章 通过HTTPS访问加密站点
HTTP与HTTPS
通过Java使用HTTPS
HTTP用户认证
安全访问
实现细节
小结
第4章 解析HTML
使用HTML
Bot关心的标签
需要特殊处理的HTML
使用Bot类解析HTML
使用Swing类解析HTML
Bot包HTML解析例子
实现细节
小结
第5章 发送表单
使用表单
用于普通发送的Bot类
实现细节
小结
第6章 解释数据
CSV文件的结构
QIF文件的结构
XML文件格式
小结
第7章 探索Cookie
分析Cookie
用于Cookie处理的Bot类
实现细节
小结
第8章 编写Spider程序
网站的结构
Spider程序的结构
构造Spider程序
小结
第9章 编写大型Spider程序
多线程
用Java实现多线程
线程同步
使用数据库
高性能的Spider程序
实现细节
小结
第10章 编写Bot程序
构造典型的Bot程序
使用CatBot程序
CatBot实例
实现细节
小结
第11章 编写Aggregator程序
在线汇总与离线汇总
构造底层Bot
构造气象Aggregator程序
小结
第12章 负责任地使用Bot程序
与网站协商
Web站点管理员的措施
负责任的Spider程序
实现细节
小结
第13章 Bot程序的未来
Internet信息的传送
理解XML
传送XML数据
Bot和SOAP
小结
附录A Bot包
附录B 各种与HTTP相关的字符
附录C 故障诊断
附录D 安装Tomcat系统
附录E 在Windows下编译实例
附录F 在Unix下编译实例
附录G 重新编译Bot包
术语表
图书封面
图书标签Tags
无
评论、评分、阅读与下载