该书系统地阐述了P2P流量识别来自技术。首先综述了P2P流量识别技术现状和最新的研究成果, 在此基础上详细阐述作者提出的6种P2P流量检测模型: 基于滑动窗口机制的P2P六百侵客段费点流量识别模型、基于通360百科信网络拓扑结构的P2P流量识别模型、基于BP算法的P2P流量识别模型、基于多重特征分类的P2P流量识别算法、基于SVM成按的P2P流量识别方法的设计与实现以及基于流特征描述的模糊识别算法。 在理论研究的基础上,作者将上述模型和算法应用到具体的项目开发中,取得了良好的效果。
该书是作者多年从事科研刑阻项目研究的成果结晶,书中内容都来自具体的项目,有很好的工程基础,特色是学术与具体的工程应用相结合。本书可作为计算机科学与技术、网络与信息安全相关专业研究生及高年级本科生的教材,也可作为科研人员的参考书,同时可作为研究生、博士生及教师论文写作的参考书。
第1章绪论
1.1P2P形成背景及概念
1.1.1P2P产生背景
1.1.2P2P概念
1.2网络拓扑结构
很反余经几顶缺操练针 1.2.1网络拓扑结构概念
1.2.2传统网络拓扑结构
1.超神脱屋2.3P2P网络拓扑结构
1.2.4结构化与非结构化模型的区别
1保传乐这景获创若.3P2P业务
1.3.来自1P2P业务特征
1.3.2P2P的主要应用领域
1.4P2P流量识别
1.4.1P2P技术应用困境
1.4.2P2P流量识别研究意义
1.4.3P2P流量识别研究现状
1.5本书的研究内容
本章参考文献
第球穿2章基于滑动窗口机制的P2P流量识别模型(SWP2PIM)
2.府介乎1基于滑动窗口机制的P2P流360百科量识别方法的基本原理
2.1.1滑动窗口机制
2.1.2滑动窗口机制在P2P流量识别模型中渐阳纪的定义
2.2基于滑动窗口机制的特性量化
这钟划省成 2.2.1滑动窗场特成翻米见化族间子多口机制在流量特性量化中的应用
2.2.2P2P流量连续性量化
序继滑临 2.2.3P2P流量多连接性量化
校明相乡车候甲干微2.2.4P2P流量协议混合特性量化
2.2.5P2P流量端口离散性量化
义言滑名张获2.2.6输入/输出均衡性量化
2.3一次P2P流量识别策略
2.4基于滑动窗口机制的二次P坚件取错王导杨少权标括2P流量识别策略
2.5基于滑动窗口机制的P2P流量识别与控制仿真系统
2.5.1系统概述
2.5.2系统各模块结构
2.6SWP2PIM系统功能测无滑材试
2.6.1P2P软件流量分析
2.6.2传统C/S软件流量分析
2.6.3未知类型P2P软件流量分析
2.7本章小足胶爱功结
本章参考文献
第3章基于通信网络拓扑结构的P2P流量识别模型(P2PCNTIM)
3.1基于通信网络拓扑结构的P2P流量识别模型(P2PCNTIM)概述
3.1.1P2P通信网络拓扑特征分析
3.1.2P2P流量识别确定性特征选择
3.1.3获取通信对端类型关键技术
3.2P2PCNTIM流量识别模型中的关键技术
3.2.1P害者山担战倍传令2PCNTIM特征判断函数
奏圆 3.2.2P2PCNTIM调度机制
3.2.3P2PCNTIM核心过程
3.3P2PCNTIM系统的设计
3.3.1P2PCNTIM系统的功能
3.3.2P2PCNTIM系统结构
3.4P2P陈座CNTIM系统的实现
3.4.1数据包提取分析模块
3.4.2P2P流量识别模块
3.4.3P2P应用识别模块
3.4.4P2P控制管理模块
3.5P2PCNTIM系统测试
3.5.1测试环境
3.5.2误判率测试分析
3.5.3准确率测试分析
3.5.4识别效率分析
3.6本章小结
本章参考文献
第4章基于BP算法的P2P流量识别模型
4.1BP神经网络的基本概念
4.1.1BP神经网络简介
4.1.2BP算法介绍
4.1.3BP算法实现步骤
4.2BP算法的缺陷与改进
4.2.1传统BP算法的缺陷
4.2.2BP算法的改进
4.3.3改进BP算法的性能对比实验
4.3基于BP算法的P2P流量识别系统(IBPNNP2PIM)的模型设计与实现
4.3.1IBPNNP2PM模型的提出
4.3.2数据采集模块
4.3.3流量特征抽取模块
4.3.4流分类器模块
4.4IBPNNP2PIM系统测试与结果分析
4.4.1样本数据获取
4.4.2流分类器网络训练
4.4.3流分类器网络测试
4.4.4在线识别测试
4.5本章小结
本章参考文献
第5章基于多重特征分类的P2P流量识别算法(MCCP2PIM)
5.1多重特征提取分类方法的设计思想
5.1.1P2P连接特征分析
5.1.2P2P深层数据包特征分析
5.1.3P2P流量统计特征分析
5.2MCCP2PIM系统的设计模型
5.2.1数据采集模块的设计
5.2.2数据预处理模块的设计
5.2.3多重特征提取模块的设计
5.2.4多重特征识别模块的设计
5.3MCCP2PIS系统设计与实现
5.3.1MCCP2PIM系统概述
5.3.2MCCP2PIS系统模块设计与实现
5.4MCCP2PIS系统测试与结果分析
5.4.1计算数据包长抖动频次的准确性测试
5.4.2BP网络训练测试
5.4.3多重特征流量识别的准确性和高效性测试
5.5本章小结
本章参考文献
第6章基于SVM的P2P流量识别方法的设计与实现
6.1SVM原理
6.1.1统计学习理论
6.1.2SVM思想
6.1.3SVM核函数
6.1.4与SVM相关的技术研究
6.2基于改进SVM的P2P流量检测模型
6.2.1针对大规模训练集的支持向量机学习策略
6.2.2基于改进SVM的P2P流量检测系统模型设计思路
6.2.3P2P流量特征分析
6.2.4基于SVM的P2P流量样本剪裁方法
6.2.5基于改进SVM的P2P流量识别系统模块设计
6.2.6基于SVM的P2P流量识别系统的配置
6.2.7基于SVM的P2P流量识别系统的测试与性能分析
6.3基于SVM与DPI的P2P流量识别方法
6.3.1研究背景
6.3.2主要思想
6.3.3基本方案
6.3.4系统实现
6.3.5系统测试与分析
6.4基于MSVM的P2P流量识别模型
6.4.1研究背景
6.4.2主要思想
6.4.3基本方案
6.5本章小结
本章参考文献
第7章基于流特性描述的模糊识别算法
7.1背景介绍
7.2模糊集合
7.2.1模糊集合的概念
7.2.2隶属函数的确定与选择
7.2.3模糊集合的截集与模糊性的度量
7.3模糊综合评价法
7.3.1模糊综合评价法的术语及其定义
7.3.2模糊综合评价法的特点
7.3.3模糊综合评价法的应用程序
7.4模糊评判规则
7.4.1数据包集合的描述
7.4.2隶属度函数的定义
7.5基于流特征描述的模糊识别方法(FCD)
7.6FCD模糊识别方法在识别网络游戏中的应用和分析
7.6.1用FCD模式识别方法识别"魔兽世界"
7.6.2隶属度函数分析
7.6.3结果分析
7.7FCD模糊识别方法在识别其他P2P中的应用
7.7.1Skype 特性
7.7.2Skype的检测流程
7.7.3FCD模糊识别Skype的过程
7.8本章小结
本章参考文献
的概念最早于1969年由Steve Crocker提出,每个参与P2P网络服务的主机都称为一个Peer,由Peer连接构成的网络就称为P2P网络。P2P网络不仅能提供快速高效的文件共享、低成本高可用的计算资源和存储资源共享,而且具有强大的网络连通性,以及更直接、更灵活的信息传送能力。然而,P2P网络在提供高效快速资源共享的同时,也带来了众多的问题: P2P对传输速度的需求高,且P2P应用的数据交换具有一对多、突发性和分布式特性,P2P用户的超大容量下载消耗了大量带宽; 其用户抢占了60%~80%的网络带宽,容易引起企业及ISP瓶颈链路的阻塞; P2P 用户不分时段地进行高速下载,增大网络设备的负荷,容易造成高峰时段的链路拥塞等。随着P2P应用的快速发展,P2P指数级增长的数据传输使得网络带宽资源更加紧张。因此,为了确保其他正常网络用户的服务,同时为了更好地发挥P2P技术的优势,对P2P流量进行分类、识别就成为目前业内研究的一个热点 。
本书作者从2004年开始研究P2P流量识别的相关技术,先后得到国家自然科学基金、科技部中小企业创新基金、国家重点实验室基金、江苏省自然基金、江苏省高校自然基金项目及企业委托项目的资助,取得了以下成果。
(1) 立足于P2P协议最基本的特点,研究并总结出P2P流量的多个统计特性,提出了基于滑动窗口机制的P2P流量识别模型(SWP2PIM),并建立了P2P流量识别与控制仿真系统,详细内容在第2章中阐述。
(2) 根据P2P独有的通信网络拓扑结构特征,提出了基于通信网络拓扑结构的P2P流量识别模型(P2PCNTIM),该模型使用多主机特征以及通信对端类型特征对P2P流量进行识别,并将这两个特征有机地结合起来以提高识别的准确率和识别效率,第3章给出了详细分析。
(3) 将BP网络应用于P2P流识别,提出了一种基于改进BP算法的P2P流识别模型(IBPNNP2PIM)。针对传统BP算法的缺陷,在总结了他人研究成果的基础上,对传统BP算法进行了改进,并将其应用于模型中流分类器模块的设计,与采用传统BP算法的流分类器相比,IBPNNP2PIM对P2P流的识别具有一定的有效性和优越性,第4章展示了其应用效果。
(4) 通过大量的实验对比分析P2P应用和非P2P应用,总结出P2P的连接特征、深层数据包特征和流量统计特征这些特征,并在此基础上提出了基于多重特征分类的P2P流量识别模型(MCCP2PIM),第5章中对该系统实现进行了剖析。
(5) 基于近几年对支持向量机(Support Vector Machines,SVM)技术的深入研究,致力于将SVM技术运用到P2P流量识别中,分别提出了基于改进SVM的P2P流量检测模型、基于P2P与DPI(Deep Packet Inspection,深度包检测)的P2P流量识别方法以及基于MSVM(Multidimensional Support Vector Machine,多维SVM)的P2P流量识别模型,第6章描述了这3个模型及其系统的成果。
(6) 首次将模糊数学的理论运用到P2P数据流的识别中,提出了一种基于流特征描述的模糊识别方法(FCD)。该识别方法能够较好地识别网络流量中的某些网络应用流,对于其他的网络应用流量识别同样适用,具有较好的准确性和可扩展性,第7章对此进行了深入分析和阐述。
本书是项目组集体成果的结晶,他们是宫婧副教授、刘三民博士、焦琳硕士、姜举良硕士、陈松乐博士、卜凯博士、许刘兵硕士、余小芳硕士、颜小倩硕士、高同硕士、张玉峰硕士等,在此书交稿之际,谨向他们对本书做出的贡献表示衷心的感谢。另外,感谢宫婧副教授、刘三民博士、汪胡青博士、何丽萍博士在本书撰写过程中给予的帮助。
感谢我的爱人张娟和儿子孙翌博,他们是我写书的动力所在。
最后要感谢清华大学出版社的领导和编辑,没有他们的辛勤劳动,就没有本书的出版。