基于页面标题比对和页面特征的仿冒网页识别微引擎
仿冒网页通常通过模仿知名网站,来进行网络钓鱼。 该系统主要使用基于页面标题比对和页面身份特征两种方法对仿冒网页进行识别,并设计和开发识别微引擎。 该微引擎就是利用仿冒网页模仿各种知名站点的特点,首先对知名站点网页和疑似网页的标题进行提取, 通过相应的标题比对方法,得出基于标题比对的评价结果。 同时,尝试对网页的页面身份特征,进行提取和量化,并使用线性分类器对网页进行分类,得出相应结论。
详细说明和设计及使用 请参阅 系统说明.docx
文件夹及各个文件的说明 请参阅 readme.txt