专利名称:一种基于视觉相似性镜像网站发现方法及系统专利类型:发明专利
发明人:李睿,杜翠兰,霄,张鹏,陈志鹏,杨兴东申请号:CN2018102221.2申请日:20180319公开号:CN108628703A公开日:20181009
摘要:本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。
申请人:中国科学院信息工程研究所,国家计算机网络与信息安全管理中心
地址:100093 北京市海淀区闵庄路甲号
国籍:CN
代理机构:北京君尚知识产权代理事务所(普通合伙)
代理人:余长江
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- niushuan.com 版权所有 赣ICP备2024042780号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务