基于机器学习的网页正文提取方法
所屬分類:技术论文
上傳者:aet
文檔大小:226 K
所需積分:0分積分不夠怎么辦?
文檔介紹:先将网页转换为规范的DOM树,然后计算每行文本的文本密度、与标题相关度等值,并将其作为输入参数利用BP神经网络进行训练,进而形成抽取规则,最后通过实验验证该方法的可行性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。