| 基于机器学习的网页正文提取方法 | |
| 所屬分類:技术论文 | |
| 上傳者:aet | |
| 文檔大小:226 K | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:先将网页转换为规范的DOM树,然后计算每行文本的文本密度、与标题相关度等值,并将其作为输入参数利用BP神经网络进行训练,进而形成抽取规则,最后通过实验验证该方法的可行性。 | |
| 現(xiàn)在下載 | |
| VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2