ßFA:一種基于向量指令集的高性能數(shù)據(jù)處理算法
所屬分類(lèi):技術(shù)論文
上傳者:wwei
文檔大?。?span>3357 K
標(biāo)簽: 正則表達(dá)式匹配 向量指令集 高性能數(shù)據(jù)處理
所需積分:0分積分不夠怎么辦?
文檔介紹:正則表達(dá)式匹配技術(shù)在數(shù)據(jù)清洗、解析提取等數(shù)據(jù)處理任務(wù)方面發(fā)揮重大作用。然而,由于匹配過(guò)程中存在數(shù)據(jù)強(qiáng)依賴(lài)關(guān)系和內(nèi)存訪(fǎng)問(wèn)不可預(yù)測(cè)等問(wèn)題,造成匹配性能較低。針對(duì)此問(wèn)題,提出一種基于向量指令集的高性能正則表達(dá)式數(shù)據(jù)處理算法,稱(chēng)之為ßFA:通過(guò)向量指令一次性從內(nèi)存讀出若干連續(xù)字符,并與最常被訪(fǎng)問(wèn)狀態(tài)對(duì)應(yīng)的非信任字符集進(jìn)行向量匹配,利用內(nèi)置函數(shù)定位首個(gè)非信任字符的位置,獲得可直接跳過(guò)的字符數(shù),從而實(shí)現(xiàn)匹配性能的加速。實(shí)驗(yàn)結(jié)果表明,ßFA算法的吞吐率優(yōu)于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。