《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信与网络 > 设计应用 > 基于重点突发词的突发事件检测方法
基于重点突发词的突发事件检测方法
2020年电子技术应用第11期
富雅玲1,杨文忠1,2,吾守尔·斯拉木1,杨蒙蒙1,梁 凡1
1.新疆大学 信息科学与工程学院,新疆 乌鲁木齐830046; 2.中国电子科学研究院 社会安全风险感知与防控大数据应用国家工程实验室,新疆 乌鲁木齐830000
摘要: 由于突发事件具有突发性、聚众性、破坏性,针对微博中发布的突发事件,避免由突发事带来一系列社会问题,提出一种结合用户影响力和突发词的突发事件检测方法。为提取大量重点突发词,使用词影响力和词状态两个指标计算词突发值,将大于一定阈值的词作为突发词;采用凝聚层次聚类方法,对突发词集的共现矩阵进行聚类得到热点话题。之后将结果放入训练好的分类器对热点话题进行分类,最终得到突发事件及其类型。使用真实的微博数据对其进行实验,对比使用分类器前后的实验结果,该方法可以有效过滤一般热点话题,提高突发事件检测的准确率。
中圖分類號: TP391.1
文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.200148
中文引用格式: 富雅玲,楊文忠,吾守爾·斯拉木,等. 基于重點突發(fā)詞的突發(fā)事件檢測方法[J].電子技術(shù)應(yīng)用,2020,46(11):82-86.
英文引用格式: Fu Yaling,Yang Wenzhong,Woxur Silamu,et al. Method of bursty events detection based on key bursty-words[J]. Application of Electronic Technique,2020,46(11):82-86.
Method of bursty events detection based on key bursty-words
Fu Yaling1,Yang Wenzhong1,2,Woxur Silamu1,Yang Mengmeng1,Liang Fan1
1.College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China; 2.National Engineering Laboratory of Social Security Risk Perception and Prevention and Control of Big Data Application, Chinese Academy of Electronic Sciences,Urumqi 830000,China
Abstract: Because of the suddenness, crowd-gathering and destructiveness of bursty events, this paper proposes an bursty event detection method combining user influence and bursty-words for the bursty events published in weibo to avoid a series of social problems caused by bursty events. In order to extract a large number of key burst-words, we need to first calculate the bursty value of words, using two indicators: word influence and word state, taking words larger than a certain threshold as burst words; adopting cohesive hierarchical clustering method, hot topics are clustered by the co-occurrence matrix of burst word sets. After that, the results were put into the trained classifier to classify hot topics, and finally the bursty events and their types were obtained. The real microblog data were used to conduct bursty events on them. The experimental results before and after the use of the classifier were compared. This method can effectively filter common hot topics and improve the accuracy of emergency detection.
Key words : bursty event;burst word;clustering;classification;event detection

0 引言

    微博因其良好的服務(wù)和海量的用戶而被大眾所熟知,現(xiàn)已成為國內(nèi)最大的社交媒體。突發(fā)事件具有突發(fā)性和破壞性,在發(fā)生突發(fā)性事件,網(wǎng)民在社交媒體上進行傳播,沒有相應(yīng)的法律條款來對事件采取相應(yīng)措施,對應(yīng)急管理會形成一些障礙,如果不能及時遏制事件發(fā)展的趨勢,將會給社會帶來一些負(fù)面影響。社交網(wǎng)絡(luò)中的突發(fā)事件是指在社交網(wǎng)絡(luò)中先前若干時間段內(nèi)該事件很少被用戶討論或者被討論頻次呈現(xiàn)平穩(wěn)分布,但在當(dāng)前時間段內(nèi)以高頻次出現(xiàn)的事件[1]事件檢測有助于及時了解人們對事件的看法和實際情況,減少突發(fā)事件信息搜索的任務(wù),這一工作為自然語言處理(NLP)和機器學(xué)習(xí)的研究提供了方向[2]。因此,快速有效地檢測到突發(fā)事件,及時消除突發(fā)事件可能帶來的社會負(fù)面效應(yīng),變得尤為重要。綜合以上分析,提出一種結(jié)合用戶影響力和突發(fā)詞的突發(fā)事件檢測方法,對突發(fā)事件及其類型進行檢測。




本文詳細內(nèi)容請下載:http://www.ihrv.cn/resource/share/2000003060




作者信息:

富雅玲1,楊文忠1,2,吾守爾·斯拉木1,楊蒙蒙1,梁  凡1

(1.新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊830046;

2.中國電子科學(xué)研究院 社會安全風(fēng)險感知與防控大數(shù)據(jù)應(yīng)用國家工程實驗室,新疆 烏魯木齊830000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容