基于组合模型和机器学习的网络节点分析研究
-
问题描述: 节点重要度的评估是网络科学领域的研究重点和热点。社会网络中的舆情传播依赖于某些核心言论的存在;交通网络中的核心交叉路口直接影响整个网络的流通性;电力网络中某主要区段的线路故障将导致整个网络的瘫痪;某个国家或地区的金融动荡能够在很短时间内波及全球并导致金融危机等,这些都与网络中某些重要节点有关,所以,对网络中节点的重要性进行评估是十分必要的。由于真实网络的异质性,节点在网络结构和功能上的作用差异巨大。因此,如何利用传统的网络模型以及机器学习方法,找寻关键节点,并对其行为进行分析具有十分重要的作用。
-
主要研究内容: 基于解释结构模型ISM与结构洞理论组合模型对网络节点重要性评估进行研究。学习解释结构模型和结构洞理论的背景知识,同时学习相关定义和评价准则;研究机器学习方法,如Credal Network、Sum-product Network的特点,以及如何与解释结构模型结合的方法;研究模型的评估方法,并给出相关定义和评判标准;研究实验的设计和测试方法;研究网络的稳定性和网络结构洞数量之间的关系,通过主动删减网络结构洞节点进行实验仿真,并对结果进行分析。
-
参考技术路线: 具体地,ISM模型能够将网络划分成不同的层级,层级越高节点重要度越大,反之,节点越不重要。结构洞模型能够衡量节点在网络中的重要性,网络约束系数反映节点形成结构洞的难易程度,通过计算节点的网络约束系数来判断节点的重要性,节点网络系数越小则节点形成结构洞的可能性越大,即节点的重要性越大,反之,节点越不重要。ISM模型和结构洞模型都具有各自的优点,将两者结合起来对网络中的节点进行重要性分析会得到更加理想的结果。同时引入机器学习的方法,提高模型的可解释性,增加不确定性表达,从而使节点的重要性判断更加合理。
-
研究资源:
- 常用的网络节点重要性排序指标有:度值、介数、接近中心性、k-壳值和特征向量等。其中,度值排序是一种局部排序方法,即网络中一个节点的度值越大则该节点越重要;介数是以经过某个节点的最短路径数量来评估节点重要性的方法,即经过某节点的最短路径数越多,该节点重要性越大;节点的接近中心性为节点与网络中其他节点距离平均值的倒数,即节点接近中心性越大则该节点越重要;k-壳分解是一种对网络中节点重要性粗粒化划分的方法;特征向量的基本思想为:网络中节点的重要性既与节点的度值大小有关,同时也与邻居节点的重要性有关。
- https://en.wikipedia.org/wiki/Credal_network
- Cozman F G. Credal networks[J]. Artificial Intelligence, 2000, 120(2):199-233.
- Vergari A, Mauro N D, Esposito F. Simplifying, Regularizing and Strengthening Sum-Product Network Structure Learning[C]// Joint European Conference on Machine Learning & Knowledge Discovery in Databases. 2015.