使用负采样解决NER中的数据未完全标注问题
前不久手上有一个任务是要优化团队现有的NER效果。既然是优化,那么当然是先从实际项目中问题最集中的部分——数据开始下手了~
查看数据之后,发现因为此前的项目数据标注人员较多,多少存在一些标准不统一的问题,因此反映到数据上,就存在着多标、漏标的问题。其实多标与漏标,换一个角度看的话,可以统统理解为 ...
Fiedler向量与社区发现的那些事儿
最早与Fiedler向量(Fiedler Vector,FV)的接触是师父给的一篇论文,该文作者提出了一种能够衡量删除某个节点或某条边对于网络的代数连通度的影响局部中心性,并提出了一个基于该中心性的社区发现算法。
事实上,FV并非第一次出现在社区发现算法中。在图论中具有重要地位的谱聚类算法(Sp ...
模块度(Modularity)发展历程
与小世界性[1]、无标度等基本统计特性相并列,Girvan&Newman[2]在2001年发现的网络社区结构(Community Structure)是复杂网络最普遍和最重要的拓扑结构属性之一,具有相同社区节点相互连接密集、不同社区节点相互连接稀疏的特点,如图1所示。复杂网络中的社区发现方法 ...