晏齐宏 2025-01-24 17:14:41
· 核心提示 ·
以复杂网络为视角,将信息圈层化操作化为用户信息共同关注网络,通过日志法收集用户信息接触数据,采用指数随机图模型(ERGM)分析圈层化的形成机制。研究发现,用户信息共同关注网络密度较低,呈现圈层化趋势。用户属性(包括人口特征、媒介使用偏好)、既有社交关系和信息关注网络的自组织结构影响信息圈层化,其中网络自组织结构的影响远远大于其他要素,节点的点度中心性、聚集系数正向影响信息圈层化,但中介中心性负向影响信息圈层化。用户社交关系数量、社交关系强度的影响因信息关注网络中的自组织结构而弱化,进而并不影响信息圈层化,线上社交媒体使用不会促进信息圈层化。此外,算法推荐平台使用偏好、算法政治信息偏好不会导致信息圈层化。
· 内容精选 ·
一、问题提出
智能媒体语境下,以算法推荐为代表的新技术对信息环境的影响引发各界担忧,最具代表性的是信息茧房效应、信息圈层化,而这两者之间也有联系。信息茧房较多关注个体内部信息的同质化现象。从个体来看,在个人内部信息同质化基础上,那些具有共同特征及信息偏好的个体更可能接触到同样的信息。如果不同群体都陷入同质化回音室,群体内部在兴趣、身份认同、政治立场等因素的驱使下会形成多个交流相对紧密的圈层,群体之间可能相互隔离,由此导致圈层化。更进一步,如果圈子的排斥性与防御性较强、与他者信息流通不畅、较少进行互动,反过来会导致个人内部信息的同质化,更容易形成回音室,甚至导致意见极化。同时,在算法推荐领域,无论是基于(强)社交关系的推荐,还是基于用户协同过滤的推荐,都是根据用户的同质性偏好来推荐信息,使得具有共同特征的用户群体更加聚集,且与不同特征用户群体形成信息区隔。
遗憾的是,尽管学界对信息茧房有较多关注和研究,但是对于圈层化及其形成机制缺乏系统性、全面性的实证分析。圈层化是对网络用户聚集与分化模式的现象描述,其重要方面是圈子化。圈子是以情感、利益、兴趣等维系的具有特定关系模式的人群聚合;其中,个体之间进行较为频繁的互动,但也存在内部关系的不平等;同时,基于关系的社会规范约束圈子中个体的行为。国外学者大多关注政治语境下的圈层化,通过实证方法分析用户或媒体是如何以政治意识形态为核心形成集群或者圈子的,不同意识形态群体之间是如何形成对立状态的。除了政治偏好之外,其他用户特征也会导致圈子化的形成,如媒介接触、社交关系等。研究者认为,网络舆论圈层化有其系统的内在逻辑,具体可归纳为以“社会交往圈层”等为底层支撑力的理论逻辑,以“算法”等为外部推动力的技术逻辑,和以“互动”等为内部驱动力的运行逻辑。
从系统化的角度看,关系性、结构性是圈层化的重要方面,复杂网络分析便是重要的结构化分析范式。复杂网络中具有特定的结构,结构会塑造行动者的行为。就此来看,圈层化的影响因素包括圈层网络自身演化过程、用户属性特征、网络外部因素(如既有社交关系)等。从统计推断来看,对这几个维度的分析不应以传统统计中的独立性假设为前提,而应该从关系性角度展开,如网络自身演化过程假定某一些关系的出现往往会促进其他关系的形成,这是网络形成的内驱力。针对此,指数随机图模型(ERGM)方法能够分析网络自组织特征对圈层化的影响,而且可以将多维因素纳入模型,分析多维度因素的交互性影响。基于此,本研究尝试以复杂网络的分析范式探究信息圈层化的形成因素,除了用户属性外,还包括社交关系、网络内生结构等因素的影响,并采用ERGM对此展开分析。值得注意的是,本文的信息圈层化以信息共同关注网络来测量,即两个用户如果关注了同一条信息,则两个用户构成连边关系;当多个用户均具有这种特征时,便构成信息共同关注网络。
二、文献综述
(一)信息圈层化的影响因素
已有针对圈层化影响因素的研究,主要关注人口特征、社交关系、技术支撑(算法推荐)等,他们独立或交互作用影响圈层化。
从人口特征来看,以往实证研究大多探讨政治信息语境下的圈层化,尤其是选举语境下选民信息接收,以及观点表达的圈层化。该圈层化是建立在用户既有政治党派和意识形态基础之上的,圈子围绕不同党派而建立。Conover等首次尝试将同质性与政治取向联系起来,通过抽样调查发现,Twitter用户倾向于转发那些具有相同政治派别用户的帖子,从而形成政治高度隔离网络,这是圈层化的一种表现形态。有研究者分析2009年德国选举期间政党之间的对话发现,政治推特往往根据共同的政治派别而被隔离。随后也有研究者将样本扩大到整体用户网络来观察政治同质化以及党派之间的区隔化现象。
从社交关系来看,依托用户的政治倾向,以社交及互动文化为特征的社交网络也容易形成信息圈层化。在政治语境下,针对Facebook的分析发现,用户拥有更多与自己政治倾向相似的朋友,其信息获取依赖于朋友网络中分享的信息,这也会导致用户更可能接收与朋友类似的政治信息、符合既定意识的信息。但也有研究发现,Facebook中显示的大部分信息不是由亲密朋友共享的,而是由偶尔交流的熟人共享的。这些研究考察的均是围绕个体用户的个体网络及其互动效果。
从技术支撑来看,在智能媒体语境下,圈层化与以算法为代表的技术架构有关。算法技术可能导致个体信息同质化,不同用户或者群体有特定偏好,由此不同用户或者群体之间容易形成以自我为中心的圈子。但研究也发现,整体上用户接收的内容会越来越相似,并逐步趋近于一个整体,个性化也会使人们的信息接收与他人更相似。国内学者分析发现,随着用户信息茧房程度的加深,越是同质性强的个体,其构成的茧房与他人的趋同性更强。同时,用户茧房度越高,越会趋同于某种公共“茧房”或社会性的中心信息。由此,在个人茧房的基础上,算法技术具有塑造群体之间圈层化以及群体之间趋同性的多种可能性。
可以发现,对于信息圈层化影响因素的实证分析,国外学者大多从政治语境入手,探讨具有政治倾向的用户及其媒介接触等如何导致信息圈层化,这在人口特征、社会关系方面更为明显。针对社交关系的分析则基于个体网络展开。针对算法推荐的研究单纯从技术角度出发,并没有结合更为基础性的用户特征、社交关系等展开。从系统论的角度来看,网络内生结构很大程度上也会影响圈子的形成,而且用户特征、技术特征、社交关系、网络内生结构是综合作用后产生效果的,但我们对其运作机制知之甚少。
(二)信息圈层化的测量方法
圈层化是建立在圈子基础之上的,研究者通过多种方法对其进行测量。依据用户与信息环境的关系,测量维度包括用户的信息接收(输入)、信息发布(输出)、信息互动等方面。
从用户的信息接收/输入来看,如果用户接收的信息具有同质化特征,同类型用户之间很可能形成圈子,以区隔于那些并未接收类似信息的用户。基于此,针对圈层化,我们可直接测量用户所接收信息的同质性、用户所接触媒体或信息的极性、信息共同接触网络等。例如,研究者通过用户共同购买来确定用户之间的同质性。研究采用双盲实验方法展开分析,实验组是算法推荐信息,对照组是非算法推荐信息,对两组进行实验前后的相似网络分析,用户是网络的节点,用户共同购买作为连接节点的边关系。该方法考虑了动态关系,对本研究有所启示。
从用户的信息发布(输出)来看,通过信息发布或观点输出可以反映群体区隔,最具代表性的是对用户发布推文、帖子、评论等进行的分析。Jacobson等通过分析两个党派媒体 Facebook 页面上用户评论的党派归属,确认党派区隔的存在,进而判断对立群体之间的分化程度。也有研究以用户表达观点(支持、反对、中立)的相似性来测量用户之间的异质性,即用户是否都支持、反对特定人物或事件,如果观点不一致,则不太可能构成圈层化。研究大多基于评论的同质化程度或异质化程度来判断圈层化,聚焦于文本层面,缺乏对关系结构的关注。
从用户的互动关系来看,圈层化中的圈子是以用户关系为基础的,用户互动关系大多通过转发、提及、链接等获得。如果互动程度较低,则说明存在区隔。例如,Conover 等研究了Twitter上的政治讨论和意识形态同质性发现,具有不同政治意识形态的群体往往会彼此分离,该研究中的群体关系是通过用户之间的转发关系、提及关系来测量的。Feller 等基于提及关系展开研究,他们关注的是联邦议院选举中提到德国政党的用户。有研究通过评估两个党派媒体的Facebook账号中用户讨论所嵌入的超链接情况发现,用户聚焦于一小部分新闻链接,讨论因政治取向而被隔离。
以上几种测量圈层化的方法反映了个体内部信息同质化以及个体/群体之间信息的区隔化。从用户信息输入维度、信息输出维度进行的测量,以静态信息的类型来表征圈层化,并未考虑用户之间的动态互动行为,特别是未深度分析用户基于信息而形成的结构化关系。同时,从用户信息互动维度进行的测量存在两个问题:一是强互动(如转发、提及、链接等)用户在所有网民中占比并不大,应该考察最为基本的、低成本投入行为,如信息关注,当多个用户共同关注同样的信息时,就会形成信息共同关注网络。二是互动网络的分析,大多以个体中心网展开,对多个个体网交互作用而塑造的整体网及其形成机制缺乏深入、系统的分析。
有鉴于此,本研究尝试依托整体网并通过用户的共同信息关注来测量信息圈层化,这是一种更为系统性的、更为结构化的分析范式,同时,本研究也深入分析了人口特征、社交关系、技术支撑(算法推荐)、网络内生结构等对圈层化的综合性影响。
三、研究假设
(一)人口特征对圈层化的影响
同质性理论认为,具有相同人口特征的用户,更可能具有类似的信息关注,不同特征用户之间有所区隔,进而导致群体之间的圈层化。
第一,从人口特征来看,具有相同性别、教育经历、职业、宗教信仰的人,在态度、行为、观念等方面具有相似性。与人口特征相似的关系相比,跨性别或跨种族的关系更容易消失。同时,教育、职业等也是个体之间具有类似性的重要方面。人们更倾向于向与自己教育水平相当的人倾诉,并且随着与他人差异的增加,越来越不可能形成联系。有研究发现,白领和蓝领职业群体之间存在显著区别。
第二,地域环境是塑造同质性的天然土壤。Verbrugge分析发现,居住环境的稳定性能够预测友谊的形成,其影响程度与性别、国籍或宗教一样强烈。与地理位置较近的人接触,更可能形成关系。Kwak等通过分析美国用户发现,同质性关系更可能存在于地理位置非常接近的人当中。同时,地理位置带来的同质性不会因新技术而完全消失。研究发现,宏观文化(如语言和地理)相似性比超链接和信息体裁相似性更能预测受众的共同媒介接触。也就是说,语言和地理特征相似的人,更可能建立信息关系。用户的新媒体使用及媒体资源也受地理位置的限制,地理位置会进一步影响个体的社会感知与身份认同,以及相应的社会行动。
由此,提出研究假设H1:
H1a:具有相同人口特征(性别、教育)的用户,更可能呈现信息关注的圈层化。
H1b:处于同一地区的用户,更可能呈现信息关注的圈层化。
(二)社交关系对圈层化的影响
社交关系的形成包括两个途径,即线下社交网络和线上社交媒体使用。社交网络是人们选择信息的重要参考,用户基于线上社交媒体的信息传递形成新的群体关系,也通过高强度联系强化原有群体关系。
第一,个体网络主要包括网络规模、网络关系类型、网络性质,这会影响信息圈层化。一是从网络规模来看,朋友数量越多,越可能接触到不同类型的朋友,信息接收会更加多元化。在对算法推荐的分析中可发现,社群成员和朋友越少,越可能导致信息同质化,所以,网络规模负向影响信息圈层化。二是从关系强度类型来看,关系越强的用户之间更可能产生相互影响,进而进行信息分享,具有更类似的信息接触。研究发现,封闭性的熟人社交型平台(如微信、人人网)使得信息接收更加同质化;相比之下,微博等陌生人“公共讨论型”媒介使得信息接收更加多元化。在关系内部,相比于身边的熟人,意见领袖等弱关系对用户的信息接触影响更大,正因为如此,微博算法推荐更倾向依据那些与用户呈现“弱社交”关系的“大V”及其兴趣方向来判断用户兴趣。由此,具有较强社会关系的用户,更可能接收同质信息,不同群体之间则更加区隔化。三是从网络性质来看,倾向于与相似的他人建立联系塑造了人们的信息环境。即便在算法非常强大的语境下,人们选择与同质性他人成为朋友,基于朋友关系而进行信息接触的可能性非常高,甚至高于基于算法推荐的信息接收。当人们通过社交关系获取信息时,更可能导致群体内部较高程度的同质化,群体之间较低程度的信息公共性。相反,如果个体社会网络的异质性较强,更不可能形成集群,以及基于此的圈层。
第二,线上互动关系反过来也会促进和强化既有社会关系,具有代表性的是社交媒体使用。社交媒体是用户获取信息或观点的重要渠道,但其也可能导致公共领域的分裂,形成人口与行为特征同质化的关系网络和缺少互动关系的圈层。较多研究也发现社交媒体使用可能增加信息多样性。一方面,社交媒体使用时长越长、使用频率越高,会增加网络的异质性,带来更多样化的信息体验,不会导致信息圈层化。另一方面,人们并不总是与同质性个体进行互动。同时,无论线上互动关系在多大程度上影响圈层化,其影响程度都不及线下社会关系,因为线上互动关系是建立在原有线下社会关系基础之上的。研究发现,线下社交网络中的同质化个体,很可能会造成信息隔离。
由此,提出研究假设H2:
H2a:既有社交关系网络中的关系强度、个体同质性正向影响信息关注的圈层化,但关系数量或规模、关系异质性负向影响信息关注的圈层化。
H2b:基于社交关系的社交媒体使用偏好负向影响信息关注的圈层化。
(三)技术支撑(算法推荐)对圈层化的影响
自算法推荐运用于信息传播领域,学界担心个性化算法推荐会导致个体接收信息的同质化,以及不同个体或群体之间信息结构的区隔化。
第一,在信息传播领域,算法推荐的初衷是解决信息超载问题。从个体层面来看,算法推荐导致个体内部的信息同质。就个体来看,每个人在自己的信息茧房中,可能导致具有相同特征的个体形成群体,不同群体之间更加区隔和对立。当然,信息茧房效应的形成也是用户与算法系统互动的结果,算法推荐助推了用户的一致性选择接触行为、削弱了对抗性接触行为。但研究也发现,在特定情况下算法推荐的影响要超过用户偏好。例如,Beam分析发现,算法系统驱动的个性化推送增加了政治选择性接触,而用户驱动的推荐降低了政治选择性接触,选择性接触会进一步导致信息圈层化。
第二,就算法推荐来看,不同程度信息偏好以及不同主题信息导致的信息同质性有差异。就信息偏好程度来看,信息茧房效应因内容偏好程度加深而不断增强。更重要的是,算法推荐导致的信息同质化也因信息主题类型不同而有所不同。研究发现,在算法语境下,算法系统对用户一般兴趣的推断并不是来自强关系,但在人文艺术、娱乐明星、时尚美妆等好友感兴趣的信息类型中,算法推断主要是基于强关系作出的。由此,对这些娱乐休闲类信息的关注,可能围绕关系群体而形成信息圈层。相比于娱乐类软新闻,茧房效应在政治新闻上较不明显,这主要是因为,严肃性政治信息具有较高的阅读难度和认知负担,多数用户会阅读其他信息以调节心理状态,再加上关注政治信息的用户,通常具有较高的文化水平,更可能不受算法限制,他们会关注更多其他信息。
由此,提出研究假设H3:
H3a:偏向于使用算法推荐平台(如抖音)的用户,更可能呈现信息关注的圈层化。
H3b:相比于具有娱乐信息偏好的用户,具有政治信息偏好的用户,更不可能呈现信息关注的圈层化。
(四)网络内生结构对圈层化的影响
网络内生结构对圈层化的影响反映在网络自组织效应方面。圈层是复杂网络,其节点间的关系由网络自我组织演化而成,即某一些关系的出现往往会促进其他关系的形成,通过不断累积逐渐形成有序的网络结构。该过程的运行纯粹依赖于网络关系的内在运作和变化,也就是内生效应。从内生角度来看,网络连边的生成受到择优连接机制、中介效应、传递性机制的影响。
第一,择优连接是复杂网络的一种常见动力学机制,即拥有联系越多的节点,越容易与其他节点相连。择优连接效应在多种类型的网络形成中均得到证实。这一机制也可能存在于信息圈层化中。在网络分析中,通常用点度中心性来测量择优连接效应。点度中心性越高的用户可能是意见领袖或者焦点用户,这些信息富有者更容易与其他用户共同关注很多信息,相比之下,信息贫乏者不太容易与其他用户形成共同关注,从而表现出择优连接。
第二,中介效应指关系的联通程度,其具有控制其他关系形成的作用。中介效应一般通过中介中心性来衡量,关注的是处于中介位置的节点是否处于其他节点间的最短路径之上。一般来讲,处于中介位置的用户节点,连接着不同信息片区的用户,对其他两个相邻节点的连接具有“搭桥”和限制作用。在信息圈层化网络中,不同信息片区的用户通过中介用户而产生连接关系,使不同信息片区用户的连接更为紧密,不太可能形成信息区隔。
第三,传递性机制通常被理解为“朋友的朋友倾向于建立新的朋友关系”,即关系是可以传递的。在网络结构中,聚集系数可以用来反映传递性机制,一般通过网络中三元组的数量来衡量节点聚集成团的程度。三元组节点之间彼此建立关系的结构称为“三元闭包”,具有三元闭包形成潜力的用户之间存在内在的信息关联性,更可能建立起信息共享连接,进而形成圈子。
由此,提出研究假设H4:
H4a:用户节点的点度中心性越大,与其他用户产生共同信息关注关系的可能性越大,更多可能呈现信息关注的圈层化。
H4b:用户节点的中介中心性越大,会将不同信息片区相连接,更少可能呈现信息关注的圈层化。
H4c:用户节点的聚集系数越大,使得相邻用户产生共同信息关注关系的可能性越大,更多可能呈现信息关注的圈层化。
四、文献综述
(一)数据收集
本研究借鉴政治讨论网、线上人际网、高校科研团队合作网等的数据收集方式,通过“随机抽样”和“提名法”的方式招募被试,并向其收集信息关注数据。首先从某高校传播学专业低年级学生中随机抽取20位学生作为种子被试,然后要求每名种子被试通过提名的方式邀请其他同学参与,即邀请19位普通被试(9位本校、10位外校,外校同学大多是其老家的中小学同学),最后共获得400位被试(包含种子被试20位,普通被试380位)。因此本研究更多地代表大学生群体的信息关注网络及情况。该抽样方式一定程度上可以真实模拟基于信息关注而形成的网络。主要原因如下:一是从种子被试用户来看,本研究以随机抽取方式获得种子用户(所在专业低年级学生),他们之间的相熟程度较高,较容易构成网络拓扑结构。由于学生被试之间的同质性较强,为了提高被试之间的差异,重点选取了大一、大二学生,他们还未深度参与大学生活,且来自全国各地,更多地保留了原来家乡的信息关注习惯,整体拥有相对多元的信息偏好。二是从网络关系来看,通过种子被试提名邀请普通被试的方式,一定程度上能够表征现实信息关注情况。一方面,从被试数量来看,碍于学业压力等,本研究的种子被试主要抽取自低年级学生,其社交网络规模并不是非常大,其所邀请的20位同学(即普通被试)很大程度上包括了所能遍历的所有学生,一定程度上与其日常(学生)交往圈数量较为一致。另一方面,从被试质量来看,愿意帮助种子被试用户完成任务并参与数据收集的同学,很多是关系较好的同学,这与通常提名法中可能偏向于强关系的规律较为一致。同时,现实中信息互动基本发生在熟人之间,无论是基于同质性的信息共同关注,还是算法推荐中基于人物协同过滤的推荐等,都力求向熟人、关系较强的人推荐同样的信息,提名法所获得的普通被试及其信息接收也符合这一现实信息关注情况。
本调研于2022年10—11月展开,借鉴以往新闻受众重复研究,采用日志调查的方法展开。具体过程如下:被试通过主观报告的方式将自己完整阅读/观看、点赞、收藏、评论、转发、搜索、与他人讨论的信息截图并录入excel,录入维度包括标题、浏览时间、反馈行为(如点赞、转发)。普通被试每隔3天将信息截图、excel等文件提交给种子被试,每天记录平均5条信息,调查持续进行1个月,期间共反馈10次,每次反馈不低于15条信息。要求被试以3天为时间单位提交信息截图等,是为了避免时间过长产生遗忘。被试对信息的追踪记录并未包括所有关注的信息,他们只需记录那些重点关注、转发、点赞、评论、收藏的信息,这能将与个人最相关、对个人影响最大的信息凸显出来。同时,这些反馈行为会触发算法机制,符合当下算法普遍渗入传播领域这一真实环境。由于个别被试在调查过程中退出,最终有种子被试和普通被试共381位完成全部调查。对关注信息整理后,共获得56 579条有效信息。
(二)网络建构
对于信息圈层化的测量,本研究借鉴测量受众碎片化的受众重复度指标展开。从现象层面看,用户群体内信息高度相似,各个群体之间信息高度异质,就会形成圈层。对该现象的捕捉和测量,首先需要界定群体,即共同关注特定信息而形成的用户群体。如果两个用户关注了同一条信息,那么这两个用户形成信息关注对,多个用户因共同信息关注会形成网络,即信息共同关注网络。如果该网络整体密度较低,中心性较高,则大量信息被少量用户所共同关注,也表明少量用户联系较为紧密,更可能形成圈子,并与其他未联系的用户相区隔,很可能导致圈层化。如果网络整体密度较高,中心性较低,则大量信息被多数用户所共同关注,也表明用户之间较为碎片化,不太可能形成圈子。
之所以如此测量信息圈层化,可以追溯到媒体选择理论。该理论认为,用户的媒介选择不仅受个体因素的影响,也受媒介结构的影响。对媒介结构影响机制的分析,其中一种方法是采用不同媒体的受众重复度来测量,即同一受众因共同关注两个媒体而产生的媒介间关系,或者媒体之间存在共享受众。这是基于这样一个前提:既然媒体较为丰富,用户理应可以选择各自偏好的媒体,但如果用户之间仍然有共同使用的媒体,说明这是由于宏观媒介结构导致的。研究证实了宏观媒介结构会比个人因素更多地影响用户的媒介选择。该方法也被运用于分析用户的跨平台接触行为。
在具体操作中,通过共同关注同一条信息,便可建立用户之间的关系,构成信息共同关注网络。由于该网络的被试起初是从传播学专业学生中基于特定关系招募的,他们因共同关注信息而形成信息网络,符合网络边界确定中的行动者特征、关系特征和活动特征,因此该网络是由381位被试建立的无向网络。
(三)自变量测量
(1)人口特征。
在正式调查之前,收集被试的人口信息,包括性别、年级、专业、学校、地域等。
(2)社交关系。
①社交关系网络。采用对个体社会网络的评测维度展开,具体包括网络规模(社交关系数量)、网络关系强度和网络异质性(社交关系异质性)。
社交关系数量:针对特定被试,相熟程度>=2的被试数量反映的是网络规模或关系数量。统计发现,所有被试网络规模的平均值约为10。
社交关系强度:在日志调查结束后,询问被试之一与其他被试(380位)的相熟程度如何。1表示不认识;2表示不太熟;3表示比较熟;4表示非常熟。数值越大,表示关系越强。以任意两个用户为节点,他们之间的熟悉程度为边关系,建构关系强度网络。社交关系强度以关系矩阵的方式纳入模型。
社交关系异质性:通过质异指数IQV(index of qualitative variation)来计算,IQV指观察到的变异量和可能存在的最大变异之间的比值,计算公式如下:
其中,k为类别总数,如性别、年龄、受教育程度等;n为样本数,在本研究中即为社交网络规模;fi为i类的发生频数。本研究依据该公式分别计算每位被试社交网络中其他被试的性别、年级、专业、学校所在地、户籍所在地的异质性指数。
②社交媒体使用偏好。以往研究发现,算法推荐系统可能更多地根据弱社交关系而非强社交关系推荐;此处的社交媒体仅仅指基于社交关系而使用的媒体,为了消除算法推荐的混合效应,此处重点关注基于强社交关系的社交媒体使用,即以强互动关系为基础,且具有明显互动机制(如关注好友,@、转发等功能设置)的媒介或平台,包括微信群、微信朋友圈、微博、抖音、微信视频号、QQ学习群聊、QQ、豆瓣等。如果被试用户关注的信息有大于或等于50%的来自社交媒体(社交媒体累积占比较大),则为社交媒体偏好用户。
(3)技术支撑(算法推荐)。
①算法推荐平台使用偏好。算法推荐平台指主要以算法进行信息分发的媒体平台,如B站、抖音、微信视频号、小红书、今日头条、快手等。如果被试用户关注的信息主要来自算法推荐平台(算法推荐平台累积占比较大),则为算法推荐平台偏好用户。
②政治或娱乐信息偏好。测量被试用户所关注信息中政治类或娱乐类信息的偏好程度,具体通过对标题进行编码归类,如政治、娱乐、其他等;两位编码员的一致性系数为0.94。如果被试用户关注的政治信息占比大于娱乐信息,则为政治偏好用户,反之为娱乐偏好用户。
(4)网络内生结构。
①点度中心性。采用社会网络分析方法测得每位被试的点度中心性。
②中介中心性。采用社会网络分析方法测得每位被试的中介中心性。
③聚集系数。采用社会网络分析方法测得每位被试的聚集系数。
(四)分析方法:指数随机图模型
本研究中的信息共同关注网络是后来生成的信息网络,采用指数随机图模型分析其形成机制。指数随机图模型(ERGM)是专门针对关系数据的统计分析方法,可以用于理解一个观测网络的形成是源于网络成员某种属性特征还是源于网络形成过程中的关系模型。具体通过R语言的工具包实现。
根据本研究的问题,在分析中构建六个模型:模型1是基准模型,即只有边关系作为自变量。模型2是在模型1的基础上引入自变量节点属性,即用户的人口特征(如性别、年级、专业、学校所在地、户籍所在地);模型3是在模型2基础上加入自变量社交关系数据;模型4是在模型3基础上加入自变量平台偏好、信息偏好;模型5是关于网络自组织变量,包括用户节点在个体网中的点度中心性、中介中心性、聚集系数;模型6是综合模型。
值得注意的是,本研究采用了差异化同质性的分析方法,对人口特征同质性对信息圈层化的影响进行分析。例如,性别的差异化同质性分析按照男性和女性分别来计算。如果男性同质性正向影响共同关注网络,则说明男性之间具有共同关注,关系较为紧密。但这一特征并不一定存在于女性群体中,女性同质性很可能并不影响或者负向影响信息共同关注网络,具体需要另行计算。
五、数据分析结果
(一)用户共同关注网络的基本情况
共同关注网络是无向网络(见图1),运用R语言对该整体网络进行分析,包括网络全局情况、网络节点重要性、网络社区等方面。
(1)网络全局情况。
从网络规模来看,该网络有380个节点(即用户),共19 538条边。节点平均度为103.153。在380个节点中,度数最大值为230,最小值为3。
从网络结构连通性来看,网络整体密度为0.271,网络较为松散;网络聚集系数为0.546,网络直径为4,平均路径长度为1.763,表明该网络在局部形成更多聚类,从而形成一定程度的圈层化。
(2)网络节点重要性。
从节点重要性来看,所有节点度数中心度的均值为0.544,接近中心性均值为0.574,中介中心性均值为0.002,特征向量中心性均值为0.043,PageRank均值为0.003。
(3)网络社区。
派系分析发现,最大的派系有20个;这些派系中节点数量为45个。各子群中,包括3—4个用户的子群有651个,2—3个用户的子群有226个。这说明有几百个成员确立了稳定的互惠关系,他们接触同样的信息。
k-核分析发现,coreness较大的节点有137个,是重要节点。coreness较小的节点有3个,是较不重要的节点。
整体来看,该网络中密度较低,度数中心性和接近中心性较高,大量信息被少量用户所关注,也表明少量用户联系较为紧密,多数用户联系较为松散,信息重复率较低,用户之间的共同信息关注程度较低。同时,网络中介中心性较低,说明较多节点不太参与同其他节点的联系,网络存在一定的断裂或区隔。而且,网络中派系和社区较多,呈现一定的圈子化特征。网络具有中心节点,越往外围,节点大小和连线的密度越小、越分散。
(二)信息圈层化的影响因素
采用R语言的statnet工具包进行ERGM分析,对六个模型进行参数估计,估计方法为马尔科夫链蒙特卡罗最大似然法(即MCMC MLE)。通过AIC和BIC来判断模型拟合效果,指标值越小,表明模型效果越好。
统计分析发现(见表1),在所有模型中,网络自组织的影响最大(AIC/BIC均较小),表明内生因素对信息共同关注网络或圈层化的影响更大,相比之下,用户节点属性、用户社交网络特征(社交关系数量、关系异质性)、网络协变量(社交关系强度网络)对圈层化的影响较小。也就是说,网络自身的结构特性是圈层化形成的重要动力。更进一步,就用户节点属性和个体网特征来看,从基准模型到人口特征模型、社交关系模型、再到算法推荐模型,AIC/BIC值越来越小,说明影响因素中,人口特征更具基础性,其次是社交关系,再次是算法推荐。整体来看,综合模型的拟合效果最好,说明用户属性因素、社交关系特征、网络内生结构因素是相互作用、相互影响的,进而塑造了圈层化。下文主要根据综合模型的参数结果分析圈层化的形成机制。
数据显示,就基准模型来看,边数统计项的系数是负值(-4.288),说明网络的密度在50%以下都是稀疏网络。在50%以下网络中一条边形成的概率与用户信息共同关注网络的密度是一致的,为0.271。
就人口特征来看,男性的性别同质性和女性的性别同质性均显著正向影响信息共同关注网络(p<0.001),这说明了男性之间可能关注共同信息,女性之间也可能关注共同信息,从而形成基于男性的信息圈层和基于女性的信息圈层。高年级同质性显著正向影响信息圈层化(p<0.01),相比之下,除大二年级外,低年级同质性对信息圈层化的影响基本不显著(p>0.05)。高年级的被试,特别是研究生,已经深度融入校园生活,且迫于学习压力,信息关注不太多元,同时,由于年龄较大、心智更成熟,会更关注公共话题等,也更可能与他人形成共同关注,更可能形成圈层化。专业同质性显著正向影响信息共同关注网络(p<0.001)。就读于同一专业的被试,更可能关注同一信息,从而导致信息圈层化。所在地同质性显著正向影响信息圈层化(p<0.001),处于同一地区的被试,包括学校所在地、户籍所在地,更可能关注同一信息,从而导致信息圈层化。假设H1b得到证实,H1a得到部分证实。
就社交关系来看,社交关系网络中的关系数量、关系强度并不显著影响信息共同关注网络(p>0.05)。针对关系异质性,年级异质性正向显著影响信息圈层化(p<0.05),性别、户籍所在地异质性负向显著影响信息圈层化(p<0.05)。这说明如果社交圈子中有其他年级的朋友,也会有共同信息关注;但如果社交圈子中有其他性别、地区的朋友,基本不会有共同信息关注。这反映了性别、地区区隔对于信息接收格局的影响更为深刻,相比之下,被试共同接收的信息可以跨年级存在。整体来看,社交关系网络对圈层化的影响并不大,这与一般认为的社交关系会导致信息圈层化的认识有所偏差。这也说明了研究通过种子被试邀请好友的方式收集信息的有效性,强关系并未影响到圈层化的存在状态。相比之下,社交媒体使用显著负向影响信息共同关注网络(p<0.001),那些偏好使用社交媒体的被试,不可能关注同样的信息,更不可能导致圈层化。本研究中的社交媒体指基于强关系或者熟人关系而建构的媒体平台,如微信朋友圈、QQ等,数据结果说明了即便是在线强关系,也不可能促进信息共同关注,反而可能获取更多信息,不会导致圈层化。研究假设H2b得到证实,H2a得到部分证实。
就技术支撑(算法推荐)来看,算法推荐平台使用偏好显著负向影响圈层化(p<0.001)。那些偏好使用算法推荐平台的被试,相互之间更不可能关注同样的信息,从而不会导致圈层化。导致这个结果可能有两个原因:一是算法推荐使得他们各自陷于自己的茧房,成为一个个独立的个体性存在,更不可能形成集群及基于此的圈层化。二是算法推荐的确会使得群体之间具有更多相同的信息关注,但由于学生被试的关注信息整体不太多元,信息环境较为同质,所以,信息集群之间区隔的可能性较小。同时,政治信息关注偏好显著负向影响圈层化(p<0.001)。相比于有娱乐偏好的被试,有政治偏好的被试更不可能关注同样的信息,也更不可能导致圈层化。偏好关注政治信息的被试,他们有更强的信息获取能力,信息接收较为多元,再加上整体政治信息环境的同质化,所以更不可能形成区隔。而娱乐信息更可能因为社交关系而推荐,更可能形成圈层化。研究假设H3b得到证实,H3a并未得到证实。
就网络内生结构来看,点度中心性的拟合结果为显著正相关(p<0.001),说明在节点其他因素数值相同的情况下,被试用户点度中心性越大,越有可能与其他用户形成共同关注关系。这一结果印证了复杂网络中的择优连接机制。用户中介中心性的拟合结果为显著负相关(p<0.001),且该值较大,这说明在节点其他因素数值相同的情况下,用户中介中心性越大,越有可能将其他片区用户连接起来,而不会出现信息群体之间的区隔,不太可能出现信息圈层化。聚集系数的拟合结果显示为显著正相关(p<0.001),说明在节点其他因素数值相同的情况下,聚集系数越大,拥有一个共同邻点的两个节点直接相连的可能性更大,越有可能与其他用户凝聚成团,形成圈层化关系。假设H4a、H4b、H4c均得到证实。
更进一步,对比综合模型和其他模型可以发现,当加入网络内生结构变量之后,男性、大一学生、大二学生、社交关系数量、社交关系强度、社交关系异质性(专业异质性、学校所在地异质性、户籍所在地异质性)、社交媒体使用、政治信息偏好对信息圈层化的影响有所变化,这说明通过ERGM分析能够揭示出信息圈层化中存在的内生结构在整体网络形成过程中的作用。
用户属性特征、社交关系模型下显著的统计项在综合模型中不再显著,如大一学生、社交关系数量、社交关系强度、社交关系异质性(专业异质性、学校所在地异质性)。网络内生结构的加入,导致这些变量的作用被减弱或替代。主要是因为,大一学生信息接触面较为狭窄,更可能跟风、追随大多数人,其共同关注关系的形成很大程度上与整体网络结构有关。从社交关系来看,对比模型3和模型6可发现,加入网络内生结构后,既有社交关系的影响变得不显著了,说明网络内生结构对信息关注网络的影响远远超过了初始社交关系网络。
用户属性特征模型下显著的统计项在综合模型中仍然显著,但是影响方向发生改变,如男性、大二学生、户籍所在地异质性、社交媒体使用偏好、政治信息偏好的影响方向有所改变。这说明原先模型下看似显著且正向/负向的推断,由于受独立性假设的限制,可能并不准确,甚至在整体网络下可能出现相反的结论。男性、大二学生的影响由负向转变为正向,很大程度上因为人口特征是最基础的,它本身就可以驱动网络结构的内在运行,其与网络内在结构交互作用,最终促进信息圈层化。户籍所在地异质性、社交媒体使用偏好、政治信息偏好的影响由正向转变为负向,这可能是被试整体的户籍分布不均导致的,社交媒体使用偏好、信息类型偏好是被试用户的后天媒介接触行为,其与网络结构交互作用并发生化学反应,从而导致方向的变化。
六、结论与讨论
圈层化是一个复杂网络,用户所嵌入的群体结构很大程度上会塑造其行为。基于此,本研究尝试以复杂网络为理论基础,采用随机抽样、提名的方式招募被试,以日志法收集被试用户信息关注数据,通过自我建构的共同信息关注网络这一整体网来衡量信息圈层化,并运用指数随机图模型分析属性特征、社交关系、技术支撑(算法推荐),以及网络内生结构等对圈层化的影响。
研究发现,用户共同信息关注网络的整体密度较低,用户因共同关注信息而形成的关系较弱。同时,节点中心性较高(如度数中心性、接近中心性),但中介中心性较低,一定程度上呈现了信息圈层化。
研究还分析了信息圈层化的影响因素。数据显示,人口特征、社交关系、技术支撑(算法推荐)、网络内生结构等交互作用,共同影响信息圈层化。其中,网络内生结构的影响最大,而且其很大程度上会削弱其他变量作用的发挥。这启示我们要从圈层化内部结构和外部用户属性、个体社交关系等角度展开对信息圈层化的讨论。
整体来看,信息圈层化的形成机制包括三类:一是选择性圈层化,即个体层面具有共同人口特征的用户更容易聚集,与其他人口特征群体隔离,从而形成圈层化。社交关系异质性也会导致无法形成共同信息关注以及圈层化。二是诱发性圈层化,即圈层的内生组织结构对信息聚类和区隔的影响,而且初始社交关系网络中关系数量、关系强度的效应也会被内生结构所替代。三是发展性圈层化,即社交媒体使用、算法推荐偏好、政治信息偏好等对信息圈层化的影响是基于整体信息环境的,这些媒介或信息使用偏好或多或少扩大了信息接触等,使得信息圈层化较难形成。
(一)选择性圈层化
本研究将人口特征以两个维度纳入模型:一是后发信息关注网络中个体之间的同质性,考察是否同质性群体更可能形成圈层化。数据显示,男性之间、女性之间、高年级学生之间、同专业学生之间、同地区(包括学校所在地、户籍所在地)学生之间越可能具有更多的共同关注,从而更可能导致圈层化。这里是将某个体与其他所有被试进行同质性比较。二是在初始社交关系网络分析中,以人口特征来表征社交关系的异质性,从同质性的另一面考察社交关系中异质性关系是否会影响圈层化。研究发现,不同性别之间、不同户籍所在地之间更不可能有共同信息关注,更不可能形成圈层化,但是专业异质性、学校所在地异质性的影响并不显著,而年级异质性甚至正向影响圈层化,不同年级学生也可能形成圈子。不同于同质性群体分析中将所有被试(除自己之外的其他380位被试)作为比较基数,异质性关系仅仅将与自己认识的人(个人网络规模)作为比较基数。结合两者可以说明,在人口因素中,先天因素(如性别、户籍所在地)的影响更具基础性,更可能导致信息圈层化;而后天因素(如专业、年级、学校所在地)不太可能导致圈层化,反映了基于教育而进行的信息关注可以跨越不同类别,形成共同关注。
(二)诱发性圈层化
在研究中,网络自身结构对共同信息关注网络的影响超过用户属性的影响,说明了采用网络结构分析方法(即ERGM)分析网络形成这一范式的合理性和有效性。
研究重点关注三个网络构局,包括点入度、中介结构、三元闭包结构,具体通过点度中心性、中介中心性、聚类系数来测量。其中,点度中心性反映的是择优连接机制,形成了“富者越富”的现象。中介中心性反映的是,如果用户处于最短路径上,则能够将不同信息片区的用户连接起来,不太可能形成区隔和圈层化。聚集系数通过三元组的数量来衡量网络中节点聚集成团的程度,具有三元闭包结构的用户之间存在内在的信息倾向性,更可能形成圈层化。
更进一步来说,这些网络内生结构要素削弱甚至替代其他变量来影响信息圈层化,具有代表性的是既有社交关系网络。社交关系网络(关系数量、关系异质性)是作为初始网络、现实网络存在的,当纳入网络自组织结构后,这些变量基本上都不显著了,很可能是因为后发信息网络中的组织结构更具基础性。尽管后发信息网络是建立在社交关系网络之上的,但其远远超越了社交网络。
除了社交关系数量、社交关系异质性外,社交关系强度是以网络协变量的形式纳入模型的。以任意两个用户为节点,他们之间的熟悉程度为边关系,建构关系强度网络。当纳入网络自组织结构后,其影响也不显著了,说明了初始社交关系强度基本不影响信息共同关注。也就是说,信息共同关注会基于初始社交网络(如网络异质性)来展开,但并不会因为关系强弱而有共同关注。弱关系也有可能形成共同信息关注,而强关系并不一定会形成共同关注。所以在圈层化的分析中,要对有无关系、关系强弱的影响进行更为细致的分析。
此外,网络自组织结构对不同类型用户的影响或许有差异。以往针对消费咨询网络的分析发现,对于发表评论对关系构建的影响,意见领袖要强于非意见领袖,而网络结构对关系构建的影响,非意见领袖要强于意见领袖。由此,在信息共同关注语境下,可以推测那些处于网络非中心或者边缘的群体,他们之所以能够有共同信息关注,很重要的一点在于网络内生结构,而非自身属性。而之所以与那些具有中心地位的个人(如意见领袖、信息达人)形成关系,并不是因为其网络内生结构,而是因为他们的个人属性,如信息质量、个人魅力等。由此,对普通人来说,通过网络结构获得资源的方式更为可取,在中心势较低的网络中,个人更可能通过网络结构获得资源。这与本研究的发现也有趋同之处:在本研究中,整体网络密度较低,网络较为分散,出现了一定的圈层化,但并未形成特别主导型的结构中心,个体在此网络中更可能依托内生结构来形成信息关注关系。
(三)发展性圈层化
除了网络内生组织、人口特征等因素外,传播学始终关注的媒介使用也影响着信息圈层化的形成。例如,社交媒体使用偏好、算法推荐平台使用偏好、算法政治信息偏好等,并不太会导致信息圈层化,与媒介使用或多或少会扩大信息来源有关,也与整体信息环境有关。
研究发现,在线社交媒体使用偏好显著负向影响圈层化,而社交关系网络(如关系数量、关系强度、专业异质性、学校所在地异质性)的影响不显著,说明了线上关系比线下关系更可能影响信息共同关注,新媒体使用会打破既有的(同质型)社交关系,进而获取更多元信息,更不可能塑造圈层化。
此外,算法推荐很大程度上影响信息圈层化,体现在平台偏好和信息类型偏好方面。数据显示,算法推荐平台使用偏好显著负向影响信息圈层化。因为算法推荐会导致个人陷入自己的茧房,而不太可能与他人有共同信息关注,也无法形成集群,更谈不上基于此的集群区隔甚至圈层化,也可能是学生的信息接触较为单一,信息环境相对同质,因此不太容易形成信息区隔。同时,相比于娱乐信息,政治信息偏好更不可能导致圈层化,因为一方面,政治信息在整个信息环境中相对统一,用户只要关注了,就非常有可能形成共同关注,不会产生区隔;另一方面,政治信息偏好者的受教育程度较高,更可能逃脱算法限制而进行多元化信息接触。相比之下,娱乐信息偏好者更可能围绕社交关系推荐形成圈层。
本研究有以下几个重要贡献:一是创新了圈层化的分析范式。研究以复杂网络的整体性视角,分析了信息圈层化的影响因素。除了用户属性(包括媒介接触偏好)、社交关系网等变量外,加入了网络自组织变量。其所隐含的深层理念是,结构会塑造其中用户的行为,由此需要将用户属性所发挥的作用置于网络结构中来考察。数据结果也反映了采用这种宏观整体视角可以更好地解释信息圈层化的形成机制。二是为圈层化分析提供了方法层面的创新可能。研究综合考虑了基于信息的用户信息接触,并通过共同信息关注来建构整体用户网络。同时,对于网络数据的收集,通过日志方法获得,并将共同信息关注网络的分析上升到解释因果机制的层面。三是超脱了国外以用户政治立场、媒介党派意识等为中心的语境,分析了国内信息圈层化的形成机制。此外,分析了网络结构如何影响个人的信息接触,对该领域研究有所补充。
当然,本研究也有不足之处。一是研究基于一定程度的熟人关系收集数据,并不能代表所有大学生的情况,同时学生的信息接触较为单一,未来可以考虑对职业群体进行调查。二是要求被试记录重点关注、转发、点赞、收藏、评论的信息,但忽略了那些参与程度较低的信息,所以该网络更能代表参与程度较高的信息关注网络。三是本研究之所以获取熟人关系网络,是为了更好地检验既有社交关系对信息共同关注的影响,可能自身网络结构存在偏向,但从数据结果来看,既有社交关系并不显著影响信息共同关注,这也在一定程度上说明研究获取的熟人关系数据并不足以改变研究结果。
晏齐宏:北京交通大学语言与传播学院副教授,中山大学法学博士(政治传播方向)
摘自《湖南师范大学社会科学学报》
“湘刊·传播研究”栏目由《华声·传播观察》杂志主办
责编:罗嘉凌
一审:黄帝子
二审:苏露锋
三审:黄柏禹
我要问