大数据把脉社会心理态势,心理所利用微博数据

来源:http://www.roro2.com 作者:必威betway 人气:122 发布时间:2019-10-10
摘要:中科院心理所:大数据把脉社会心理态势 “读心”机器对自杀倾向者伸出援手 作为心理学的核心研究领域之一,情绪识别在人机交互(Human-computerinteraction)中起到了很重要的作用。如

中科院心理所:大数据把脉社会心理态势

“读心”机器对自杀倾向者伸出援手

作为心理学的核心研究领域之一,情绪识别在人机交互(Human-computer interaction)中起到了很重要的作用。如果计算机可以有效感知人类的情绪,那么人机交互将会变得更加智能高效。既有研究表明情绪会体现在人的步态中,而智能手环可以采集到人在行走时的步态加速度数据,因此如果根据加速度数据进行情绪识别,会使得情绪识别更生态方便。

家庭暴力(Domestic Violence,DV)是严重的社会问题,对受害者甚至目睹者会造成不同程度的影响。全国妇联在2002年的调查显示,我国约有30%的家庭存在着不同程度的家庭暴力。深入了解家庭暴力的影响,尤其是在短期内对心理的影响,可以帮助人们更及时、更有针对性地对受害者进行帮助。

图片 1

近来,越来越多的研究者和高科技公司在利用社交媒体挖掘潜在的自杀信号。这是人工智能带来的美好想象:他们相信,通过AI算法,能够找到有自杀倾向的用户,并及时施以援手。

鉴于此,中国科学院心理研究所行为科学重点实验室朱廷劭研究组展开研究,旨在借助智能手环客观记录用户行走时的加速度数据,以预测其情绪。他们利用定制的智能手环,下图1中展示的实物图及其在一般步速和跑步情况下的记录数据,可以看出它记录的加速度数据有明显的区别。

为了精确了解家暴对心理的影响,常规的心理学测量一般采用前后测方法。但家庭暴力往往是一种突发事件,很难测量家庭暴力受害者在首次受到家庭暴力前的心理状态。目前有关家庭暴力影响的研究多局限于组间的比较,很少有在短期内测量家庭暴力发生前后受害者心理状态的研究。若要测量家庭暴力的短期影响,需要能够在短期内测量到家庭暴力发生前后心理状态的新方法。随着互联网的普及,越来越多的用户开始在微博等社交网络上记录生活、表达自我。这些有时间标记的网络数据有助于预测他们的心理健康特征,反映用户心理健康状态。

■本报记者 杨琪

还记得几年前因抑郁自杀的微博网友“走饭”吗?她去世前发布的最后一条微博下,迄今已有超过一百万条评论。这里像一个树洞,收容了被抑郁紧咬不放的痛苦和绝望。如果当年就有这样的人工智能技术,“走饭”的悲剧还会发生吗?2014年起,中国科学院心理研究所计算网络心理实验室研究员朱廷劭就注意到了这里,并紧盯至今:寻找和发现隐藏在其中的自杀高危网友,给予主动干预和救助。他们开发了自杀意念识别模型,和抑郁症这条“黑狗”赛跑。

该研究招募了123名被试,利用高兴、愤怒视频诱发用户情绪,然后按照路线自然行走3~5分钟,利用智能手环记录用户在不同情绪下的手腕和脚踝处的加速度数据。研究人员根据加速度数据提取了时域、频域和时频等114个特征。利用支持向量机、决策树、随机树和随机森林建立情绪分类预测模型,并利用十折交叉验证模型的可靠性。结果表明,基于加速度数据的情绪识别模型拥有良好的测量属性,如图2所示,其中SVM模型在情绪识别准确率较其他的模型较好。SVM模型在中性、中性和高兴、高兴和愤怒两类情绪识别准确率分别到达了91.3%、88.5%、88.5%。SVM模型在中性、高兴和愤怒三类情绪识别准确率达到81.2%。在情绪分类预测模型中,步态行为与情绪之间的预测关系具有一定的可解释性。结论表明,通过加速度数据来预测用户的情绪是完全可行的。

近日,中国科学院心理研究所研究人员在保障用户隐私的前提下,利用微博数据测量家庭暴力受害者在家暴前后的心理健康指标。研究人员首先通过关键词和人工筛选,在100余万微博用户中筛选出232名家庭暴力受害者。然后,利用训练得到的心理健康预测模型,根据受害者微博中的88个语言特征和11个行为特征,预测受害者在家庭暴力发生前以及发生后4周的心理健康状态,预测的心理健康状态包括抑郁程度、自杀意念以及生活满意度。随后,对家庭暴力受害者进行分类,探索不同种类的家庭暴力在短时内对于受害者的不同影响,探索的种类包括亲密关系虐待的受害者、儿童虐待的受害者以及目睹家庭暴力的受害者。

信息科学技术的发展和互联网平台的出现,为及时有效感知社会心理态势提供了新的契机,使通过网络数据实现对用户心理要素的计算预测成为可能。

“统计上说,自杀是年轻人的首要非正常死亡原因。微博用户和青年自杀人群存在高年龄层重合度,能够即时下载的微博内容也为研究提供了数据支持。”朱廷劭解释。

该研究采用可穿戴设备,通过机器学习训练得到的预测模型,对个体的运动加速度数据进行分析,能够实现实时情绪预测,可广泛应用于特定场合下个体的情绪实时监测。

研究发现,家庭暴力发生后的4周内,家庭暴力受害者表现出更高的抑郁程度、更高的自杀意念以及更低的生活满意度。对于不同类别的暴力受害者,研究发现受到虐待的儿童在短期内受到的心理影响更严重,亲密关系暴力的受害者在4周内表现出更高的抑郁程度,目睹家庭暴力的受害者也会表现出更高的自杀意念以及更多的敌对情绪。该研究采用在线生态识别(Online Ecological Recognition,OER)的测量方法,无干扰地在线上筛选参与者并预测其短期内的心理健康程度。这种方法对研究突发创伤性事件的心理影响以及监控用户心理健康状况有应用价值。

目前,国内的微博用户数量已近3亿人。不可否认,微博在快速改变传统网络舆论格局力量的同时,也逐渐展现出其自身所具有的独特优势。用户在微博平台上可以真实、自发地表达或分享自己的情感、观点和社会态度,为社会心理研究提供了大量真实、可靠的潜在数据源。

根据移动大数据服务商QuestMobile发布的《2017年中国移动互联网年度报告》,微博月活跃用户达3.81亿,在社交媒体中居于首位。而《2017微博用户发展报告》显示,30岁以下用户占微博整体用户比例超过80%,年轻群体是微博的主要用户。

该研究是朱廷劭研究组在“大数据与心理学”研究领域的系列成果之一。此项研究得到中科院重点部署项目(KJZD-EW-L04)、国家重点基础研究发展计划(“973”项目,基于生物、心理多模态信息的潜在抑郁风险预警理论与生物传感关键技术的研究,2014CB744600)、中科院战略性先导科技专项(面向感知中国的新一代信息技术研究,XDA06030800)等课题资助。

相关研究成果发表在Journal of Interpersonal Violence上。

“我们团队提出利用微博大数据,开展社会心理态势感知研究,在对社会媒体大数据分析的基础上实现社会心理要素识别,并预测相关心理要素的发展趋势,建立快速准确的社会心理态势感知系统。”中国科学院心理研究所研究员、社会与工程心理学研究室主任朱廷劭告诉《中国科学报》记者。

在发表的相关论文中,朱廷劭指出:高自杀风险用户在使用社交媒体时会表现出独特的行为和语言特征,即社会活跃程度低,夜间活跃程度高,自我关注程度高,偏好使用否定、死亡或宗教类词汇,较少使用工作类词汇。

该研究成果已被国际学术期刊PeerJ 录用并公开发表。

论文链接

描述群体的心理状态及其发展趋势,能够对群体和个体的行为取向进行预测,就是社会心理态势。朱廷劭介绍说,社会心理态势主要由社会群体中个体的心理态势组成,也同时影响着个体心理态势发展的方向和趋势。人们对涉及的社会事物,因其是否符合自身物质方面或理念方面的需要,会产生不同的体验和态度,这些都属于社会心理态势的范畴。

根据一系列特殊的微博表达和行为特征,团队建立起基于社交媒体行为和语言特征的自杀风险预测模型。“模型可以有效地识别出具有自杀风险的用户,即可以成功识别80%以上的表达自杀意念的微博。”朱廷劭说。

Zhan Zhang, Yufei Song, Liqing Cui, Xiaoqian Liu, Tingshao Zhu. Emotion recognition based on customized smart bracelet with built-in accelerometer. PeerJ 4:e2258.

图片 2

一直以来,通过大范围的问卷测评方法是研究社会心理态势感知的主要手段。但是该方法受时效性、社会赞许性等因素影响;同时自陈方式的测评周期长、成本高,无法及时大规模获取用户的心理状态,而且纵向追踪研究不具有实施上的可行性。

在朱廷劭的团队中,既有人工智能和机器学习方向的研究人员,也有心理学专业人士的参与。

论文链接

心理所利用微博数据探索家庭暴力对心理健康的短期影响

为此,该研究组开发的新浪微博应用“心理地图”在线问卷填写和调查平台,可以满足大规模用户调查的需求。“走”一圈“心理地图”大概需要花费15分钟,这样就能来一场集中的自我心理问答。其中不少问题都是我们某一时刻心情的写照。

据他介绍,研究的具体过程分为机器学习的训练和应用两个阶段。第一阶段是自杀意念的自动识别。基于社会媒体数据,利用 N-Gram、深度学习、自然语言处理等多种方法获得有效特征,训练机器学习模型建立自杀意念的识别模型,通过社交媒体主动出击,确定高危人员。

图片 3图片 4

“心理地图”具有微博数据抓取的网络爬虫功能,其中数据量超过10TB,完全具备了微博大数据的获取和处理能力。

第二阶段对有自杀意念甚至已经出现自杀行为的用户给予及时的救助和关怀,通过及时干预与转介、系统化干预和持续性关怀等方式,实现对高自杀风险用户的有效干预。与此同时,积极地去和线下组织合作,并安排志愿者跟进,提高自杀干预的效率。

图1.智能手环及其在一般步速和跑步情况下的记录数据

朱廷劭说,社会心理态势要素包含人格、心理健康、主观幸福感以及社会态度等多方面的指标。通过网络数据对这些指标进行预测是社会心理态势感知的重要组成部分,他们得出了不少新的结论。

慎重起见,团队在机器预测的基础上加了一道保险——经过人工确认后,他们才会对可能自杀者发出私信。

图片 5

首先是人格。人格的定义是代表人际之间存在个性化差异的重要原因与心智基础,个体的人格特征有助于身份识别。

“目前我们已经给超过两万有自杀意念的用户发送过私信,收到回复的比例超过15%,且绝大部分回复都很正面。”朱廷劭表示。

图2.手腕和脚踝数据的三类情绪分类准确率

朱廷劭团队的研究中,在征求用户同意的情况下,随机选取547名微博用户作为被试者,下载其微博行为记录,并提取839个行为特征作为预测变量;同时,对全体被试施测大五人格问卷,获取其在各人格维度上的得分作为结果变量。

以往的心理危机干预停留在“被动等待”的情况,需要对方主动寻求干预,或是出了问题再干预。“通过网络数据的分析和预测模型,能够把介入时间大大提前。”朱廷劭表示。

他们利用支持向量机与Pace回归算法分别训练基于微博行为的人格计算模型。

采访中,朱廷劭坦言“当时没想这么多”,研究本意是把社交媒体的心理特征预测拓展到自杀,却一路做起心理危机干预平台又走到了线下。谈及后续研究,朱廷劭表示“计划扩展网络数据的采集范围,不仅局限于微博。同时集成线下更多的志愿者资源,提高干预的效率”。“我们的目标是充分利用网络数据,结合机器学习技术,实现对网络用户心理危机状态的及时识别,希望把干预尽量前移。”朱廷劭说。

“研究结果表明,基于微博行为的人格计算模型拥有良好的测量属性。”朱廷劭说。利用支持向量机模型,微博行为对各人格维度高低得分组被试的分类精度达到84%~92%;利用微博行为建立的回归模型,基于微博行为的人格预测结果与基于自评问卷的人格测验结果之间的相关系数达到0.48~0.54。这表明,通过微博行为来预测用户的人格特征是完全可行的。

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

再有,针对心理健康的问题,朱廷劭团队使用新浪微博数据建立心理健康预测模型。利用被试的微博数据,并用机器学习的方法建立模型,通过模型计算得出被试的抑郁状态评分。

他们抽取1万个已签署知情同意书的新浪微博用户,并施测抑郁测评问卷;同时提取其内容与行为两方面建立特征,建立了心理健康的回归预测模型。结果表明,预测模型值与真实值的相关系数接近0.4,达到中等相关水平。

其次是主观幸福感。指人们对其生活质量所作的情感性和认知性的整体评价。他们采集了1785名已签署知情同意书的用户作为被试者,其中649名男性、1136名女性;采用不同的特征集合建立了主观幸福感的预测模型。

研究结果表明,使用行为特征、内容特征,同时加入年龄、性别、收入和受教育程度等统计信息特征,可以达到最优的预测效果。模型相关性可达到0.31~0.54,表明利用微博数据预测得到的用户幸福感是可行的。

最后一个研究内容是社会态度。根据先前研究的经验,将社会态度分为四方面的指标,分别为社会状况评价、社会风险判断、经济发展信心和对政府执政的满意程度。

该研究团队在广东省开展用户实验,并采集了2018个已签署知情同意书的合格样本,利用微博数据,采用多任务回归进行群体社会态度的预测。

预测结果和标注结果的平均相关系数达0.41,平均预测误差率为15.5%。本研究利用网络数据的可回溯性,能够描述指定区域群体社会态度随时间的变化情况。

在社会态度预测结果的基础上,利用微博数据计算预测出的区域社会态度与宏观经济指标高度相关,表明微博预测模型的有效性。具体来说,将结果与广东省各地市年度经济指标进行相关性分析。

“结果显示,地方经济满意度和经济指标显著相关,而生活满意度、收入满意度、社会地位满意度以及国家经济满意度则为弱相关。社会消费品零售总额和批发零售贸易业零售额与社会公平满意度正相关。”朱廷劭解释道。

朱廷劭团队用时序分析技术预测社会心理发展趋势,并预判网络群体事件发生的风险指数,通过多种如新闻媒体等渠道,得到某地发生的群体事件。

针对群体事件数量少的情况,朱廷劭团队综合采用多种机器学习方法,利用微博数据预测群体事件风险,实现对群体社会态度临界状态的预警,为及时化解可能的群体性事件提供数据支持,助力社会管理创新。

综上所述,社会心理态势的感知变化,可设置特定场景,观察社会心理态势可能的变化趋势。针对不同类型的网络用户,可以甄别其社会心理态势。

“我们研究分析社会心理态势,可以发现并监测社会不稳定因素,提请国家有关部门及时采取措施,化社会不稳定因素于未然。研究表明,开展社会心理纵向研究,可作为数据智囊为社会管理提供更科学、更客观的发展报告。”朱廷劭说。

《中国科学报》 (2014-07-14 第6版 进展)

本文由必威发布于必威betway,转载请注明出处:大数据把脉社会心理态势,心理所利用微博数据

关键词:

最火资讯