导读:随近百年的进步,内容分析广泛运用在传播学、心理学、政治学、文学、历史学、人类学、语言学等各类学科中,已是社科研究中最重要的研究方法之一。那么问题来了,内容分析法到底要怎么做呢?在大数据背景下,内容分析法如何测量和解释大规模的文本数据?

有的读者认为内容分析法的全部意义就是统计关键词次数,或使用情感分析?[1]不太符合自己的研究需求;还有一些手握大量文本数据的读者,想要通过计算机对文本数据进行分词、编码,找出数据间的内部联系并进行假设检验、进行可视化呈现等等,却苦于编程基础较弱或是没有适合的工具。正是了解各位读者的这些错误的认知和困惑,小编就先带大家一起重温下大数据技术辅助在线内容分析法的内容,一步一步在掌握了研究方法的逻辑基础上,遵循学术规范,按照自己的研究设计,无需编程,做出“好”的文本大数据研究成果!

什么是大数据技术辅助在线内容分析法(BACA)?

内容分析法是社会科学研究方法中的一种对文本内容进行编码、分类、语义判断及形成可供统计分析之用的量化分析方法。它是指一种以系统、客观与量化的方式,来研究与分析传播内容,以测量及解读内容的研究方法。[2]将传统内容分析的操作流程搬到“线上”,结合大数据技术,用网络挖掘、机器学习、自然语言文本处理等实现文本数据的在线处理,使得内容分析法的全部流程在线一站式完成,大大缩短研究时间,提升研究效率,快速产出研究论文。

总而言之,大数据技术辅助在线内容分析法就是把杂乱无章的非结构化文本内容转化成结构化的数据,不仅可对文本数据进行质性的挖掘和解读,还可以解释数据过程(趋势、路径),使用交叉、聚类等方式解释变量之间的差异和关系,获得深度分析结果,回答研究问题、检验研究假设和建立模型。

 

DiVoMiner®简介

DiVoMiner®文本大数据挖掘及分析平台,遵循学术界认可的内容分析法全流程,以大数据技术辅助,一站式完成从数据上载、数据探索、数据检索、数据处理、类目建构、人工编码/大数据算法编码、信度测试到数据统计分析、算法模型、可视化结果全流程。

DiVoMiner®操作流程

上述方法操作流程是把非结构化内容转化成结构化数据的过程,简单来说就是对文本进行分类-赋值-统计分析,符合学术界通用的类目建构-编码-统计分析。当然,科学的研究方法需要严谨、系统的流程,以确保研究结果的有效,因此需结合信度效度的测试。下面这个图就是一个完整的大数据技术辅助在线内容分析流程图。
无颜色填充为传统内容分析法,绿色为计算机辅助内容分析法,黄色为大数据技术辅助内容分析法完成的。由此可见整个大数据技术辅助在线内容分析法[3]都可以在DiVoMiner®文本大数据挖掘及分析平台上进行,在确保研究流程科学、严谨方面,这个平台具有完备的质量控制机制,尤其是编码员间的信度计算程式清晰、自带学术界认可的四种信度计算方法并具有编码追踪功能,可以随时定位编码结果,所有的数据分析结果也可以追踪回溯至原文。

DiVoMiner®操作第一步创建话题

很多读者不明白DiVoMiner“话题”的意思,小编在这里解释下:在注册平台之后,即可创建免费的“学习话题”。在平台上一个研究项目等于一个“话题”。平台上的话题分为三类:学习话题、案例话题和研究话题。

  • 学习话题:学习话题是供学习平台操作使用用途,免费提供。免费学习话题的数据量100条,文件存储空间10MB,类目上限3个,支持1个管理员帐号。不可升级话题,建议只做学习平台流程使用。 

    在创建免费学习话题之后,进入【数据管理】-【总览】页面,可看到提供的示例数据。您可以了解上传EXCEL文档格式数据的结构,也可用示例数据尝试完成整个学习流程。

     

     

    可点击右上角【入门指引】跟随指引和视频进行学习使用。

  • 案例话题:平台还提供了一些案例,供您参考学习,通过已经制作好的案例,您可以直观地看到如何运用DiVoMiner进行研究。
  • 研究话题:当用户觉得学习话题数据量、文件存储空间、类目上限、编码员数量不足以满足研究需求时,可付费使用,具体付费标准请参看平台【购买话题】

 

参考文献

[1]梁海(2020). 内容分析, 从贝雷尔森到涵化理论: 偶尔正经的量化传播学史(九). 互联网挖掘实验室. 取自https://mp.weixin.qq.com/s/Q-1alL-_9fwBAfQtUXQUTQ

[2] Kerlinger, F.N. (1973). Foundations of behavioral research (2nd ed.). New York: Holt, Rinehart & Winston.

[3]张荣显,曹文鸳:《网络舆情研究新路径:大数据技术辅助网络内容挖掘与分析》,《汕头大学学报》(人文社会科学版)2016年,第8期,第111-121页。