上次介绍了以文本数据为对象的多种研究方法,包括内容分析法、扎根理论、文本分析、话语分析,你都搞明白了吗?点击这里回顾选择好了符合需求的研究方法路径,又该如何找到合适的研究工具(给力武器)呢?今天我们就梳理各类型的文本数据分析工具(一口气整理了8种),汇总社科研究中较常见的文本分析软件,对比功能和优劣,快跟选择困难症说拜拜啦。

 

先说结论,敲黑板!到底怎么选择文本分析的研究工具?

  • 首先看研究目的、选研究方法,想要做扎根理论或纯质化研究,优先选择NVivoATLAS.tiMAXQDA,范围缩小到三选一,然后看对软件价格的承受能力,比较个人对使用界面和操作方法的偏好。

  • 想要做文献分析选择免费的CiteSpace,可以对接著名文献资料库的数据,方便友好。

  • 想要做社交网络分析选UCINET,免费、使用门槛低,优点明显,但是中小型数据样本出图效果比较好,大体量的数据可能用起来不那么顺手。

  • 要做内容分析法,尤其是从定性到定量,或者语义分析、文本分析,那么DiVoMiner®是同时可以兼顾的选择!

  • 愿意自己动手、不畏惧自学编程、不怕困难不怕繁琐的朋友,毫无疑问建议试试看PythonR语言,功能强大,一剑在手,达到高阶的文本分析和数据统计效果不用愁。
根据各产品的介绍官网公开信息,从适用的研究理论/场景、基本功能、编码方法、操作难易、支持的数据格式、产品形式、处理数据量、语言兼容和费用等方面汇整了软件/平台的情况,比对之中看出何者更适合。

下图内容较多,可以下载图片后旋转查看。

 

看完对比图,可以发现,各路工具的本质区别是定位不同,设计时采用的方法论和理念不同,要根据具体的研究目的和文本处理的需求来选择合适的工具。不同工具呈现出迥异的功能风格。典型的文本处理软件,如NVivoATLAS.tiMAXQDA的设计理念则较为接近,适合做扎根理论,优势在于分析无结构的访谈资料,侧重在质化分析框架,也可以用在混合研究方法中,编码架构由下而上。而DiVoMiner®主打文本大数据挖掘与分析平台,以大数据技术辅助内容分析法为核心,采用自上而下的编码架构。CiteSpaceUCINET分别是用于文献分析网络关系分析两种细分研究领域中,都是以特定类型的数据为分析对象(文献数据和社会网络数据)。PythonR语言则是另一类研究工具的代表,属于编程语言,功能强大,对用户的基础编程技能要求较高。

 

在使用门槛方面,DiVoMiner®NVivoATLAS.tiMAXQDACiteSpaceUCINET操作上相对傻瓜,界面友好,不需要编程技能也会用。而Python的学习难度相对最大,尤其是对于计算机编程能力普遍不够强的社科研究者来说,学习Python需要决心、恒心和毅力,当然学会了就像开挂,可以自己写出程序的还是很有成就感的!

各类工具的使用教程资源的丰富程度虽有不同,但上述工具基本上都可以找到在线的视频教程。NVivoATLAS.tiPython有大量的网络视频教程,甚至有系统的付费课程。但像MAXQDACiteSpaceUCINET的教程主要是来自其官方的文字版教学指南,也有一些热心网友在B站或知乎上分享这些软件的基本教程。

DiVoMiner®在官网上提供自带的免费教程和指引,学习成本极低,上手很快,3小时就能学会基本流程用法。所以,在工具使用的教学资源上,大家是无需担心的,有心学就不用怕啦,总能找到学习的富矿!

 

产品形式方面,上述工具基本都是PC软件,只要有电脑设备就可以使用,无需考虑网络环境。但是当遇到更换电脑设备时,就需要考虑数据保存及导入的问题。由于是安装软件,所以对于电脑配置有一定要求,当数据量过大时,也可能会出现不稳定状况(电脑掉链子,数据丢失,这种痛有没有经历过?)DiVoMiner®是云平台,只要有网络,就能够实现随时随地可以打开浏览器开始做研究,处理数据速度快,摆脱了单机设备的运算能力的限制,突破大数据计算的天花板。

 

看完之后,相信对各类常用的文本数据研究工具已有一定的了解,选择一款最适合的研究工具为你的学术之路保驾护航吧~