我国出版领域电子书研究前沿的知识图谱分析

发布时间:2018/11/30 11:22:28 点击量:663

原创: 郭晶

本号系《出版发行研究》与《出版参考》联合运营

本文刊登于《出版发行研究》杂志2018年10月刊

摘要:为了全面把握我国电子书研究的发展脉络,本文以中国知网数据库1993—2017年间新闻传播学科下电子书文献题录为数据来源,利用文献信息可视化软件CiteSpace对其进行计量分析,通过对研究热点的梳理和突变词的分析,结合社会环境、媒介技术等因素,归纳电子书研究热点的发展规律。

关键词:电子书 研究前沿 知识图谱

中图分类号:G231


数字出版是当下出版业发展的着力点,电子书作为数字出版的重要阵地,不仅加快了传统出版业从理念转变到战略选择的双重变革,也带来了媒介融合趋势下数字出版发展的新机遇。当下,关于电子书的研究已盈千累万,宏观产业、中观企业、微观产品均有深入探讨;也有学者对电子书的相关主题进行总结式的全景关照,如关于电子出版物、数字出版物、电子阅读器、电子阅读需求的综述等;还有学者采用文献计量、共词分析等方法对电子书的研究进行量化分析。


本文计划在已有研究的基础上,用可视化计量分析工具呈现电子书的研究前沿,使研究实现主观分析与客观计量的结合。所谓研究前沿即代表研究领域的最新研究进展或动向,关于研究前沿的定义目前尚无定论,有三种代表性观点,第一种是将一组高被引文献定义为研究前沿,第二种是将一组施引文献定义为研究前沿,第三种是将突发或热点主题定义为研究前沿[1]。考虑到本文以文献关键词和主题词为研究重点,故而选用第三种研究前沿的界定,即陈超美博士的观点,认为研究前沿是一组突现的动态概念和潜在的研究问题[2]。为此,本文从高频关键词和突变词两方面入手,既展现电子书研究的总体变化趋势,又细化各时期研究热点,进而梳理电子书研究前沿的发展规律。


一、数据来源与研究方法

本文的数据源是中国知网(CNKI)的“中国学术期刊网络出版总库”,并按照新闻学与传播学下的CSSCI来源期刊进行筛选,获得样本文献。在此基础上,利用CiteSpace进行可视化分析。


1. 数据来源

本次统计的检索日期是2017年12月27日,以中国知网(CNKI)的“中国学术期刊网络出版总库”为数据源,为了保证检索结果的全面性,检索条件设定为:学科=出版and(篇名=电子书or关键词=电子书or篇名=ebook or关键词=ebook or篇名=电纸书or关键词=电纸书or篇名=电子书籍or关键词=电子书籍or篇名=电子图书or关键词=电子图书),根据此检索条件共得到7786篇文献,在此基础上查重、筛选并排除新闻报道、会议通知、访谈等非研究型或无关键词的文献。为了保证文献来源的规范性、权威性和主题相关性,本文选取新闻学与传播学下的CSSCI来源期刊对已有文献进行过滤,共得到843篇有效文献。


2. 研究方法

本文采用CiteSpace软件(版本号5.1.R8)对我国出版领域电子书的研究文献进行可视化计量分析。CiteSpace是一款文献分析和可视化软件,可以用来分析知识领域中的新趋势。本研究基于CiteSpace进行关键词分析和词频突变检测,梳理国内出版领域电子书研究的演进脉络和热门主题。


二、研究热点分析

本文有关电子书的研究热点分析主要围绕关键词展开,包括高频关键词的统计分析和分时期分析两部分。


1. 高频关键词分析

关键词是研究主题的凝练概括,高频关键词一定程度上反映了特定领域内的研究热点。本部分将收集到的843条文献数据以Refworks格式导出。为了减少聚类效果的干扰因素,本部分对关键词做了合并同义词、去除通用词与泛义词、保护新颖关键词的处理[3]。然后使用CiteSpace进行数据转化,时间选取为文献覆盖的时间区间1993—2017,由此可以得到出版领域电子书研究的热门关键词聚类图(图1),其内容整理可得表1。





综上可以发现,出版领域有关电子书研究最集中的主题是数字出版,排名前二十的关键词中有半数以上的关键词与数字出版相关,涉及出版物形式、出版方式、信息技术以及热门研究实体等主题。围绕电子书展开数字出版商业模式的探索,不仅加快了传统出版业的转型,而且也促进了企业间的业务合作,为出版业注入市场活力。


其次是传统出版,包括传统出版企业、出版产业链、数字化转型、纸质书等主题。电子书是传统出版业在数字化转型中着重探索的方向,技术发展促进了出版业的流程再造,这既能使产业链由分散趋向融合,也能促使专业化分工朝纵深方向发展,专业出版、教育出版、大众出版领域分别呈现出不同的电子书发展路径。


再次,电子书的出版方式、发行方式、版权保护是出现频次较多但未反映到关键词表的研究主题。数字技术和互联网络对出版、发行环节的介入,催生出自助出版等新型电子书出版方式和网上书店、数字图书馆等电子书分发渠道。版权保护技术为基于复本数模式的电子书价值的实现提供保障,方正阿帕比在破解版权保护难题上探索出富有成效的实践成果,并得到了广泛应用。


可见,目前国内对电子书的研究多集中于宏观有关数字化转型的产业发展层面,微观层面研究以出版方式、发行方式、版权保护、电子书格式、电子书平台等研究居多。


2. 各时期热点分析

文献数量一定程度上反映了特定主题的研究规模和学界关注度。为了把握电子书研究的历时性规律,本文将收集到的文献按年份进行统计,得到研究文献数量随时间变化图(图2)。从中可以发现,出版领域电子书的研究呈现历时长、跨度大的特征,且具有明显的时期区隔。1993—2008年研究呈波动发展态势,2008—2012年研究高速增长,2012年以后研究整体呈下滑趋势。



为了更准确地表现各时期的研究热点,在Cite-Space里设置不同的时间分片(Time Sliceing),得到了不同时间段的高频关键词表和关键词图谱(表2)。



图2的文献数量时间变化趋势可以看出2008年和2012年是电子书研究的两个重要时间节点,而这两个年份也正是电子书市场发展的关键节点。结合表2各阶段的高频关键词,可以对各阶段的热点变化进行归纳。


2008年以前,国内的电子书产业整体处于产品研发阶段,以硬件设备为主,主要面向企业用户,销量有限。电子书研究主要被纳入网络出版的范畴,电子书作为一种新的出版形态被讨论。


2008年,汉王电子书的推出,成为电子书市场兴起的转折点。之后,技术生产商、电信运营商、内容提供商等各路企业纷纷进场,争夺市场主导权。在市场因素的影响下,商业模式决定数字出版的发展前景,电子书的研究逐渐被纳入数字出版商业模式的分析中,其中,版权保护、格式标准、定价策略是重点关注的主题。


2012年之后,受阅读器市场饱和、移动阅读兴起、阅读群体转移等因素影响,我国电子书产业不仅增长率下滑,在数字出版产业的占比也逐年下降。电子书产业寻求新的增长点,电子书研究在沿着数字出版的方向继续深入的同时,也更加细化,自助出版、云出版、移动出版等出版方式备受关注,交互式电子书、增强型电子书等新型出版形态不断涌现。


结合图2和表2,可以发现国内出版领域电子书研究呈现以下特点。

首先,就研究主题的关注度而言,数字出版和传统出版是电子书研究持续关注的热门主题。2012年以前,电子书的关注度高于数字出版的关注度,随着电子书市场的回落和新型出版形态的兴起,电子书研究在数字出版和传统出版数字化转型的研究中不断深化。


其次,就研究主题的关联性而言,高频关键词之间有较强的衍生关系。研究初期的“网上书店”“出版发行”等市场主导的商业行为逐渐演化为对更为全面的“商业模式”的关注。“电子出版”逐渐被“数字出版”取代,体现了对二者本质认识的深化以及未来发展的指向。“出版模式”向“自出版”“云出版”等方向细化,体现了技术推动下实践过程中的出版创新。


再次,就研究主题的指向性而言,具有明显的实践导向。一方面以现实实践为研究来源,如传统出版企业“辽宁出版集团”、数字出版企业“方正集团”、网络文学企业“盛大文学”均是热门的案例分析对象;另一方面借鉴国外实践经验,除了出现在关键词表中的“美国”,英国、日本、德国的出版业态也是学界也较为关注。


最后,就研究主题的时效性而言,能够紧跟业界发展动态。不同于学界研究推动业界实践或业界发展吸引学界关注的先后关系,出版领域电子书学界研究的关注度与业界发展趋势基本吻合,说明电子书研究能够紧跟市场发展动态和产业进展,具有反映现实、指导实践的积极意义。也说明电子书产生于技术研发的实践中,研究热点会随媒介环境和现实需要的变化而变化。


三、突变词分析

突变词是指某些年份发表文献中骤增的专业术语,适合表征研究前沿[4]。所谓突变分析就是分析某种类型的数据源在某段时间内突然产生的现象,突变分析可以形象展示研究热点随着时间的变化情况,通过对主题词词频变动趋势的考察可以识别学科领域的研究前沿。为了探究电子书领域研究热点的变化规律,本研究在基于关键词热点分析基础上,通过分析主题词的突变特征,梳理了电子书研究的特点。


CiteSpace具有突变词分析功能,为了得到更好的效果,本部分利用CiteSpace对文献文本进行分词处理,增加待分析词库的数量,在Cite-Space的TextProcessing模块选择Term Source为Title、Abstract、Author Keywords、Keywords Plus,得到1674个可供分析的词汇,经分析后得到73个突变词(图3)。图中Begin表示突变开始的年份,End表示突变结束的年份,Strength表示突变强度,数值越大则强度越大。



1. 突变特征分析

突变词的突变特征主要从两方面呈现,其一是突变强度,其二是持续时间。通过分析突变词的突变特征,可以将其分为三类:

第一类,突变强度大,持续时间短,这类词是某时期突发性的研究热点。突变强度较大,说明该类词是由具有影响力的现实因素引发;持续时间短,说明该类词属于过渡性热点,会融合或转移至其他研究热点中。“电子书”“阅读器”“纸质书”便是该类词的代表,其突变强度均大于10,持续时间为1年。2010年是我国电子书产业迅猛发展的一年,2010年底,国内电子书品牌数量已近30家,产品数量超过120款[5],呈现出百花齐放的竞争格局,“电子书”“阅读器”成为该时期的突变词是由火爆的市场态势引发。随着阅读器销量下降、用户转移和纸质书价值的再认识,关于阅读器、电子书的研究也逐步向数字出版、移动阅读等方向转移。


第二类,突变强度较大,持续时间较长,这类词可以看做是某时期较为成熟的研究热点突变权重较大,说明该类词的突变经历了一定的演变过程;持续时间较长,说明该类词对电子书的影响较大,值得深入研究。“网上书店”“出版发行”“出版市场”“电子出版”“网络出版”是该类词的代表,其突变强度均大于5,持续时间均在5年以上。“网上书店”“出版发行”“出版市场”体现了市场因素对传统出版发行方式的影响,随着市场化的深入,该类突变词逐渐被纳入商业模式的讨论之中。“电子出版”“网络出版”与“数字出版”在概念上存在交叉,随着技术的不断进步,人们对概念的认识不断深化,从桌面出版、电子出版、网络出版、手机出版,更多表现了数字技术在出版某一流程或介质上的应用,数字出版概念的提出更为本质地概括了出版过程的技术属性,也逐步为学界、业界所认同。


第三类,突变强度一般,持续时间较长,这类词是某时期较为稳定的研究热点。突变权重一般,说明该类词涉及的是细分主题,难以聚集形成规模;持续时间长,说明细分主题具有持续研究的价值。“计算机公司”“阅读软件”“数字图书馆”“原创文学”“按需印刷”“自出版”等是该类词代表,其突变强度均小于5,持续时间均在5年以上。该类词从研究对象上看,分别对应电子书研究的技术、内容、产业等主题;从时间上看,多出现在2008年以前。迭代更新的媒介技术和瞬息万变的市场环境减弱了研究热点的稳定性,更多突变强度一般,持续时间短的研究主题涌现。


2. 主题特征分析

通过分析突变词的内容特征,可将突变词的研究主题划分为技术研究、内容研究、产业研究、市场研究四个维度。


技术研究方面,有对技术本身的研究,如“数字出版技术”“电子纸”“云计算”“大数据”,也有对技术企业的研究,如“技术提供商”“北大方正”等。这类词的突变强度一般,持续时间不一,对具体技术形态的研究一般持续时间较短,视现实情况的变化而有所不同。电子书是科技驱动的产物,在技术研究方面紧跟最新成果才能更好地指导实践。


内容研究方面,突变词表中与内容研究直接相关的关键词有“电子书籍”“电子杂志”“音像出版物”“网络图书”等,其突变强度不一、持续时间不一,尚未有规律性发现,但是通过梳理文献发现,专门对电子书进行内容研究的文献并不多,意味着学界更多地将对内容资源的重视融入到了对出版本质的认识和产业发展层面。


产业研究方面,电子书领域对产业方面的研究较多,涉及出版形式、发展方式、实体案例三类。出版形式如“互联网出版”“跨媒体出版”等,发展方式如“数字化转型”“转型”等突变词,虽突变强度一般,但是具有一定的持续性,说明出版形式、发展方式的转变需要一定的时间。2008年之后尚未出现有关出版形式的突变词,部分可归因为更新迭代的技术带来的多样化出版形式分散了研究主题的集中度。发展方式的突变词多出现于2008年之后,体现了出版形式向发展方式融入的趋势。实体案例方面,“辽宁出版集团”“高等教育出版社”“汉王科技”“盛大文学”“施普林格”等分散出现于各个阶段,其突变强度和持续时间依企业发展状况而不同。

市场研究层面,商业模式突变词是较为集中的主题。2008年之前,“网上书店”“出版发行”“出版市场”等突变词,突变强度大,持续时间长,说明电子书的市场研究尚处于初步市场化的探索期。2008年之后,“商业模式”“盈利模式”等突变词虽然突变强度和持续时间一般,但是通过梳理文献可以发现,出于完善商业模式目的版权保护、格式标准、定价策略、营销方式等研究增多,且具有明显的利益指向。


四、结语

本文通过可视化分析,展示了国内出版领域电子书研究的研究热点及特点。通过对主题词的突变分析,梳理了电子书研究热点的变化趋势。可以预测,未来出版领域内电子书的研究的热点将在深度和广度两个方面继续扩展。一方面会在数字出版的范畴内加强对电子书制作、传播、销售、使用等细分主题的研究;另一方面,会加强与新兴技术的关联研究。


从整体趋势来看,国内出版领域内电子书的研究数量正在逐年减少,但并不意味着对电子书的关注度有所降低,而是体现了电子书在实践过程中与多元媒介形态的融合和研究过程中,回归对出版本质的理性认识。电子书出现之初,进入产业链的各个参与者纷纷抢占制高点,对技术的追求使电子书逐渐偏离其出版属性。不可否认,技术是电子书发展的先导,但并不意味着技术商可以主导电子书产业的发展。媒介融合背景下,单个成员、单一节点难以主导整个产业链的发展。行业之间、企业之间相互选择、相互合作的局面正在形成。


参考文献

[1]郑彦宁,许晓阳,刘志辉. 基于关键词共现的研究前沿识别方法研究 [J]. 图书情报工作,2016,60(4).

[2]Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the Association for Information Science and Technology, 2006, 57(3): 359-377.

[3]钟伟金. 共词分析法应用的规范化研究——主题词和关键词的聚类效果对比分析 [J]. 图书情报工作,2011,55(6).

[4]Morris S,Chen C.Visualizing Evolving Networks:Minimum Spanning Trees Versus Pathfinder Networks[J].IEEEComputer Society Press,2008:67-74.

[5]黑红武. 基于Bass模型的中国电子书(EPD)市场扩散研究[D]. 山东大学,2011.

(作者单位:河南大学新闻与传播学院)

本文系国家社会科学基金青年项目“融合进程中的电子书出版产业组织研究”(项目编号:17CTQ036)的阶段性成果。


联系电话:周老师13807916629 Email:1528475890@qq.com

通讯地址:武汉研究中心:湖北鑫华清教育研究院武汉中心洪山区野芷湖西路

联系电话:周老师13807916629 Email:1528475890@qq.com

通讯地址:南昌分院:南昌市昌北经济开发区玉屏东大街299号清华科技园C102