中外学者英语学术语篇词块使用的共性与特性
李燕1 姜峰2
1 西安外国语大学英文学院
2 吉林大学公共外语教育学院
摘要:词块是语言地道性的重要标志,亦是连贯语篇的基石,具有明显的语域、体裁和学科特征。本研究采用语料库驱动方法,对比分析应用语言学领域中外学者国际期刊论文中四词词块的使用特征。结果表明,中国学者比英语母语学者更依赖于使用词块来构建学术语篇,基本遵循以of-短语为主的学术写作惯例。结构上,中国学者偏重于小句类词块,而英语母语学者更倾向于短语类词块。功能上,中国学者侧重文本导向词块,以推理、因果和对比标记功能最为突出,而英语母语学者更倾向于研究导向功能,尤其是描述功能词块的使用。研究还发现中国学者学术文本呈现出大量特有词块,这与中西文化差异、英汉两种不同语言以及学术传统有着密切的关系。研究发现对中国英语学习者的词块习得和学术英语写作教学有一定参考价值。
关键词: 词块; 学术语篇; 中外学者; 结构; 功能
研究论文是一种重要的学术体裁,是学科知识创造的主要场所(Hyland2009:67),也是学术交流的典型案例(Duszak1997)。它通常比较简短且具有鲜明的主题焦点,同时展示规约化的立场选择与论辩策略。词块(lexical bundles)作为特定语域中重复出现且分布在一定数量文本中的多词序列(Biberet al.1999),是学术论文篇章构建的基本要素,关乎语篇的可读性与说服力(Hyland2008)。学术语篇中词块的分布频数、结构以及语用功能存在鲜明的语域、体裁以及学科差异(Biber et al.2004;Pérez-Llantada 2014;Durrant 2017;Shirazizadeh & Amirfazlian2021;王芙蓉、王宏俐2015),也是区分学术专家和新手作者的关键指标之一(Hyland2008;李燕、姜亚军2023)。
尽管已有研究试图对比英语作为第二语言(以下简称“二语”)学者与英语作为母语学者的词块使用(如Pérez-Llantada 2014;Salazar2014;Pan et al.2016;Esfandiari & Barbary2017;李梦骁、刘永兵2016;潘璠、胡如蓝2020),但在一定程度上过于强调二语作者的不足,轻视二语作者话语实践的特有性及其文化与学术传统的特质。
鉴于此,本研究自建学术英语论文语料库,探讨中国学者在国际应用语言学权威期刊研究性论文中四词词块的特征,以英语母语学者在相同期刊刊载论文为参考,考察中国学者与英语母语学者在学术语篇中四词词块使用的共性与特性。具体而言,本研究旨在探究:1)中国学者和英语母语学者在学术语篇中对四词词块的依赖程度有何不同?2)中国学者和英语母语学者在词块结构使用方面有何异同?3)中国学者和英语母语学者使用词块的语用功能方面有何异同?
3.1 词块总体特征
表1显示的是中国学者和英语母语学者学术期刊研究论文中四词词块的总体情况。数据表明,中国学者使用的词块类符与形符数皆高于英语母语学者,该结果支持Pérez-Llantada(2014)和Panet al.(2016)等研究结论。然而,一些研究(如Chen&Baker2010;Esfandiari&Barbary2017)得出相反结论,认为英语母语写作者使用词块数量高于非母语写作者。以上不同研究发现可归于其研究语料库构成(如,学者群体、学习者群体以及不同语言背景二语写作者等)和提取标准的不同,如Chen & Baker(2010)比较中国大学生和英语母语大学生的论说文(essay),Esfandiari & Barbary(2017)对比心理学领域的英语母语学者和第一语言为波斯语学者英语期刊论文。表1中类符/形符比率显示,中国学者的词块多样性程度略高于英语母语学者。以上分析得出,相对于英语母语学者,中国学者在构建学术语篇时更倾向于使用四词词块来完成特定交际功能。
表1.四词词块使用情况
我们进一步对两组词块列表中前50个高频词块进行统计分析。中国学者前50个高频词块中有25个(50%)of-短语结构,英语母语学者列表中有31个(62%)。Hyland(2008:52)发现,期刊研究论文中包含重要的of-短语结构,且该结构占前50词块列表的一半以上。对比发现,中国学者总体上符合英语学术写作惯例,然而在该类结构词块的使用方面有待进一步提升。研究还发现,在前50词块中,两组学者共用词块26个,占词块列表类符52%。然而相较于英语母语学者,中国学者显著性少用词块是at the same time (X2=21.815,p=.000)、the extent to which(X2=6.862,p=.009)、in the context of(X2=5.371,p=.020)、in the case of(X2=5.201,p=.023),显著性多用词块是as can be seen(X2=4.487,p=.034)。此外,中国学者高频使用的词块(如we can see that、can be seen from、be seen in table、as shown in figure、as shown in table、a better understanding of、in response to the、in terms of their、of the present study、for the present study)未出现在英语母语学者前50列表中。
3.2 词块结构特征
中国学者和英语母语学者主要使用了短语类词块,其中前者词块使用类符和形符占比分别为76.6%和78.9%,后者分别为85%和85.3%(见表2)。可见中国学者使用短语类词块比例低于与英语母语学者,表明中国学者在学术语篇中对信息密集型语言结构的掌握略有不足。短语类词块在等长表述中比小句类词块能聚集更多信息内容(Halliday1989:61),特别是名词短语类词块在学术语篇中有效表达常见的动作和事件。因此,中国学者对动作或者事件信息需要展开精心整合,对语言单位间关系进行判断并筛选确定词块,用尽可能简短的文字提供给读者丰富的信息。
表2.四词词块结构分布
(注:*p<.05;**p<.01)
表2显示,中国学者比英语母语学者显著多用动词词块和从句词块,尽管中外学者使用这两类词块的类符差别不显著。此外,虽然文献指出二语作者在名词和介词词块的使用上表现出不足(如李梦骁、刘永兵2016;潘璠、胡如蓝2020),但是本研究数据表明中外学者在这两类词块使用上并未有显著性差异。下文将逐一论述中外学者各类词块的使用特点。
3.2.1 名词词块
按照Hyland&Jiang(2018)的分类,名词词块包括名词+of短语和其他名词短语。卡方检验结果表明,中国学者和英语母语学者在名词+of词块上无显著性差异(X2=.517,p=.472)。中外学者的名词+of词块主要是“the+X+of+X”构式,如the end of the、the use of the、theresultsof the、thevalidityofthe,然而他们第二词位名词的使用存在明显不同,英语母语学者列表中的名词(如nature、focus、content、structure)并未出现在中国学者高频词块列表中。此外,英语母语学者比中国学者更多使用了名词后修饰结构词块(如the extent to which、the ways in which、the way in which、the fact that the),其中母语学者使用该类词块的总频数为67,中国学者为33。李燕、姜亚军(2023:58)指出,中外作者在学术语篇中名词后修饰结构词块的差异主要归因于汉英两种语言中关系从句的句法不同。英语语言限定性关系从句(restrictive relative clauses:RRCs)是中心词前置型(head-initial),其基本构式为“RRCs-de-名词”,汉语限定性关系从句是中心词后置型(head-final),其构式为“名词-that-RRCs”。句法迁移是语言迁移的一种,在中国作者学术英语写作中是一种普遍的补偿策略,然而随着语言能力和学术水平的提升,写作者的迁移程度会有所降低。
3.2.2 介词词块
卡方统计结果显示,中国学者和英语母语学者的介词+of短语词块形符数存在显著性差异(X2=5.780,p=.016),在其他介词短语词块(如in/with+of短语)上无显著性差异(X2=1.170,p=.279)。Biberet al.(1999)认为,介词+of短语片段是学术语篇中常用的结构。英语母语学者学术论文中介词+of短语词块有26种共334个,中国学者使用了21种共299个。两组学者介词+of短语词块主要是“inthe+Noun+of”结构,如in the case of、in the context of、in the form of、in the use of、in the field of、in the process of等。该类介词词块的使用能实现结构组织和信息重组等功能,增强学术论文内容整体逻辑的严密性和系统性,使得文本具有更强的可读性。统计发现,中外学者共用词块有13种,中国学者显著性少用in the context of、in thecase of,表明中国学者对该词块的掌握有待进一步加强。其次,中外学者共用其他介词词块有6种,其中at the same time、in the present study呈现出明显差异,即中国学者较少使用了前者,较多使用了后者。中国学者该类词块中50%未出现在英语母语学者列表中(如in response to the、with regard to the)(详见3.1)。此外,中国学者学术语篇呈现出典型的study词块,如of the present study、of the current study、for the present study。
3.2.3 动词词块
相对于英语母语作者,中国作者在学术语篇中更倾向于使用动词词块,尤其是被动词块。如表2所示,中外学者学术英语动词词块呈现显著性差异(X2=7.993,p=.005),中国学者比英语母语学者较多使用了动词主动词块和被动词块,分别占所有词块类型比例的7.0%和3.9%。大量被动词块是中国英语写作者的一种文体特征,其主要原因在于中国学术英语写作教材中强调采用被动语态来确保学术文本的客观性。实证主义认识论认为,语篇权威高于作者权威,强调使用具有客观性的表述方式来减少作者的责任以及作者身份的构建(Hyland2005),被动词块的使用符合实证研究的客观性要求。少数研究(如Bem2004;Cao&Xiao2013)鼓励写作者将被动结构转为更直接的表述方式,并酌情采用第一人称代词和强式动词(strongverb)来实现相关语用功能。更重要的是,通过语料库检索功能发现,中外学者被动词块语用功能也存在很大不同,中国学者倾向于使用被动词块(如can be seen in、be seen in table、can be seen from)来完成文本导向功能,而英语母语学者用被动词块(如can be used to、can be seen as)实现研究导向功能和参与者导向功能。
3.2.4 从句词块
中国学者学术论文中从句词块有12种共146个,英语母语学者文本中有7种共100个,两者使用频数存在明显差异(X2=3.852,p=.0501)(见表2)。本研究进一步对从句结构的次分类发现,中国学者较英语母语学者显著多用that-(X2=8.036,p=.004)、wh-(X2=7.146,p=.008)、as-从句词块(X2=29.372,p=.000)、抽象主题词块(abstractsubject)(X2=7.146,p=.008)、人称主题词块(human subject)(X2=10.700,p=.001),英语母语学者高于中国学者的是there-(X2=8.883,p=.003)、to-(X2=13.604,p=.000)从句词块,但是anticipatory-it(X2=2.825,p=.093)结构词块无显著性差异。值得注意的是,中国学者人称主题词块的使用频数为12,而英语母语学者高频列表中未出现该类词块。对于人称主题词块we的使用主要归因于集体主义取向的中国文化,强调与群体间的相互依存关系,这种集体自我意识在写作特征中会显露出来,体现在第一人称视角的复数形式。通过检索功能发现,中国学者列表中的高频词块we can see that主要是通过引用文本中的数据源来说明结论。然而,英语母语学者使用“tableX/figureX/the data/analysis/result(s)+shows/reveals/demonstrates/indicates that”和“as tableX/figure X indicates/demonstrates”来实现相关语用功能。
3.3 词块功能特征
英语母语学者使用最多的是研究导向词块,其次为文本导向词块和参与者导向词块,而中国学者使用最多的是文本导向词块,其次为研究导向词块和参与者导向词块(见表3)。这一结论总体上支持Hyland(2008)的观点,研究导向词块和文本导向词块是学术语篇中两大主要功能类型。然而,这一结果不完全支持Salazar(2014)和Pan et al.(2016)的结论,他们发现本族语学者和非本族语学者研究论文中第一大词块都是文本导向词块。词块的学科变异可能是造成研究结果不一致的主要原因,这两项研究的语料都是硬科学领域(如电信、生物化学、生物医学),而本研究语料来自于应用语言学领域。
(注:*=p<.05时显著.)
3.3.1 研究导向功能
由表3可见,虽然中外学者使用研究导向词块的类符数接近,但是中国学者使用该功能的词块频数显著低于英语母语学者(X2=3.945,p=.047)。统计发现,研究导向词块主要为名词词块(名词+of结构,名词后置修饰结构)和介词词块(介词+of结构)。结合前文(3.2)结构对比结果,中国学者名词词块和介词词块使用不足导致其研究导向词块总频数明显低于英语母语学者。在研究导向词块中,中国学者使用的描述性词块显著性低于英语母语学者(X2=20.344,p=.000),这与西方研究本位取向以及强调学术研究细节的学术传统有着密切关系。本研究发现,中国学者描述性词块有6种共53个,英语母语学者有10种共103个,共用词块仅1种(the ways in which);中国学者对该词块的使用不仅缺乏形式变体(the way in which),且其数量也远低于英语母语学者(NSE:20;CH:9)。此外,英语母语学者使用了词块the structure of the、the content of the、the focus of the等来描述论文研究框架、研究目的及研究重点等,而中国学者更倾向于使用动词organize被动结构(如is organized as follows)和词块the present studyis来完成这些交际功能。
3.3.2 文本导向功能
中国学者和英语母语学者文本导向词块的类符分别为38和26(见表3),中国学者不仅在词块类符上超过英语母语学者,且在词块频数上呈现显著性差异(X2=4.793,p=.029),表明中国学者具有较强的文本组织意识,更重视学术语篇的布局以及命题间的逻辑建构。在文本导向词块中,两组学者结构词块的显著差异性(X2=84.385,p=.000)最为突出,中国学者的特点为study(如in the present study、of the present study、of the current study),section(如in the next section)和table/figure(如as shown in table、as show in figure、as shown in the)词块的高频使用,然英语母语作者的列表中仅有2种,且频数远低于中国学者。Panet al.(2016)发现,中国学者在电信学科领域期刊论文中结构功能词块的数量远高于英语本族语学者,其突出特点为中国学者高频使用section词块(in the previous section、in the nextsection、in this section we)将读者的注意力引到文章的其他部分来促进文本理解。除结构词块外,中外学者在其他功能类词块的形符数上也存在不同程度的显著差异,中国学者较多使用了推理词块(X2=23.915,p=.000)、因果词块(X2=8.227,p=.004),对比词块(X2=4.102,p=.043),较少使用了附加词块(X2=11.142,p=.001)和框架词块(X2=3.880,p=.049)。
3.3.3 参与者导向功能
中国学者和英语母语学者的参与者导向词块类符数相同(9种),其形符数比较接近(CH:113;NSE:118),然而其类符(CH:11.7%;NSE:13.4)和形符(CH:10.9%;NSE:12.7%)占总词块的百分比存在差异(见表3)。该数据表明英语母语学者比中国学者更侧重于参与者导向功能,更注重语篇中的学术互动。相对于研究导向和文本导向两大功能,中国学者学术语篇中参与者导向词块的使用更接近于英语母语学者。在参与者导向功能中,中国学者较多使用了介入词块,较少使用了立场词块。立场词块是写作者对某一命题或观点表明态度、做出判断而与读者建立恰当关系的一种语言学手段(Hyland2005)。以立场词块中模糊限制标记词块为例,中外学者共有词块为it is possible that,然而英语母语学者该词块的总频数高于中国学者,其主要原因是中西方学术观念的不同。英语本族语者认为社会科学研究存在一定主观性及诸多复杂因素,注重使用模糊限制语来增加命题完整性和学术措辞严谨性,为学术观点讨论留下一定空间。相比之下,中国学者的“作者即权威”观念造成了他们对绝对化程度的控制表述略显不足,也未完全意识到使用模糊限制手段来修饰所提命题或观点是本族语学者表达学术立场的常用策略。介入词块能够帮助作者与读者形成学术互动,引导读者按照作者的预期方式来理解语篇。中国学者介入词块的频数高于英语母语学者,其突出特点为其较多使用了共有词块as can be seen(见3.1),以及其特有词块wecanseethat呈现的汉语迁移特征。
2.1 语料来源与文本处理
本研究自建应用语言学学术英语论文语料库,包括中国学者学术论文库(CH-Academics)和英语母语学者学术论文库(NSE-Academics)。根据Nwogu(1997)的期刊选取标准(即representativeness、reputation、online accessibility)以及Webof Science发布的期刊引证报告,选取国际应用语言学领域具有高影响力的8种SSCI期刊(Applied Linguistics,The Modern Language Journal,Journal of Second Language Writing, English for Specific Purposes,TESOL Quarterly, Journal of English for Academic Purposes,Journal of Pragmatics, ELT Journal)。为反映现时语言特征,所选论文均在2011—2020年期间刊发,共选取80篇研究性论文,语料总量为570,259字符。
参考Wood(2001:78)有关英语母语作者的界定,本研究英语母语作者学术论文选取标准为:1)作者姓名具有英语本族语国家的姓名特征;2)作者隶属单位为美国或者英国的某个研究机构或高校。中国学者学术论文选取标准为:1)写作者为中国大陆作者;2)其隶属单位为中国大陆高校或研究机构。在中国学者研究论文选取过程中发现,少数作者具有在英语母语国家攻读硕士和博士的经历,为更真实地呈现中国学者学术交流中的语言使用,该类作者的论文未被录入研究语料。
所有语料仅限于论文的正文部分,剔除了论文题目、摘要、关键词、参考文献、附录、脚注、图、表、以及文中以段落格式存在的引用文字等部分。文本整理、校对和格式转化后,建成两个小型语料库———CH-Academics(280,441字符)和NSE-Academics(289,818字符)。
2.2 词块提取与处理
词块是在特定语域的若干学术文本中重复出现且其共现趋势大于偶然概率的四词序列,其结构不一定完整但意义相对完整(Biberet al.1999;Hyland2008)。因此,为确保提取词块具有一定代表性和数量合理可控性,本研究分别采用频数标准阙值为每百万词40次、25次和30次,且不少于10%文本范围标准来提取四词词块。根据已提取数量,同时结合Chen & Baker(2010)提出的四词词块可管理数量(约100种),本研究提出使用标准阙值每百万词出现30次以上,且不少于10%学术文本的提取标准。据此标准,使用Antconc(3.5.8)工具实现四词词块自动提取,中国学者语料库(CH-Academics)有94种词块,英语母语学者语料库(NSE-Academics)有79种词块。在对提取词块进行人工核对和剔除(包括特定学科词块、语境词块及重叠词块等)后,分别得到学术词块77种(CH-Academics)和67种(NSE-Academics)。本研究采用卡方检验对中英各类词块进行数据分析,以探究中外学者英语学术语篇的词块使用差异。
2.3 词块分类
本文分别对目标学术词块按形式结构和语用功能进行分类。为更详细地探讨中外学者词块结构的异同,本研究参考Hyland & Jiang(2018:391)的结构分类,包含4个大类(名词类、介词类、动词类和从句类)和15个次分类。词块的语用功能分类采取Hyland(2008)的三分法,即研究导向功能(research oriented)、文本导向功能(text-oriented)和参与者导向功能(participant-oriented)。该分类能最大限度减少类别间重叠的可能性。
基于自建学术英语论文语料库,本研究系统考察了中国学者和英语母语学者在应用语言学领域期刊研究论文中四词词块的总体使用特征、结构类型以及语篇功能的异同。研究发现,相对于英语母语学者,中国学者在学术语篇构建中更依赖于四词词块,其词块多样性程度略高。中外学者高频词块呈现出共性与独特性共存现状,最为突出的是中国学者大量特有词块的使用。两组学者词块结构分布各有侧重,英语母语学者偏重于短语类词块的使用,中国学者更倾向于使用小句类词块。中外学术文本中名词后修饰结构词块的使用有明显差异,这是中国作者汉语语言句法迁移的影响。中国英语写作者倾向于被动结构词块,其主要原因在于中国学术英语写作教材和教学中提倡使用被动语态来确保学术文本的客观性。需要指出的是,部分国际期刊(如Nature)在作者指南中提倡使用主动语态来(如we performed the experiment)写作,因为主动语态能够更清楚传达概念和结果。在语篇功能上,英语母语学者注重研究导向词块和立场词块的使用,而中国学者更偏重于文本导向词块,其差异主要源于不同的中西方学术观念。研究进一步发现,中国学者较少使用了研究导向功能中的描述性词块和文本导向中的附加词块和框架词块,较多使用了文本导向功能中的推理词块、因果词块和对比词块。
本研究结果有着重要的教育启示。首先,在教学中应注重提升中国英语写作者对学术语篇中短语结构词块重要性的认识,加强对短语写作手段的训练,促进英语写作者从小句式到短语式写作的过渡。其次,强调中西文化异同和学术观念的差异,采用语料库索引方式培养写作者恰当使用学术英语词块,提升他们的学术英语写作水平,帮助其写出具有本族语特征和学术化特征的学术英语文本。本文主要探讨了学术论文中四词词块的主要结构和功能,在研究过程中,还发现了中国学者和英语母语学者词块次结构和次功能也存在显著差异,但并未对其进行系统分析,后续研究可对这一现象作专题研究,揭示二者之间更深入的使用差异。
点击“阅读原文”查看知网全文。
文章来源:外语教学