Korpusstödda diskursstudier

Corpus-assisterade diskursstudier ( förkortning : CADS ) är historiskt och metodologiskt relaterat till disciplinen korpuslingvistik . Den huvudsakliga strävan med korpusassisterade diskursstudier är att undersöka och jämföra drag av speciella diskurstyper , genom att i analysen integrera de tekniker och verktyg som utvecklats inom korpuslingvistik. Dessa inkluderar sammanställning av specialiserade korpus och analyser av ord- och ordklusterfrekvenslistor, jämförande sökordslistor och framför allt konkordanser.

En bredare konceptualisering av korpusunderstödda diskursstudier skulle innefatta vilken studie som helst som syftar till att sammanföra korpuslingvistik och diskursanalys. Sådan forskning betecknas ofta som korpusbaserad eller korpus-assisterad diskursanalys , med termen CADS myntad av en forskargrupp i Italien för en specifik typ av korpusbaserad diskursanalys (se avsnittet 'i olika länder' nedan).

Mål

Corpus-assisterade diskursstudier syftar till att avslöja icke-uppenbar mening, det vill säga mening som kanske inte är lättillgänglig för blotta ögat. Mycket av det som bär mening i texter är inte öppet för direkt observation: ”man kan inte förstå världen bara genom att titta på den” (Stubbs [efter Gellner 1959] 1996: 92). Vi använder språket "halvautomatiskt", i den meningen att talare och författare gör halvmedvetna val inom de olika komplexa överlappande system som språket består av, inklusive de med transitivitet, modalitet (Michael Halliday 1994), lexikala uppsättningar (t.ex. frihet ) . , frihet , befrielse ), modifiering och så vidare. Författarna själva är, känt, i allmänhet omedvetna om alla betydelser som deras texter förmedlar. Genom att kombinera den kvantitativa forskningsansatsen , det vill säga statistisk analys av stora mängder av den aktuella diskursen – närmare bestämt ett stort antal tokens av den diskurstyp som studeras som finns i en korpus – med den mer kvalitativa forskningsansatsen som är typisk för diskursanalys . det vill säga den nära, detaljerade granskningen av vissa delar av diskursen kan vara möjligt att bättre förstå de processer som pågår i diskurstypen och att få tillgång till icke-uppenbara betydelser.

Målen kan skilja sig åt i andra typer av korpusbaserad eller korpusassisterad diskursanalys; men generellt sett kombinerar sådana studier kvantitativ och kvalitativ forskning och syftar till att belysa diskurser, register, diskursmönster etc. med hjälp av ett korpuslingvistiskt synsätt. Specifika mål och tekniker beror på det relevanta projektet.

I olika länder

  • I tysktalande länder : Banbrytande arbete inom korpusbaserad diskursanalys utfördes i Europa, särskilt av Hardt-Mautner/Mautner (1995, 2000) och Stubbs (1996, 2001). CADS och andra typer av korpusbaserad diskursanalys är inspirerad av detta viktiga tidiga arbete.
  • I Italien : En betydande mängd forskning har utförts i Italien antingen av enskilda forskare eller under beskydd av kombinerade interuniversitetsprojekt som Newspool (Partington et al. 2004) och CorDis (Morley och Bayley eds, 2009). Den har koncentrerat sig på politiskt språk och mediespråk, främst för att en kärna av lingvister vid italienska universitet arbetar vid statsvetenskapliga fakulteter och är alltmer intresserade av användningen av korpustekniker för att genomföra en viss typ av sociopolitisk diskursanalys, inklusive uppdagandet av anmärkningsvärda ideologiska metaforer. och motiv på politiska personers och institutioners språk. Italienska forskare utvecklade också Modern diachronic corpus-assisted discourse studies (MD-CADS) . Detta tillvägagångssätt kontrasterar språket som finns i jämförbara korpus från olika men nyare tidpunkter för att spåra förändringar i modernt språkbruk men också sociala, kulturella och politiska förändringar under modern tid, som återspeglas - och delas mellan människor - i språket. Det är denna italienska forskning som mest använder etiketten CADS.
  • I Storbritannien : Lingvister i Storbritannien tenderar att genomföra korpusbaserad kritisk diskursanalys (CDA). CDA intar i allmänhet en vänsterpolitisk hållning, med fokus på hur social och politisk dominans reproduceras genom text och prat. Denna typ av korpusbaserad forskning förknippades ursprungligen med Lancaster University ( Baker et al. 2008), men har spridits mer brett sedan dess. Sådant arbete studerar vanligtvis diskurser kring särskilda grupper av människor (t.ex. muslimer, personer med funktionsnedsättning) eller koncept/händelser (t.ex. feminism, samkönade äktenskap).
  • I Australien : Korpusbaserad diskursanalys genomförs av ett växande antal australiensiska forskare, oftast på medietexter. En del av detta arbete syftar till att belysa specifika drag hos diskurstyper (nyheter, sociala medier, tv-serier etc.), medan andra arbeten är förankrade i traditionen av korpusbaserad kritisk diskursanalys.

Jämförelse med traditionell korpuslingvistik

Traditionell korpuslingvistik har, helt naturligt, tenderat att privilegiera den kvantitativa metoden. I strävan att producera mer autentiska ordböcker och grammatik för ett språk har det kännetecknats av sammanställningen av några mycket stora korpus av heterogena diskurstyper i en önskan att få en överblick över den största mängden och variationen av diskurstyper som möjligt, i andra ord, av den chimära men användbara fiktionen som kallas "allmänna språket" ("allmän engelska", "allmän italienska" och så vidare). Detta har lett till konstruktionen av oerhört värdefulla forskningsverktyg som Bank of English och British National Corpus . Vissa grenar av korpuslingvistik har också främjat ett tillvägagångssätt som är "korpusdrivet", där vi behöver, grammatiskt sett, en mental tabula rasa för att befria oss från de skadliga fördomar som traditionella modeller utövar och låta data tala helt för sig själv .

Syftet med korpusunderstödda diskursstudier och relaterade tillvägagångssätt är radikalt annorlunda. Här är syftet med övningen att bekanta sig så mycket som möjligt med diskurstyperna i handen. Forskare engagerar sig vanligtvis i sin korpus på en mängd olika sätt. Förutom genom ordlistor och överensstämmelse kan intuitioner för vidare forskning också uppstå genom att läsa eller titta på eller lyssna på delar av datamängden, en process som kan hjälpa till att ge en känsla för hur saker görs språkligt i den diskurstyp som studeras. .

Korpusassisterad diskursanalys kännetecknas också typiskt av sammanställningen av ad hoc specialiserade korpus, eftersom det mycket ofta inte finns någon tidigare tillgänglig samling av diskurstypen i fråga. Ofta används andra korpus under loppet av en studie i jämförelsesyfte. Dessa kan inkludera redan existerande korpus eller kan själva behöva sammanställas av forskaren. I någon mening är allt arbete med korpus – precis som allt arbete med diskurs – korrekt jämförande. Även när en enskild korpus används, används den för att testa data den innehåller mot en annan mängd data. Detta kan bestå av forskarens intuition, eller de data som finns i uppslagsverk som ordböcker och grammatiker, eller det kan vara påståenden från tidigare författare inom området.

CADS som en specifik typ av korpusbaserad diskursanalys

Forskare i Italien har utvecklat CADS som en specifik typ av korpusbaserad diskursanalys och skapat en standarduppsättning metoder:

' En grundläggande standardmetod i CADS kan likna följande:'

  1. Steg 1: Bestäm forskningsfrågan;
  2. Steg 2: Välj, kompilera eller redigera en lämplig korpus;
  3. Steg 3: Välj, kompilera eller redigera en lämplig referenskorpus/korpus;
  4. Steg 4: Gör frekvenslistor och kör en nyckelordsjämförelse av korporna;
  5. Steg 5: Bestäm förekomsten av uppsättningar av nyckelartiklar;
  6. Steg 6: Överensstämmelse intressanta nyckelpunkter (med olika mängd samtext);
  7. Steg 7: (Eventuellt) förfina forskningsfrågan och återgå till steg 2.

Detta grundläggande förfarande kan naturligtvis variera beroende på individuella forskningsförhållanden och krav.

Ett särskilt sätt att konceptualisera forskningsfrågor har också föreslagits i sådana CADS-projekt:

  • Med tanke på att P är en diskursdeltagare (eller möjligen en institution) och G är ett mål, ofta ett politiskt mål:
  1. Hur uppnår P G med språk?
  2. Vad säger detta oss om P?
  3. Jämförande studier: hur skiljer sig P1 och P2 i deras språkanvändning? Säger detta oss något om deras olika principer och mål?

En andra generell typ av CADS-forskningsfråga, som kan ställas till interaktiva diskursdata, har konceptualiserats enligt följande:

  • Med tanke på att P(x) är en viss deltagare eller uppsättning deltagare, är DT diskurstypen, och R är ett observerat förhållande mellan eller bland deltagarna:
  • Hur uppnår/behåller {P(a), P(b)...P(n)} R i DT [med språk]?

En annan vanlig typ av forskningsfråga har konceptualiserats så här:

  • Med tanke på att A är en författare, är Ph(x) ett fenomen eller praktik eller beteende, och DT(x) är en speciell diskurstyp.
  • A har sagt att P(x) är fallet i DT(a)
  • Är Ph(x) fallet i DT(b)?

Detta är en klassisk "hypotestestande" forskningsfråga: vi testar hypotesen att vilken praxis som än har observerats av en tidigare författare i någon diskurstyp kommer att vara observerbar i en annan. Det är en process som vi kan kalla para-replikation , det vill säga replikeringen av ett experiment med antingen en ny uppsättning texter av samma diskurstyp eller av en relaterad diskurstyp, "för att se om [fynd] var en artefakt av en enda datamängd” (Stubbs 2001: 124).

Ett sista exempel på konceptualisering av en CADS-forskningsfråga är följande:

  • Med tanke på att P(x) är en deltagare eller kategori därav, och LF(x) är en speciell språkfunktion:
  • Använder {P(a)} och {P(b)} LF(x) på samma sätt?

Sådan forskning syftar till att fastställa om olika deltagare använder ett visst språkligt drag på samma eller olika sätt. Forskningen kan fortsätta för att försöka förklara varför så är fallet.

En del forskning hittills

Studier som sammanför korpuslingvistik och diskursanalys inkluderar följande:

  • Hur idéer om grupper av människor och ras konstrueras och sprids genom upprepat språkbruk (Krishnamurthy 1996).
  • En studie av tyska lånord på engelska och deras koppling till kulturell stereotyper (Stubbs 1998).
  • En studie av den religiösa retoriken hos amerikanska presidentkandidater (Vincent 2020).
  • Analyser av språket i den euroskeptiska debatten i Storbritannien (Teubert 2000; se även Mautner 2000).
  • Typiska språkstrategier, metaforer och motiv som används av journalister och talespersoner på amerikanska presskonferenser, och hur dessa speglar deras respektive världsuppfattningar (Partington 2003, 2007).
  • Hur förutsägelse sker i ekonomiska texter, det vill säga hur ekonomiska prognoser presenteras och säkras (Walsh 2004).
  • Hur regeringsvittnen i Hutton-utredningen konstruerade sin yrkesidentitet (Duguid 2007, 2008).
  • De typiska språkdragen i amerikanska tv-serier och hur de liknar eller skiljer sig från konversationer utan manus (Bednarek 2010, 2018).
  • Hur talare använder bedömning på Twitter för att skapa delade gemenskaper (Zappavigna 2012).
  • Hur islam och muslimer representeras i brittisk press (Baker et al. 2013).
  • CorDis-projektet. Hur konflikten i Irak diskuterades och rapporterades i senaten och parlamentet, i amerikanska pressträffar och Hutton-utredningen, i amerikanska/brittiska tidningar och TV-nyheter (Marchi och Taylor 2009; Morley och Bayley 2009; Haarman och Lombardo 2008).
  • SiBol-projektet (Siena-Bologna Universities) analyserade skillnaderna mellan två korpus av brittiska kvalitetstidningstexter, den första från 1993 (ca 100 miljoner ord), den andra från 2005 (140 miljoner ord).
  • Intune-projektet 2004-9 (arbetsgrupp för medialingvister). En EU-finansierad satsning för att undersöka hur pressen i Frankrike, Italien, Polen och Storbritannien representerar frågor som rör europeiskt medborgarskap och identitet [ 1] .


En omfattande bibliografi över diskursorienterade korpusstudier sammanställs vid Edge Hill University. För närvarande innehåller den 1120 poster: http://ehu.ac.uk/docsbiblio

Bibliografi

Baker, P. (2006) Använda Corpora i diskursanalys . London: Kontinuum.

Baker, P., Gabrielatos, C., Khosravinik, M., Krzyzanowski, M., McEnery, T. & Wodak, R. (2008) En användbar metodologisk synergi? Att kombinera kritisk diskursanalys och korpuslingvistik för att undersöka diskurser av flyktingar och asylsökande i brittisk press. Diskurs och samhälle 19(3), 273-306.

Baker, P. Gabrielatos, C. och McEnery. T. (2013) Discours Analysis and Media Atttitudes: The Representation of Islam in the British Press. Cambridge: Cambridge University Press.

Bednarek, M. (2010). Språket för fiktiv tv. Drama och identitet . London: Kontinuum.

Bednarek, M. (2018). Språk- och tv-serien. Ett språkligt förhållningssätt till TV-dialog . Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108559553

Duguid, A. (2007) Män på jobbet: hur de på nummer 10 konstruerar sin arbetsidentitet. I Garzone, G. och Srikant, S. (red) Discourse, Ideology and Specialized Communication . Bern: Peter Lang, s. 453–484.

Duguid, A. (2007) Soundbiters Bit. Kontrakterade dialogistiskt utrymme och textrelationer genom Corpus Assisted Discourse Studies. I Fairclough, N., Cortese, G. och Ardizzone, P. (red) Discourse and Contemporary Social Change . Bern: Peter Lang, s. 73–93.

Gabrielatos, C. & Baker, P. (2008). Flykt, smygande, översvämning: En korpusanalys av diskursiva konstruktioner av flyktingar och asylsökande i UK Press 1996-2005. Journal of English Linguistics 36(1), 5-38.

Gellner, E. (1959) Ord och ting . London: Gollancz.

Krishnamurthy, R. (1996) Etnisk, ras och stam: rasismens språk? I R Caldas-Coulthard och M. Coulthard (red), Texts and Practices: Readings in Critical Discourse Analysis . London: Routledge, s. 129–49.

Haarman, L. och L. Lombardo (red) (2008) Utvärdering och ställningstagande i krigsnyheter: En språklig analys av amerikansk, brittisk och italiensk tv-nyhetsrapportering av 2003 års Irakkrig . London: Kontinuum.

Halliday, M. (1994) An Introduction to Functional Grammar , 2nd edn. London: Edward Arnold.

Hardt-Mautner, G. (1995) "Only Connect." Kritisk diskursanalys och korpuslingvistik, University of Lancaster. Online tillgänglig HTTP:< http://ucrel.lancs.ac.uk/papers/techpaper/vol6.pdf >

Marchi, A. och Taylor, C. (2009) Vem slogs och vem/vad slogs det? Konstruktionen av deltagarnas identiteter i Storbritannien och USA rapportering om Irakkriget . I Garzone, G. och Catenaccio, P. (red) I dentities across media and modes: diskursiva prospectives . Bern: Peter Lang.

Mautner, Gerlinde . 2000. Der britische Europa-Diskurs: Methodenreflexion und Fallstudien zur Berichterstattung in der Tagespresse . Wien: Passagen-Verlag.

Morley, J. och Bayley, P. (red) (2009). Corpus-Assisted Discourse Studies on the Iraq Conflict. Formulera kriget . London: Routledge.

Partington, A. (2003) Lingvistiken o . London: Routledge.

Partington, A. (2007) Ironi och omvändning av utvärdering. Journal of Pragmatics 39, 1547-1569.

Partington, A., Morley, J. och Haarman L. (red) (2004) Corpora and Discourse . Bern: Peter Lang.

Stubbs, M. (1996) Text and Corpus Analysis . Oxford: Blackwell.

Stubbs, M. (1998) Tyska lånord och kulturella stereotyper. Engelska idag 14, s 19–26.

Stubbs, M. (2001) Ord och fraser: Corpus Studies of Lexical Semantics . Oxford: Blackwell.

Teubert, W. (2001) En provins i en federal superstat, styrd av en icke-vald byråkrati. Nyckelord i den euroskeptiska diskursen i Storbritannien. I Musolff, A., Good, C., Points, P. och Wittlinger, R. (eds), Attityder mot Europa. Language in the Unification Process , Aldershot: Ashgate, s 45–88.

Vincent, A. (2020) The Religious Retoric of US Presidential Candidates: A Corpus Linguistics Approach to the Retorical God Gap . New York: Routledge.

Walsh, P. (2004) Att kasta ljus över förutsägelser: Insikter från en samling finansiella nyhetsartiklar. I Partington et al. (red), s. 335–48.

Zappavigna, M. (2012). Diskurs om Twitter och sociala medier. Hur vi använder språk för att skapa samhörighet på webben . London: Kontinuum.