Greining samfélagsbreytinga með Google: Partur 1

Google hefur gefið út ótal öpp sem ég hef ekki tölu yfir. Eitt af forritunum sem þau hafa gefið út, sem ég hef mjög gaman af því að leika mér í, heitir “Google Ngram viewer”. það er tól sem er virkilega hægt að gleyma sér í og er byggt á öllu bókasafni Google (sem eru rúmlega ⅙ af öllum bókum í heiminum og vex eftir því sem þau halda áfram að skanna).

Hvað er Google Ngram Viewer?

Google Ngram Viewer virkar þannig að maður getur skrifað orð eða orðasambönd í leitarboxið og fengið þá plottað út tímabil á grafi yfir hversu oft orðin birtast í bókum sem að Google notar sem “sample”. Grafið sýnir trendlínu sem gefur hlutfallslega mynd af birtingarfjölda orðsins eftir árum. Sjá má meira um hvernig tólið virkar hér. Áður en áfram er haldið mælum með að lesa greinina í borðtölvu eða í „desktop mode“ í farsíma til að sjá gröfin í fullri stærð. Einnig skal hafa í huga að eftir 1900 á gröfunum birtast árin á x ásunum sem 12:28 hjá sumum en nákvæmt ártal er hægt að sjá með því að fara með músarbendilinn yfir grafið.

Það er alltaf gaman að taka kreppu sem dæmi

Hér er gott dæmi um frasann “financial crisis” (Ath. árgildin á gröfunum hér að neðan hætta að birtast einhverja hluta vegna eftir árið 1900 í Chrome og Firefox en virka í Safari. Aftur á móti er hægt er að fara með músarbendilinn í öllum vöfrum yfir grafið til að sjá nákvæmt ártal).

Stóra kreppan var 1929 til 1939. Samkvæmt grafinu þá sjáum að frasinn byrjar að birtast oftar í bókum í kringum árið 1928 og nær hápunkti 1935 þegar kreppan mikla skall á. Tíðni frasans byrjar síðan að dala fram til ársins 1944. Þar næst tekur hann stóran kipp sem byrjar 1994 og nær hápunkti 2002. En eins og flestir vita var “dot.com” bólan svokallaða í kringum það tímabil, eða frá 2000 til 2002 (List of recessions in the United States). Einnig er hægt að leita að sama frasa og leita þá eingöngu í “bresk enskum” bókum eða “amerískri ensku” bókum, og þá geta gröfin mögulega litið aðeins öðruvísi út.

Kína og vestrið

Einnig er hægt að leita í bókum á öðrum tungumálum eins og frönsku, þýsku, ítölsku, spænsku og hebresku svo fátt eitt sé nefnt. En einnig er hægt að leita í kínverskum bókum. Á grafinu að neðan erum við búin að plotta hversu oft orðið 西方 eða “xifang” kemur fyrir. Xifang merkir “vestrið” / “vesturlönd”. Það sem þarf að hafa í huga í því samhengi er að eftir að kommúnistaflokkurinn tók yfir stjórn Kína af Chiang Kai-shek, þá (ef að við einföldum stóra og mikla sögu) voru vestræn gildi og kapítalismi litin hornauga þar í landi. Þannig má gera ráð fyrir að allt tal um vesturlöndin, og hvað þá skrif, hafi ekki verið leyfð af stjórnvöldum nema í mjög takmörkuðum tilgangi. Grafið hér að neðan sýnir hversu oft orðið kemur fram í kínverskum bókmenntum.

 

Orðið kemur fyrir af og til frá árinu 1800 en árið 1976 tekur það af stað í bókum eins og enginn sé morgundagurinn. Það vill svo til að árið 1976 lést Mao Zedong og Deng Xiao Ping tók við völdum kommúnistaflokksins. Deng Xiao Ping byrjaði á því að opna landið til vesturs (Reforms under Deng Xiaoping).

 

Mao Zedong og Deng Xiaoping saman a mynd frá árinu 1957
Deng Xiaoping opnaði Kína hægt og rólega eftir að Mao Zedong féll frá

 

Ris Tchaikovsky í bókum

Ef við skoðum nágrannaland Kína, Rússland, þá má einnig finna áhugaverða hluti. Ef við plottum út frá rússneskum bókmenntum nafnið Чайковский, sem er klassíski tónlistamaðurinn Tchaikovsky eins og við þekkjum hann, kemur upp þessi mynd.

Tchaikovsky, í Rússlandi, St. Petersborg árið 1887
Tchaikovsky var frægur fyrir mörg verk svo sem Hnotubrjótinn, Svanavatnið og 1812 Overture.

Nafnið tekur kipp í bókum árið 1916, en þess má geta að “Pyotr Ilyich Tchaikovsky” dó árið 1893. Eins og oft er talað um þá verða sumir listamenn frægir eftir andlát sitt. En það vekur samt upp spurningu: Af hverju tekur nafnið svona mikinn kipp árið 1916? Einmitt í kringum 1916 – 1917 hefst rússneska byltingin og Tsarinn fellur frá völdum.

En áður en við tengjum kenningar saman þá er best að byrja á því að ganga úr skugga að það hafi hreinlega ekki verið bókabann fyrir tíma byltingarinnar. Við skoðum þá bara annað dæmi og leitum að algengu nafni eins og “наполеон” sem þýðir “Napoleon”

 

Nafnið Napoleon fær birtingar fyrir tíma byltingarinnar þannig að útilokum bókabann í bili og höldum áfram.

Næst er spurningin: Er verið að birta nafn tónskáldsins “Tchaikovsky” eða byltingarsinnans “Tchaikovsky”? Til að finna út úr því getum byrjað á því að leita að fullu nafni tónskáldsins “Pyotr Ilyich Tchaikovsky” eða “Петр Ильич Чайковский” og séð hvort svipuð mynd komi upp.

 

Plottið er mjög svipað, þ.e.a.s. tekur kipp árið 1916 og sýnir svipað trend en samþjappaðra.

Við getum einnig skoðað þetta betur með því að kynna okkur hvaða orðasamsetningar eru aðallega birtar með nafninu “Tchaikovsky”, með því að bæta við stjörnu * við á eftir nafninu í leitinni. Þá fáum við þessa mynd:

 

Vinsælasta orðasamsetningin er “Чайковский и” sem þýðir “Tchaikovsky og”. Ef við að förum einu skrefi lengra og leitum að “Tchaikovsky og *” fáum við þessa mynd:

Þýðingin á orðunum út frá vinsældum eru hér að neðan og eru (í sömu röð og á grafinu ef þið farið með músarbendilin yfir orðasamsetningarnar:

  1. T.d. Tchaikovsky
  2. Tchaikovsky og leikhús
  3. Tchaikovsky og hans
  4. Tchaikovsky og aðrir
  5. Tchaikovsky og Róm
  6. Tchaikovsky og Beethoven
  7. Tchaikovsky og töframaðurinn
  8. Tchaikovsky og ballett
  9. Tchaikovsky og Rachmaninov
  10. Tchaikovsky og Mussorgsky

Stóra spurningin er hvort það sé tilviljanakennt að nafnið Tchaikovsky byrji að birtast í bókum á sama tíma og Bolsjévíka-byltingin verður að veruleika, eða hvort þetta tvennt sé tengt. Kannski að einhverjir sagnfræðingar geti frætt okkur betur um það.

Og nú að allt öðru…

En við skulum færa okkur frá Rússnenskum bókmenntum og tónlist og skoða aftur bókmenntir á ensku. Ef að við förum aðeins út fyrir kassann og leyfum okkur að dreyma stærri drauma, þá getum við mögulega fundið falin trend. Ef við skoðum orðasamsetningarnar “live in the country” og “live in the city” fáum við þessa mynd

 

Mér finnst margt áhugavert við myndina, en áhugaverðast myndi ég segja að sé orðasamsetningin “live in the country”. Birting orðasamsetningarinnar fer niður á við í kringum aldamótin 1900, en það vill svo til að ameríska þéttbýlismyndunin náði hámarki á árunum 1910 til 1920. Þ.e.a.s. fleiri bjuggu þá í fyrsta sinn í borgum en í sveit (Urbanization in the United_States), sem er skemmtileg tilviljun. Trendið fer niður á við hægt og rólega en byrjar síðan að byggjast aftur upp árið 2004. Það er einmitt árið þegar allt breyttist og efnahagsbólan byrjaði að myndast. Hún náði síðan hápunkti og sprakk árið 2008 (Financial crisis of 2007–2008), sama ár og „live in the country“ náði hápunkti.

Google ngram

 

Það er auðvitað alltaf gaman að finna tengingar en hafa ber samt í huga að tenging og fylgni er ekki það sama. Að sama skapi er tólið Google Ngram Viewer ekki fullkomið, en ætti endilega að vera hugsað sem frábært tækifæri fyrir bókmenntafræðinga, félagsfræðinga og gagnagrúskara til að reyna á kenningar sínar og sjá hvort það sé eitthvað til að rannsaka nánar.