Het Russische internet doorzoeken maar je spreekt geen Russisch? Wij kunnen helpen.

“Help.” Photograph by Ali Moradi, April 20, 2010. Halifax, Nova Scotia. CC 2.0. Edited by Kevin Rothrock
“Help.” Foto door Ali Moradi, 20 april 2010. Halifax, Nova Scotia. CC 2.0. Bewerkt door Kevin Rothrock. 

Dit artikel is een deel van een grotere handleiding van RuNet Echo. Het is bedoeld om mensen te helpen te leren hoe je onderzoek doet naar open bronnen op het Russische internet. Bekijk de  volledige handleiding op de speciale projectpagina.

Het uitvoeren van een open-source onderzoek kan moeilijk zijn, en het is een nog grotere uitdaging als je niet in de taal van je onderzoeksonderwerp kunt lezen of schrijven. Maar dankzij het internet is het zelfs met deze obstakels niet onmogelijk om onderzoek te doen in het Russisch. Om dit te kunnen, moet je geduldig zijn en technische kennis hebben over zoekalgoritmen en vertalingen. Deze handleiding helpt je op weg om met gratis middelen het Russischtalige internet te doorzoeken zonder de taal te kennen. Hier kun je ook leren hoe je met de juiste zoekalgoritmen op Google en Twitter bruikbare informatie kunt vinden.

Google Translate

Als je niet of nauwelijks Russisch spreekt is vertalingssoftware een absolute noodzaak als je Russischtalige informatie wil onderzoeken. Google Translate is het meest veelzijdige hulpmiddel om te vertalen, met veel functies die je waarschijnlijk al kent, en sommige waar je wellicht nog niet zo bekend mee bent.

De standaardoptie op Google Translate ken je waarschijnlijk wel: je kopieert en plakt de tekst in het Russisch (of je typt het in het Engels) en je krijgt meteen de vertaling. Je kunt ook het webadres van een site invoeren en dan wordt de hele pagina vertaald in de taal die je kiest.

Als je problemen hebt met het lezen van het Russische alfabet is de “teken”-functie van Google Translate erg handig: met je muis teken je de letters, die vervolgens omgezet worden naar een bewerkbare tekst die te vertalen is. Zie hieronder een voorbeeld met een woord dat op de gevel van een winkel staat: Магнит (“Magnit,” dat “magneet” betekent):

globvoic

Als je de tekst ‘tekent’, geeft Google automatisch suggesties voor woorden die overeenkomen met je tekening. Soms is de eerste suggestie niet altijd de juiste, dus bekijk zeker ook de andere opties. Een andere heel handige functie is dat Google ook cursieve teksten kan herkennen – wat noodzakelijk is aangezien het Russische handschrift erg afwijkt van het blokschrift. Hieronder zie je hoe de woorden до свидания (“do svidaniya,” dat “tot ziens” betekent) in schrijfletters worden herkend.

glovoic2

Afkortingen en acroniemen (letterwoorden)

Net als in het Nederlands kent het Russisch talloze afkortingen en acroniemen. (Een acroniem is een letterwoord, oftewel een afkorting die wordt uitgesproken als een woord, zoals HEMA of NAVO.) De website Sokr.ru helpt je om deze puzzels op te lossen. Voor het ontcijferen van locatie-specifieke taal is deze  Russische Wikipediapagina handig, waarop je veelvoorkomende afkortingen vindt voor diverse plaatsen in het Russisch (steden, dorpen, enzovoort).

Bijvoorbeeld: de volgende tekst komt uit de titel van een video op VKontakte (het Russische Facebook) en is geplaatst door een pro-Russisch videokanaal. Door gebruik te maken van de twee bovenstaande hulpmiddelen is het mogelijk om informatie te ontcijferen, zelfs zonder Russisch te spreken.

г.Донецк Ленинский р-н обстрел РСЗО “Ураган”

Je ziet hier drie afkortingen, die bovendien vaak voorkomen in de beschrijving van video’s die betrekking hebben op het Oekraïense conflict:

A search on Sokr.ru for the abbreviation “г.”
Zoekopdracht op Sokr.ru voor de afkorting “г.”

 

  1. г. Донецк: De eerste afkorting is “г.” Op Sokr.ru vind je dan “город” (stad). Dat is ook de tweede afkorting op de lijst op de Wikipediapagina. Het staat voor de stad Donetsk (Донецк).
  2. Ленинский р-н: Zowel op de site Sokr.ru als Wikipedia staat dat deze afkorting “район” (regio/wijk) betekent. Het staat voor de wijk Lenin (Ленинский).
  3. РСЗО: Dit heeft niets te maken met steden, dus we kunnen alleen Sokr gebruiken. Zo ontdek je dat deze afkorting staat voor “реактивная система залпового огня / ракетная система залпового огня” (letterlijk: reactief systeem van salvovuur / raketsysteem van salvovuur). In het Nederlands zouden we spreken van een “raketlanceersysteem” (de Engelse afkorting is MLRS). In dit geval verwijst het naar het raketlanceersysteem Uragan (“Orkaan”).

De titel van de video is dus “Stad Donetsk, wijk Leninskiy, beschietingen Uragan-raketsysteem”.

 

Zoeken in het Russisch

Het Nederlands heeft geen naamvallen en een behoorlijke vaste woordvolgorde in de zin. Soms voegen we -en of -s toe voor meervoud of bezit (soldaat-soldaten, Jan-Jans) of verandert het persoonlijk voornaamwoord (ik-mij-mijn, zij-haar, etc.). Maar in het Nederlands verandert de vorm van een woord verder niet vaak.

Maar in het Russisch is dat door het naamvalsysteem een stuk ingewikkelder. Eén woord kan tal van verschillende vormen hebben, door onder andere enkelvoud-meervoud, mannelijk-vrouwelijk, plaats in de zin (onderwerp, lijdend voorwerp, etc.). Ook de werkwoorden hebben veel meer uitgangen dan in het Nederlands. Het woord ‘kat’ bijvoorbeeld kan in het Russisch negen verschillende vormen krijgen: кошка, кошки, кошке, кошку, кошкой, кошек, кошкам, кошками, кошках. En om het nog wat ingewikkelder te maken: elke variant van het woord ‘kat’ levert een ander resultaat op Twitter op. Bijvoorbeeld: de standaardvorm van het woord ‘kat’ of ‘katten’ levert veel meer resultaten op dan als je zoekt op ‘met een kat’ of ‘met de katten’.

Op WikiWoordenboek vind je de onverbogen vorm van het woord met de werkwoordsvervoeging. Bijvoorbeeld: de zoekoptie кошка (kat) op WikiWoordenboek laat het enkelvoud en het meervoud van de zes Russische naamvallen zien. Let op dat je bij een zoekopdracht het accent aigu weglaat (het streepje op de о́, zoals in ко́шка, dat slechts de klemtoon aangeeft).

globvoic4

Als je gewoon googelt, geeft dit verder geen problemen omdat de zoekalgoritmen in staat zijn op meerdere vormen van het woord te zoeken. (Als je bijvoorbeeld het Russische woord voor kat (кошка) googelt, zullen ook de andere vormen van het onverbogen woord – met een kat, zonder een kat, van een kat, etc. – in de resultaten worden meegenomen.) Je hoeft je dus geen zorgen te maken over de verschillende vormen van het zelfstandig naamwoord of het werkwoord als je in het Russisch googelt, tenzij je het woord tussen aanhalingstekens zet om nog specifieker te zoeken op dat ene woord (en dus ook de vorm).

Op Twitter is het echter een ander verhaal. Twitter geeft namelijk alleen resultaten van lettercombinaties die exact overkomen met de zoekopdracht en kan dus niet op verschillende vormen van woorden en werkwoorden zoeken.

Als je bijvoorbeeld probeert informatie te vinden over de evacuatie van een gebouw in de stad Kazan, dan krijg je – afhankelijk van de vorm van het woord waarop je zoekt – totaal verschillende zoekresultaten. Probeer eens verschillende zoekopdrachten met vormen van het werkwoord “эвакуировать” (evacueren) plus Казань (de standaardvorm van het woord “Kazan”) en в Казани (“in Kazan”).

Эвакуировать Казань – Evacueren Kazan (geen vervoegingen van het werkwoord/zelfstandig naamwoord):

Zoek je op Google News dan zitten er tussen de resultaten verschillende vormen van zowel “Kazan” als van “evacueren”, maar het zoekt ook op het zelfstandig naamwoord “evacuatie” en de vorm van het woord Kazan in de verschillende naamvallen:

globvoic5

Op Twitter krijg je veel minder resultaten, omdat het hele werkwoord “evacueren” maar zelden voorkomt in tweets en nieuwsberichten. Zoals je kunt zien in de resultaten hieronder is er een gat van vier maanden tussen drie tweets, wat aangeeft dat er ofwel nauwelijks informatie over dit onderwerp is, of de zoekterm moet worden aangepast.

globvoic6

2          Эвакуировали в Казани (“geëvacueerd in Kazan”)

Als je het voltooid deelwoord van “evacueren” gebruikt (dat vaak voorkomt in passieve zinnen) levert dat veel meer bruikbare resultaten op. (Als je nog even kijkt naar de resultaten van Google News, zie je dat het tweede resultaat ook deze vorm van het werkwoord bevat.) De tweets hieronder zijn behoorlijk verschillend, maar allemaal relevant voor de zoekresultaten, zoals de evacuatie van een kerk na een brand, een evacuatie van een bus en een evacuatie van een school:

globvoic7

Als je geen Russisch spreekt, is het lastig om te weten welke zinnen en zoekparameters je moet gebruiken om je resultaten te optimaliseren. Het is dus een goed idee om algemene Russische begrippen en zinnen in te voeren op Google (zoals “evacuatie” en “Kazan”) en vervolgens gebruik je de begrippen die het vaakst voorkomen. Nadat we dit gedaan hebben met de nieuwsresultaten van Google vonden we ook veel meer relevante resultaten op Twitter, al is zoeken in het Russisch op Twitter – we herhalen het nog maar even – niet echt aan te raden vanwege de vele verbuigingen van de werkwoorden en zelfstandig naamwoorden.

 

***

Zoals uit deze handleiding blijkt, kan het frustrerend en tijdrovend zijn om – zonder Russisch te spreken – op internet te zoeken in het Russisch, maar onmogelijk is het niet. Je hoeft geen Russisch te kunnen lezen of schrijven, of zelfs het Russische alfabet te kennen, om Russischtalig open-source onderzoek te doen, maar uiteraard helpt het als je wat basiskennis van de taal hebt. Na een tijdje zal je de letters beginnen te herkennen en uitvinden hoe je het alfabet moet lezen, zeker als er regelmatig bepaalde namen en steden opdoemen in je zoekresultaten. In de tussentijd helpt deze handleiding je bij zoekopdrachten op Twitter en Google en bij het ontcijferen van geheimzinnige afkortingen.

Door Aric Toler, Global Voices