Sanankatkaisu, korvausmerkit ja fraasihaku

Hakusanojen muoto ja yhdistäminen hakulauseiksi – nyt tulee hakutekniikkaa!

Sanankatkaisu kasvattaa hakutulosta

Sanat taipuvat tai esiintyvät yhdyssanojen alku- (tai loppu)osina. Katkaisumerkillä saadaan kaikki taivutusmuodot ja mahdolliset yhdyssanat mukaan hakuun. Koneethan hakevat vain merkkijonoja.

Jos etsit yksikkömuodolla, saat tulokseksi vain yksikössä olevia sanoja. Katkaisumerkki vaihtelee eri hakujärjestelmissä. Huomaa, että Primo-järjestelmä ei osaa taivuttaa suomen kieltä, vaan sanat pitää muistaa katkaista!


Tavallisimmin käytetty katkaisumerkki on asteriski eli tähtimerkki * (mm. Primo, Finna.fi -palvelu, ERIC, Ebsco-tietokannat, Scopus).

Esimerkiksi:
koulu* -> koulu, koulutus, koululaisten, koulurakennus, kouluhallinto, koulukunnat…
nuor* -> nuori, nuoret, nuorten, nuoriso, nuorisotyö…
matema* -> matematiikka, matemaattinen, matematics, matemaatikot…

child* -> child, children, childhood…
pedagog* -> pedagogy, pedagogical, pedagogies, pedagogiikka, pedagogiska…
behav* -> behave, behavior, behaviour, behavioural, behaviourism

Video sanankatkaisusta (kesto 3:06, tekijä Riitta Holopainen ):

Korvausmerkit avuksi, kun hakusanan kirjoitusasu vaihtelee

Korvausmerkkejä (wildcards) tarvitaan useimmiten hakusanoissa, joiden kirjoitusasu vaihtelee, brittiläisen ja amerikanenglannin välillä. Jotta molemmat sanat saadaan mukaan hakuun, ongelmallisen kirjaimen kohdalle hakusanaan voi sijoittaa korvausmerkin.

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikissa tietokannoissa tarvita tai ole edes käytössä. Monet kansainväliset tietokannat ottavat kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. Lähes aina yksikkömuotoisena haettu sana löytää myös monikon ja päinvastoin. Korvausmerkkien käyttöön liittyvät tarkemmat tiedot kannattaa siis tarkistaa tietokannan ohjeista.

?-merkki korvaa monissa hakujärjestelmissä yhden merkin, esim. Primossa, Ericissä (ProQuest-tietokannoissa) ja Ebscossa.

wom?n -> woman, women
organi?ation -> organisation, organization

Epävirallinen vinkki: asteriski eli tähtimerkki * toimii yleensä mainiosti niin katkaisu- kuin korvausmerkkinä keskellä sanaa.

Fraasihaku löytää useasta sanasta koostuvan termin, sanaliiton

Tiedonhaun yhteydessä fraasilla tarkoitetaan sanaliittoa eli useasta sanasta koostuvaa käsitettä. Se ei tässä siis ole esimerkiksi folkloristiikassa määritelty sananparsi eikä kielitieteen tarkoittama lauseke (kts. Tepa-termipankki).

Käsite rakentuu joskus useammasta sanasta, englanninkielessä aika useinkin. Jotta fraasin tai sanaliiton sanat pysyisivät yhdessä ja peräkkäin haluamassasi järjestyksessä, voit käyttää ns. fraasihakua. Fraasihaku auttaa täsmentämään hakutulosta.

Yleisimmin käytetään lainausmerkkejä pakottamaan sanat yhteen, esim. ”sosiaalinen media”, ”adventure education”, ”classroom management”. Myös Googlessa toimii fraasihaku.

UEF-Primon erikoisuus: jos katkaistu hakutermi on keskellä fraasihakua, haku ei välttämättä toimi. Näin tapahtuu UEF-Primossa, kun haet kirjaston kokoelmista (painetut ja e-kirjat). Kansainvälisien artikkeleiden ja elektronisten aineistojen haussa katkaisu fraasin keskellä taas onnistuu.

Esimerkiksi ”kestävä* kehity*” -> ei toimi; ”lasten kehity*” -> toimii

Esimerkkejä hakulauseiksi aiheena Koulutuksen vaikutus maahanmuuttajien kotoutumiseen (integraatioon):

koulutus AND (maahanmuutt* OR pakolai*) AND (integr* OR kotout*)
education* AND (immigrants OR refugees) AND integration

Huomaa, että esimerkin ns. komentohaussa OR-kytkettyjen hakusanojen ympärillä on sulut, koska OR on AND-operaattoria heikompi. Sanojen yhdistelystä kerrotaan seuraavassa osiossa Boolen operaattorit.

Kuvakaappaus UEF-Primon tarkennetusta hausta.
Kuva: UEF-Primon tarkennettu haku, jossa hakulause on sijoitettu hakulomakkeelle: koulutus AND (maahanmuutt* OR pakolai*) AND (integr* OR kotout*)