Asiasanat ja asiasanastot apuna

Tässä osiossa kerrotaan

  • mitä eroa on luonnollisen kielen ja asiasanojen käytöllä tiedonhaussa
  • miten teet asiasanahaun
  • asiasanastoista

Mitä eroa on sanahaulla ja asiasanahaulla?

Sanahaku (vapaasanahaku) on yleensä tietokannoissa oletushakuna (esim. perushaku, basic search, free text, keyword).
Sanaa etsitään lähes kaikkialta julkaisujen tiedoista: tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista jne., myös kustantajan/julkaisijan nimestä.

  • Sanaa etsitään täsmälleen annetussa muodossa, joten mieti sanan taipumismuodot ja muu mahdollinen variaatio ja käytä katkaisumerkkiä
  • Haussa voi käyttää mitä tahansa luonnollisen kielen sanoja
  • Synonyymit pitää miettiä ja hakea erikseen
  • Homonyymit (sama kirjoitusasu viittaa useampaan merkitykseen; esim. kuusi) tulevat mukaan, tietokonehan ei erota merkityksiä. Samoin kirjainlyhenne tai akronyymi voi viitata useampaan eri käsitteeseen (esim. ADD voi merkitä mm. Attencion Deficit Disorder, Addendum tai Advertisement)

Asiasana on julkaisun sisältöä kuvaava kuvailu- tai hakutermi, joka on peräisin joko yleisestä, tieteenalakohtaisesta tai tietokannan sisäisestä sanastosta. Kun rajaat haun asiasanoihin eli käytät asiasanahakua

  • kohdennat hakua
  • parannat relevanssia eli aiheenmukaisuutta
  • parannat haun osuvuutta

Asiasanoihin kohdistettu haku voi parantaa hakutulosten aiheenmukaisuutta eli relevanssia ja osuvuutta. Haun kohdentaminen ja muut rajaukset pienentävät hakutulosta. Joskus voi tulosmäärä olla suurempikin kuin vapaalla sanalla etsittäessä, koska asiasanahaku on ottanut eri synonyymit huomioon.

Asiasanahaku (subject term, subject headings, descriptors, UEF-Primossa haetaan ’aiheista’)

Tallennettaessa julkaisun tietoja asiasanoja käytetään kuvailemaan niiden aihetta ja sisältöä, jotta tieto löytyisi paremmin. Asiasanahaku kohdistuu näihin kuvailutermeihin, jotka on tallennettu erilliseen asiasanakenttään.

Useimmissa tietokannoissa asiasanahakuun päästään tarkennetun haun (advanced search) puolelta. Siellä valitaan pudotusvalikosta hakukentäksi esim. subject terms tai asiasana. Hakusanoiksi pitää valita kyseisen tietokannan käyttämän asiasanaston tai tesauruksen termejä eli asiasanoja.

Eri tietokannat käyttävät eri sanastoja. Sama sana ei toimi eri tietokannoissa samalla tavalla.

Jos rajaat hakusi kohdistumaan asiasanakenttään, et voi käyttää mitä tahansa luonnollisen kielen sanaa – tai ainakaan et niillä välttämättä saa tulosta.

Avainsana (keyword) tarkoittaa yleensä mitä tahansa aihetta kuvaavaa sanaa. Se ei siis ole välttämättä auktorisoidusta sanastosta otettu termi eli asiasana.

UEF-Primossa hakutyyppi on nimeltään aihehaku.

UEF-Primon tarkennetussa haussa on valittu hakutyypiksi Aihe. Haetaan tietokannan asiasanoista.
Kuva: UEF-Primon aihehaku eli asiasanoihin kohdistettu haku tarkennetussa hakutyypissä.

Asiasanat kerätään asiasanastoihin

Mitä asiasanastot (thesaurus, subject terms) ovat?

  • Eräänlaisia avainsanaluetteloita, luetteloita käytössä olevista asiasanoista.
    Jokaisella tietokannalla on useimmiten oma asiasanastonsa
  • Usein myös määritellään käsitteitä ja kuvataan niiden välisiä suhteita: rinnakkaiskäsitteet tai assosioivat (related), laajemmat (broader) ja suppeammat (narrower) termit.
  • Ne auttavat tiedontallentajia ja -hakijoita käyttämään yhteistä kieltä, jotta tieto löytyisi helpommin.
  • Ideana on tiivistää mahdollisten termivaihtoehtojen ja synonyymien määrä rajalliseksi. Sanastoon on valittu termi käytettäväksi kaikista samaa asiaa tarkoittavista sanoista. Asiasana ei siis ole mikä tahansa aihetta kuvaava sana.

Asiasanasto voi siis olla:

  • yleinen ja käytössä useissa tietokannoissa ja tieteenaloilla (esim. YSO)
  • tieteenalakohtainen ja käytössä tietyn tieteenalan tietokannoissa (esim. MeSH)
  • sisäänrakennettu tietokantaan, eli tietokannan oma asiasanasto (esim. EBSCOhost Academic Search:n Subject Terms)

Kasvatustieteissä kaksi tärkeintä asiasanastoa  ovat yleinen suomalainen ontologia YSO finto.fi-palvelussa sekä ERIC-tietokannan oma tesaurus Thesaurus of ERIC descriptors. Kirjastojen kokoelmatietokannoista löytyvä kasvatusalan kirjallisuus sekä Finna.fi-palvelun kasvatusalan artikkelit asiasanoitetaan pääasiassa YSOn termein.

Finto (linkki avautuu uuteen välilehteen)on suomalainen sanasto- ja ontologiapalvelu, josta löytyy eri alojen sanastoja. UEF-Finnassa käytetään kuvailuun pääosin YSOa (Yleinen Suomalainen Ontologia) (linkki avautuu uuteen välilehteen).  Se kattaa kaikkien tieteen- ja tiedonalojen yleisimmän terminologian. Nimensä mukaisesti se on yleinen, eikä mene kovin tarkalle tasolle eri tieteenalojen terminologiassa. Lääke- ja hoitotieteen kirjallisuudessa on käytössä MeSH/FinMeSH (linkki avautuu uuteen välilehteen).

YSO-ontologian esimerkkiterminä on opettaja-oppilassuhde. Sille on annettu mm. assosiatiivisia käsitteitä, muunkielisiä vastaavia termejä ja rinnakkaisia termejä eli lähes vastaavia termejä.
Kuva: Esimerkki YSO-ontologian termistä.

Thesaurus of ERIC descriptors (linkki avautuu uuteen välilehteen) on ERIC-tietokannan oma asiasanasto, joka sisältää myös termien selitykset. Voit selata aiheita myös kategorioittain. Thesaurus on myös sisäänrakennettuna ERIC (ProQuest) -tietokantaan (linkki avautuu uuteen välilehteen). Se löytyy ERIC-tietokannan tarkennetun haun eli Advanced Searchin sivulta Thesaurus-linkin alta.

Linkki ERIC-tietokannan Thesaurukseen löytyy tarkennetun haun sivulta.
Kuva: Linkki ERIC-tietokannan tesaurukseen löytyy ylävalikosta.

Sanastoa voi käyttää apuna myös hakusanojen ideointivaiheessa, vaikka tekisikin haut vapaasanahakuina. Sieltä voi löytyä vinkkejä hakusanoiksi.

Sanastoissa käytetään ohjaustermejä. Alla olevassa kuvassa Use term for ohjaa käyttämään ERICissä asiasanana termiä Parent involvement termin Parent participation sijaan. Eri tietokannat käyttävät eri asiasanoja kuvaamaan samaa käsitettä, joten kannattaa muistaa myös synonyymit.

ERICin Thesauruksen sanastosta on esimerkkinä termi Parent participation. Sanasto ohjaa käyttämään termiä Parent involvement ja antaa rinnakkaisia termejä eli related terms.
Kuva: Esimerkki ERIC-tietokannan tesauruksesta.

Asiasanojen ja luonnollisen kielen sanojen erityispiirteitä

Vapaasanahaku hakee sanaa kaikkialta julkaisujen tiedoista: muun muassa tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista ja kustantajan nimestä. Haun voi myös kohdistaa koskemaan esimerkiksi otsikkoa tai abstraktia. 

Voit käyttää vapaasanahaun hakusanoina mitä tahansa luonnollisen kielen sanoja, asiasanoja tai fraaseja. Asiasanoja voi käyttää hakutermeinä myös vapaasanahaussa, mutta ei päinvastoin. Vapaat sanat eivät kelpaa asiasanahakuun.

Jos hakukenttää ei erikseen vaihda, tapahtuu tietokantahaku oletushakukentän perusteella. Oletushakukenttänä on usein vapaasanahaku. Oletushakukentät kuitenkin vaihtelevat eri tietokannoissa, joten hakukenttä kannattaa varmistaa tiedonhaun alkuvaiheessa.

Asiasanahaku tulee siis valita erikseen haun asetuksista. Asiasanahaku kannattaa valita silloin, kun aihe on laaja-alainen tai hankalasti määriteltävä. Vapaasanahaku taas on parempi vaihtoehto, jos haettava aihe on yksityiskohtainen ja tarkasti rajattu, tai kun käsitteistö ja sanasto ovat kyseisellä alalla vakiintuneita.

On tavallista, että varsinkin hyvin tarkkaa tai uutta termiä ei löydy sanastosta. Millä tahansa sanalla voi hakea sanahakuna eli vapaatekstihakuna. Tällöin on mietittävä, mitä kaikkia termejä käyttäen aiheesta on voitu kirjoittaa.