
Hvor ofte og når er slektsnavnet ditt nevnt, over tid, i norske aviser og bøker? Det kan du finne ut med denne noe skjulte tjenesten fra Nasjonalbiblioteket.
Nasjonalbiblioteket Nettbibliotek (Tidligere Bokhylla) har etterhvert blitt til en enorm base over alt utgitt materiale i Norge. Hele 34 milliarder ord består samlingen av, hvorav 11 milliarder ord er å finne i bøkene, mens 23 milliarder ord fra norske aviser.
Gjennom tjenesten N-gram kan du finne og sammenligne ordfrekvenser i Nettbiblioteket. Med andre ord hvor hyppig et ord forekommer i et historisk perspektiv.
Til illustrasjonen av denne teksten har Slekt1 sjekket hvor hyppig ordet bygdebok fore
NB N-gram består per i dag av tre funksjoner:
- Trendlinjer: lar deg undersøke og sammelikne utviklingen av ord og fraser over tid.
- Råfrekvenser: gir deg statistikk over ord og fraser i hele korpuset uavhengig av tid.
- Galakser: gir deg muligheten til å se på betydningsreleasjoner mellom ord.
Slik gjør du gode søk i N-gram
Søk på flere ord samtidig
- Vil du sammenligne hyppigheten av enkelte ord, skiller du de med et komma. Du kan sammenligne inntil 10 ord samtidig.
- Bygdebok,Slektsbok
- Vil du legge alle skrivemåtene til et ord i en graf, gjør du det ved å sette et pluss-tegn mellom de ulike skrivemåtene. Du får da ut en graf som inneholder hyppigheten av de ulike skrivemåtene samlet.
- Bygdebok+Bygdebøker+bygdebok+bygdeboka
- Vil du søke på alle mulige variasjoner av et ord (eller navn) kan du legge til en stjerne. Denne kan legges både før, etter og inni et ord. I bildet under er det søkt på Ols*n, man får da treff på ulike måter etternavnet «Olsen» kan skrevet på.

Frasesøk enda ikke mulig
Frasesøk gjøres vanligvis ved å sette flere ord eller navn i hermetegn, slik: «Ole Olsen». Da søker man på tekster hvor Ole og Olsen står skrevet på samme måte.
Dette er en veldig kjekk måte å finne personer på i Nettbiblioteket, men N-gram har ikke denne funksjonaliteten. Det gjør at det er vanskelig å få noe fornuftig resultat på hyppigheten av navn på enkeltpersoner.
Fortsatt under utvikling
Tjenesten er i beta, det vil si under utvikling. Det betyr også at den kan være noe ustabil til tider.
Nasjonalbiblioteket har planer om å etablere N-gram som en varig tjeneste. Da skal den også kunne avgrense søkene etter kilde, sjanger, medietype, osv.
En ny versjon av N-gram vil bli rullet ut i løpet av våren, den vil gi tilgang på ordfrekvenser nyere enn 2013.






