back to front page

poimintoja suomen kielen sanalistalta

lähdeaineisto

Olen käyttänyt Kotimaisten kielten keskuksen (Kotus) XML-muotoista nykysuomen sanalistaa, jolla on 94 110 sanaa taivutustietoineen.

Tiedosto, jossa on kaikki Kotuksen listan sanat ilman kaksoiskappaleita ja taivutustietoja, suomalaisittain aakkostettuna, kukin sana omalla rivillään: lataa (93 696 sanaa, gz-pakattu, 337 KiB). Voit luoda saman listan itse seuraavasti:

pitkiä sanoja

30 kirjainta

29 kirjainta

28 kirjainta

27 kirjainta

26 kirjainta

moniosaisia yhdyssanoja

Alle 18-merkkisiä sanoja saattaa puuttua.

viisi osaa

neljä osaa

harvinaisia kirjaimia ja merkkejä

Mukana ei ole yhdyssanoja paitsi jos sana esiintyy vain osana yhdyssanaa. Mukana ei ole myöskään sanoja, jotka muistuttavat läheisesti tähän valittuja.

å

š

ž

é

muu kirjain kuin a–z, å, ä, ö, š, ž, é

heittomerkki

toistuvia kirjainjonoja

Ei yhdyssanoja, joissa on sama sana useaan kertaan (esim. "kirjanpitokirja"), eikä sanoja, jotka muistuttavat läheisesti tähän valittuja. Säännölliset lausekkeet (regex), joilla etsin sanat: (.{c})(.*\1){r} (c merkin jono r + 1 kertaa), (.{c})\1{r} (c merkin jono r + 1 kertaa peräkkäin).

seitsemän kirjaimen jono

Kahdesti:

kuuden kirjaimen jono

Kahdesti peräkkäin:

Kahdesti ei peräkkäin:

viiden kirjaimen jono

Kahdesti:

neljän kirjaimen jono

Kahdesti peräkkäin:

Kahdesti ei peräkkäin:

kolmen kirjaimen jono

Kolmesti:

Kahdesti peräkkäin:

kahden kirjaimen jono

Neljästi:

Kolmesti peräkkäin:

kaksoiskirjaimet

kaksoiskirjaimet

Kuusi:

Neljä peräkkäin:

kaksoiskonsonantit

Viisi:

kaksoisvokaalit

Neljä:

Kaksi peräkkäin:

palindromit

Sanat, jotka ovat samoja etuperin ja takaperin.

koko sanat

Löysin sanat tällä Python-ohjelmalla.

yhdeksän kirjainta

kahdeksan kirjainta

seitsemän kirjainta

kuusi kirjainta

viisi kirjainta

neljä kirjainta

kolme kirjainta

sanan osat

Löysin sanat tällä Python-ohjelmalla. Olen jättänyt pois sanat, jotka muistuttavat paljon tähän valittuja.

yhdeksän kirjainta

kahdeksan kirjainta

seitsemän kirjainta

anadromit

Sanat, jotka ovat samoja kuin toinen sana takaperin. Löysin sanat tällä Python-ohjelmalla.

kuusi kirjainta

viisi kirjainta

neljä kirjainta

kolme kirjainta

kaksi kirjainta

anagrammit

Sanajoukot, joiden sanoissa on samat kirjaimet eri järjestyksessä. Löysin sanat tällä Python-ohjelmalla.

seitsemän sanaa

kuusi sanaa

viisi sanaa

pangrammeja

Sanajoukkoja, jotka sisältävät yhdessä kaikki aakkosten kirjaimet.

kaikki suomen aakkoset

Kirjaimet a–z, å, ä, ö, š, ž. Sanoja tarvitaan vähintään kuusi, koska missään sanalistan sanassa ei ole useampaa kuin yhtä kirjaimista q, š, w, x, ž, å. Löysin sanajoukot tällä Python-ohjelmalla, joka ottaa syötteen tältä ohjelmalta.

Kuusisanaisista sanajoukoista vähiten merkkejä yhteensä (59):

ei vierasperäisiä kirjaimia

Kirjaimet a, d, e, g–p, r–v, y, ä, ö. Löysin sanajoukot tällä Python-ohjelmalla, joka ottaa syötteen tältä ohjelmalta.

Sanakolmikoista vähiten merkkejä yhteensä (21):

ei samaa kirjainta kahdesti

Löysin sanat tällä Python-ohjelmalla.

14 kirjainta

13 kirjainta

12 kirjainta

sama kirjain useasti

seitsemästi

a

i

k

s

u

ä

kuudesti

e

n

o

t

y

viidesti

l

p

r

vähän eri kirjaimia

kahta eri kirjainta

Löysin sanat tällä Python-ohjelmalla.

kuusi kirjainta

viisi kirjainta

kolmea eri kirjainta

Löysin sanat tällä Python-ohjelmalla.

kymmenen kirjainta

yhdeksän kirjainta

kahdeksan kirjainta

vain yhtä vokaalia

Löysin sanat tällä Python-ohjelmalla.

17 kirjainta

16 kirjainta

15 kirjainta

vain yhtä konsonanttia

Löysin sanat tällä Python-ohjelmalla.

11 kirjainta

kymmenen kirjainta

yhdeksän kirjainta

kahden eri kirjaimen jono

Sanoja, jotka sisältävät pitkän vain kahdesta eri kirjaimesta koostuvan jonon. Löysin sanat tällä Python-ohjelmalla. Olen jättänyt pois sanat, jotka muistuttavat paljon tähän valittuja.

yhdeksän kirjainta

kahdeksan kirjainta

seitsemän kirjainta

kolmen eri kirjaimen jono

Sanoja, jotka sisältävät pitkän vain kolmesta eri kirjaimesta koostuvan jonon. Löysin sanat tällä Python-ohjelmalla. Olen jättänyt pois sanat, jotka muistuttavat paljon tähän valittuja.

kymmenen kirjainta

yhdeksän kirjainta

peräkkäiset vokaalit ja konsonantit

eniten vokaaleja peräkkäin

Neljä:

eniten konsonantteja peräkkäin

Viisi:

ei kahta vokaalia tai kahta konsonanttia peräkkäin

Löysin sanat tällä Python-ohjelmalla.

15 kirjainta

14 kirjainta

13 kirjainta

ei kahta vokaalia peräkkäin

Linux-komento, jolla löysin sanat (ensimmäinen luku on vähimmäispituus): grep ".\{27\}" kotus-unique.txt | grep -v "[aeiouyäö]\{2\}"

27 kirjainta:

24 kirjainta:

ei kahta konsonanttia peräkkäin

Linux-komento, jolla löysin sanat (ensimmäinen luku on vähimmäispituus): grep ".\{21\}" kotus-unique.txt | grep -v "[^aeiouyäö]\{2\}"

21 kirjainta:

20 kirjainta:

kirjaimet aakkosjärjestyksessä

nousevasti

seitsemän kirjainta

kuusi kirjainta

laskevasti

seitsemän kirjainta

kuusi kirjainta

sanat, jotka sisältävät eniten muita sanoja

Löysin sanat tällä Python-ohjelmalla.

24 sanaa

22 sanaa

21 sanaa

toisiaan muistuttavia sanoja

Sanajoukkoja, joiden kaikki sanat eroavat yhden kirjaimen osalta toisistaan. Löysin sanat tällä Python-ohjelmalla.

kymmenen sanaa

yhdeksän sanaa

kahdeksan sanaa

sanaketjuja

Kukin ketjun sana (toisesta alkaen) muodostetaan poistamalla edellisestä sanasta yksi kirjain. Löysin ketjut tällä Python-ohjelmalla.

yhdeksän sanaa

kahdeksan sanaa

seitsemän sanaa

kirjainten muodot

Löysin sanat tällä Python-ohjelmalla.

vain kirjaimia joiden kaikki viivat suoria

Vain kirjaimia AÄEFHIKLMNTVWXYZŽ.

vain kirjaimia joiden kaikki viivat vaaka- tai pystysuoria

Vain kirjaimia EFHILT.

vain kirjaimia joissa täyskorkea pystyviiva

Vain kirjaimia BDEFHIKLMNPRT.

vain kirjaimia joissa enintään kaksi viivaa

Vain kirjaimia CDIJLOÖPQSŠTUVX.

vain kirjaimia joissa vähintään kolme viivaa

Vain kirjaimia AÄBEFGHKMNRWYZŽ.

vain kirjaimia joissa kaari

Vain kirjaimia BCDGJOÖPQRSŠU.

vain aukollisia kirjaimia

Vain kirjaimia AÄBDOÖPQR.

vain aukottomia kirjaimia

Vain kirjaimia CEFGHIJKLMNSŠTUVWXYZŽ.

vain kirjaimia joissa viivat risteävät

Vain kirjaimia AÄBEFHKPQRTXY.

vain kirjaimia joissa viivat eivät risteä

Vain kirjaimia CDGIJLMNOÖSŠUVWZŽ.

vain symmetrisiä kirjaimia

Vain kirjaimia AÄHIMOÖTUVWXY (vasen ja oikea puoli peilikuvia toisistaan).

morseaakkosina

Löysin sanat tällä Python-ohjelmalla.

peräkkäiset pisteet

20 pistettä

19 pistettä

18 pistettä

peräkkäiset viivat

21 viivaa

18 viivaa

17 viivaa

pelkkiä pisteitä

17 pistettä

14 pistettä

13 pistettä

pelkkiä viivoja

12 viivaa

10 viivaa

9 viivaa

palindromit

Sanoja, jotka ovat samoja etuperin ja takaperin.

pituus 12

pituus 11

pituus 10

anadromit

Sanoja, jotka ovat samoja kuin toinen sana takaperin.

pituus 14

pituus 10

pituus 9