PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Esitelmätilaisuus 27.11. automaattisesta sukupuusta Hiskin avulla


PekkaV
25.11.15, 12:07
Aalto-yliopistossa tohtoriväistöstä valmisteleva Erik Malm esittelee tutkimustaan, miten Hiskin avulla voidaan automaattisesti rakentaa ja analysoida sukupuita. Tiina Miettinen Tampereen yliopistosta on paikalla kommentoimassa esitelmää. Tilaisuuteen on vapaa pääsy.

Paikka: Metsätalo Helsingissä, luentosali 9
Aika: Perjantai, 27.11.2015 klo 16.15-18.00

Tutkimuksen päähaaste on löytää samaan henkilöön liittyvät syntymätapahtumat aineistosta, jossa on paljon epävarmuutta (kirjoitusasut, kirjoitusvirheet, aukot). Analyyseista tutkija mainitsee erilaiset historiaan ja väestörakenteisiin liittyvät kysymykset kuten avioitumispiirit, suvunjatkamiset, kuolleisuuden sekä siirtolaisuuden ja edellisiin vaikuttaneet tekijät.

SSS:n Suomi-tietokannan Taapeli-projekti on avustanut tutkijaa Hiskiä täydentävillä aineistoilla ja kommentoinneilla.

Taapeli-projektin puolesta
Pekka Valta

ilkant
04.12.15, 13:42
Onko tästä esitelmästä olemassa dokumenttia? Tai videoita? Kiinnostaa näin jälkeenpäinkin. Tuona päivänä olin ulkomailla.

Nedergard
04.12.15, 15:06
Hanke on erittäin kiinnostava ja minäkin toivoisin, että siitä olisi edes tiivistelmä jossain luettavissa.

Julle
04.12.15, 17:46
< Onko tästä esitelmästä olemassa dokumenttia? Tai videoita? Kiinnostaa näin jälkeenpäinkin. Tuona päivänä olin ulkomailla. >

Kannatan edellistä kirjoittajaa? Minäkään en päässyt tilaisuuteen, kun "nämä kuolleet tahtovat aina karata käsistä" vai olikohan se ajankohta epäsopiva. Minäkin haluaisin tietää, miten nämä käsintehtävät toimenpiteet saisi edes jotenkin automatisoitua.
Ja miten sitä voisi edelleen kehittää välttäen HisKin datatiedoissa esiintyvät virheet, joita pääsisi tarkistamaan ohjelmalla valmiiksi tehdyistä rippikirjoista SSHY:n vastaavia vasten. Siinäpä paljastuisi HisKin niin kuin SSHY:n rippikirjojen virheet samalla. Sukupuu lienee vasta alkua kunnon innovaatiolle.

Odotellen

PekkaV
04.12.15, 21:03
Nykytapaan väitöskirjat kootaan tieteellisissä aikakauslehdissä julkaistuista artikkeleista. Eric esitteli yhtä valmisteilla olevaa tutkimustaan, joka jossain vaiheessa julkaistaan artikkelina. En usko, että hänellä on vielä siitä mitään laajaan jakoon sopivaa luonnosta.

Itse tilaisuudessa hän esitteli tutkimuksensa teoreettisia lähtökohtia (vaikeita termejä vilisi) ja tuloksiaan, joita oli saatu lähinnä Itä-Suomen Hiski-materiaaleilla. Jäi mieleeni mm. koneoppivat järjestelmät. Virinneessä keskustelussa läntisen Suomen tutkijat olivat kriittisiä Hiski-perusteisten sukupuiden rakentamiseen ja korostivat rippikirjojen manuaalisen käytön tarpeellisuutta. Ainakin rippikirjat menevät Ericin tutkimusaiheen ulkopuolelle, kun niitä ei ole tietokantaistettu. Länsi-Suomesta jään ainakin itse odottamaan mielenkiinnolla, miten Ericin tutkimus lopulta pärjää sukunimettömän materaalin kanssa. Ehkä koneen voi opettaa...

Eric esitteli verkossa toimivaa sukupuun rakentamisohjelmaa ja lupasi julkaista sen myöhemmin verkkoon, kaikkien kokeiltavaksi. Ei ikävä kyllä ehdi tämän joulun lahjaksi sukututkijoille.

ilkant
07.12.15, 05:14
Tuo teoriapohja kiinnostaa kaikkein eniten. Oman sukuni tietoja ei ole enää tarvis koneella kerätä, kun tiedot on jo suurelta osin käsin poimittu saatavilla olevista tiedoista. Tai miten sen käsittää. Sen enemmän työtä, mitä kauemmas historiaan mennään. Aah, mikä ihana termi tuo käsin poimittu on sukututkimuksen saralla. :)

Lisäksi mieleen pulpahtaa yhteys dna-tutkimukseen. Jos tämä tuottaa sinne jotain, niin se palvelisi nykyisiä ihmisiä hyvin. Olen ainakin aloittelijana ymmärtänyt suuren työmäärän, mitä dna-sukulaisten geneologisten yhteyksien etsimisessä on.

Seppo Niinioja
11.10.16, 10:38
Periaatteessa nyt pitäisi olla realistisemmat mahdollisuudet "automaattiseen sukututkimukseen", kun MyHeritage on julkaissut 33 miljoonaa indeksoitua rippi- ja lastenkirjan sivua maksullisessa tietokannassa. Mutta miksi luopua omin käsin tutkimisen ilosta?

PekkaV
11.10.16, 11:30
Erik Malmi on ollut tämän vuoden ulkomailla tiedettä tekemässä, ehkä saamme hänestä seuraavan Nobelistin Suomeen?

Matkan takia hänen työkalunsa kokeilu verkossa on siirtynyt. Palataan sen osalta ensi vuoden puolella.

En tunne MyHeritagen palvelua enkä siksi osaa sanoa, onko siitä ilonpilaajaksi. Positiivisesti ajateltuna se on vain samaa teknisen kehityksen jatkumoa, jota esim. Hiskin tietokantaistaminen tai KA:n ja SSHY:n digitoimat asiakirjat verkossa edustavat. Maailma muuttuu Eskosein, kansalliskirjailijaamme siteeraten.

Onkohan tämä nykyinenkään vaihe, jossa monesta sukututkijasta on tullut keräilijä, kirjoista ja netistä kopioija, kovin onnekas? Laadulle ja tutkimuksenteolle on tainut käydä heikosti. Suhtaudun myönteisesti Erikin ja kaltaistensa kehitystyöhön, jos todellinen tutkimustyö tehostuu ja tulosten laatu paranee. Ehkä silloin jää tarpeettomaksi 1400 viestin ketjut, joista on vaikea seuloa jälkikäteen jyviä. Vai ovatko ne tutkijoiden sosiaalista kanssakäymistä parhaimmillaan?

Pekka

Julle
11.10.16, 15:13
< Periaatteessa nyt pitäisi olla realistisemmat mahdollisuudet "automaattiseen sukututkimukseen", kun MyHeritage on julkaissut 33 miljoonaa indeksoitua rippi- ja lastenkirjan sivua maksullisessa tietokannassa. Mutta miksi luopua omin käsin tutkimisen ilosta? >

Älä hättäile, mutta käytä mieluummin päätäsi, sillä sitä tietokone ei voi korvata! Tulokset voit kirjata käsilläsi. Sitä paitsi MyHeritage vain tukee tutkimuksiasi tai osaa tehdä joitakin ehdotuksia tutkittavaksi, mutta sukupuuta se ei rakenna, sillä puuttuvia tietoja ei voida korvata kuin ihmisen päättelyjen avulla.

Ei HisKistäkään saa sukupuuta. Saa tietysti jonkinlaisen esitysmuodon, mutta onko se edes oikea? Senkin tiedot ovat rakenteeltaan, muodoltaan ja laadultaan sen verran huonoja, vaikka sukupuun rakentamiseen ei tarvittaisi kuin yksi itse-itseensä palaava yhteyskohde (henkilö-kastetut-haudatut) tai toinen (avioliitto-vihityt), jonka tiedot ovat laadullisesti oikeanmuotoisia ja tarkkoja. Mutta jo nyt tuntuu, että rippikirjoja ja lastenkirjoja tässä on aina tarvittu avuksi, kun jokin tieto puuttuu tai edes perustiedot ovat puutteellisia.
Kunhan HisKistä ensin saataisiin edes rippikirjat ja lastenkirjat automaattisesti näkyminä/kyselyinä verrattaviksi näköispainostensa kanssa, jotta virheet havaittaisiin.

Sitten kun rippikirjat ja lastenkirjat pystytään lukemaan kaunokirjoituksista teksteiksi asti, olemme tiikerinhyppäyksen edellä automaatiota.

Ihmisen harkintakyky ja aivot kunniaan!

PekkaV
11.10.16, 15:50
Alapa peukuttamaan Kansallisarkiston RED-hanketta (http://www.arkisto.fi/fi/arkistolaitos/hankkeet/read). Toiveesi toteutuu v. 2020 . Juttelin äskettäin yhdessä seminaarissa READ:n hankepäällikön Vili Haukkavaaran kanssa ja ymmärtääkseni palveluun voi tulevaisuudessa ladata selvälukuun omiakin dokumentteja. Hyvä asia meille vasenkätisille :D:

Hannu Virttaalainen
11.10.16, 16:36
Minusta on kaikken ihmeellisintä suomalaisten sukututkimuksen nykyisessä ulkoistamisessa MyHeritage tai Geni palveluihin on, että ihmiset maksavat ulkomaille, että saavat kopioida kaikki keräilemänsä, jokamiehen oikeudella kuten marjat metsästä, sukututkimustiedon palveluun. Seuraavaksi toiset suomalaiset, joille keräilykin on taitaa olla liian vaikeaa, maksavat, että saavat näitä maksua vastaan syötettyjen keräilytietojen, marjojen, pohjalta valmiin sukupuun. Suomesta siis viedään raaka-ainetta ulkomaille ja ko viennistä maksetaan ulkomaille (halvalla myymisen ymmärtää, mutta että maksaa ostajalle) ja sitten sen tuonnista takaisin maksetaan jälleen ulkomaille toiseen kertaan. Marjojen jalostaminenkin tapahtuu ilmaiseksi talkootyönä tai maksua vastaan suomalaisten toimesta.
Ei ihme, jos Suomen taloudessa menee huonosti, jos viennistäkin maksetaan, siis kyllä ilmainen talkootyökin on työn vastaanottajalle rahanarvoista, ja samojen tuotteiden takaisin tuonnista jalostettuna maksetaan toiseen kertaan.
Hölmöläisjuttujen hölmöläisetkin alkavat vaikuttamaan penalin terävimmiltä kyniltä.

Näissä suomalaisissa hankkeissaan ollaan siis minusta pahasti myöhässä, kun kilpailijat voivat jo nyt rahastaa kahteen kertaan ja Suomesta suomalaiset haluaa kaiken ilmaiseksi. Ulkomailla käyneestä suomalaisesta tiedosta maksetaan kuitenkin ilomielin.

Seppo Niinioja
11.10.16, 17:09
< Periaatteessa nyt pitäisi olla realistisemmat mahdollisuudet "automaattiseen sukututkimukseen", kun MyHeritage on julkaissut 33 miljoonaa indeksoitua rippi- ja lastenkirjan sivua maksullisessa tietokannassa. Mutta miksi luopua omin käsin tutkimisen ilosta? >

Älä hättäile, mutta käytä mieluummin päätäsi, sillä sitä tietokone ei voi korvata! Tulokset voit kirjata käsilläsi. Sitä paitsi MyHeritage vain tukee tutkimuksiasi tai osaa tehdä joitakin ehdotuksia tutkittavaksi, mutta sukupuuta se ei rakenna, sillä puuttuvia tietoja ei voida korvata kuin ihmisen päättelyjen avulla.

Ei HisKistäkään saa sukupuuta. Saa tietysti jonkinlaisen esitysmuodon, mutta onko se edes oikea? Senkin tiedot ovat rakenteeltaan, muodoltaan ja laadultaan sen verran huonoja, vaikka sukupuun rakentamiseen ei tarvittaisi kuin yksi itse-itseensä palaava yhteyskohde (henkilö-kastetut-haudatut) tai toinen (avioliitto-vihityt), jonka tiedot ovat laadullisesti oikeanmuotoisia ja tarkkoja. Mutta jo nyt tuntuu, että rippikirjoja ja lastenkirjoja tässä on aina tarvittu avuksi, kun jokin tieto puuttuu tai edes perustiedot ovat puutteellisia.
Kunhan HisKistä ensin saataisiin edes rippikirjat ja lastenkirjat automaattisesti näkyminä/kyselyinä verrattaviksi näköispainostensa kanssa, jotta virheet havaittaisiin.

Sitten kun rippikirjat ja lastenkirjat pystytään lukemaan kaunokirjoituksista teksteiksi asti, olemme tiikerinhyppäyksen edellä automaatiota.

Ihmisen harkintakyky ja aivot kunniaan!

Olen ihan samaa mieltä. En tiedä, kuinka tuo MyHeritagen tietokanta on tehty. Kai ne kirjat on joku pieni kiinalainen lukenut. Nopeita tuloksia haikailevalle uussukututkijalle (eikö ole hyvä uudissana?) ne tarjoavat ainakin mahtavan uuden virhelähteen. Tämä esimerkki on lähes virheetön ammatin tulkintaa lukuunottamatta, jos se näkyy: https://www.myheritage.fi/research/collection-10509/suomalaiset-rippi-ja-lastenkirjat-1657-1915?s=318198791&itemId=12052767-&groupId=adc9bca5609fe733f299263a4fa883f1&action=showRecord#fullscreen

Seppo Niinioja
11.10.16, 17:14
Olen ihan samaa mieltä. En tiedä, kuinka tuo MyHeritagen tietokanta on tehty. Kai ne kirjat on joku pieni kiinalainen lukenut. Nopeita tuloksia haikailevalle uussukututkijalle (eikö ole hyvä uudissana?) ne tarjoavat ainakin mahtavan uuden virhelähteen. Tämä esimerkki on lähes virheetön ammatin tulkintaa lukuunottamatta, jos se näkyy: https://www.myheritage.fi/research/collection-10509/suomalaiset-rippi-ja-lastenkirjat-1657-1915?s=318198791&itemId=12052767-&groupId=adc9bca5609fe733f299263a4fa883f1&action=showRecord#fullscreen

Kahden viikon kokeiluaika on ilmainen, joten pitihän sitä kokeilla.

Hannu Virttaalainen
11.10.16, 17:28
Kahden viikon kokeiluaika on ilmainen, joten pitihän sitä kokeilla.
Kyllä kaikkea kokeilla voi ;). Aina voi oppia jotain uutta. Kunhan muistaa, että ilmainen kokeilu on ikivanha myyntikikka. Ilmeisen tehokas, kun sitä niin paljon jatkuvasti edelleen käytetään.

Seppo Niinioja
11.10.16, 20:45
Kyllä kaikkea kokeilla voi ;). Aina voi oppia jotain uutta. Kunhan muistaa, että ilmainen kokeilu on ikivanha myyntikikka. Ilmeisen tehokas, kun sitä niin paljon jatkuvasti edelleen käytetään.

Kokeiluaika on myös myyjän tarjoama mahdollisuus arvioida tuotetta. Ei tarvitse ostaa sikaa säkissä. Kuten postimyynnissä, palautusoikeus, tässä tapauksessa peruutusoikeus on olemassa. Minä olen tilannut käyttöoikeuden MyHeritagen Super Searchiin toistaiseksi vuodeksi muistaakseni vajaan sadan euron hintaan. Se tuo HisKin tai paremminkin amerikkalaisten Federal Census -väestönlaskentojen tietokantojen tapaisen hakumahdollisuuden rippi- ja lastenkirjoihin.
Kun on harrastanut sukututkimusta 50 vuotta, jäljellä olevat ongelmat eivät ole ihan helppoja. Odotettavissa oleva elinikäni ei riitä kaikkien niiden arvoitusten ratkomiseen, jotka haluaisin selvittää. Ei se tietysti tärkeää olekaan. Yhä vielä kiehtovaa harrastusta vain, jota yhtenä lenkkinä sukupolvien ketjussa olen vuorostani harrastanut ja jota jälkikasvu vuorostaan jatkaa.

Hannu Virttaalainen
12.10.16, 06:29
Odotettavissa oleva elinikäni ei riitä kaikkien niiden arvoitusten ratkomiseen, jotka haluaisin selvittää. Ei se tietysti tärkeää olekaan. Yhä vielä kiehtovaa harrastusta vain, jota yhtenä lenkkinä sukupolvien ketjussa olen vuorostani harrastanut ja jota jälkikasvu vuorostaan jatkaa.
Tässähän tämä on tiivistettynä minunkin käsitys tästä touhusta. Tämän pohjalta on ihan ymmärrettävää, sinun kannaltasi, että maksat ehtiäksesi vähän enemmän.

Minusta vaan kehitys on viemässä siihen, että jotta tulevaisuudessa pääsee tutkimaan suomalaisia juuriaan on maksettava Genillle(MyHeritage), Ancestor.com:lle, Microsoftille, Googlelle, Facebookille jne. Kaikille niille ei tarvitse maksaa rahaa, mutta rahanarvoista on niiden 'ilmaisiin' palveluihin syöttämämme tietokin, Vaikka Geni.com:iin yhden käyttäjän syöttämän tiedon arvo olisi vain 1 sentti, niin 100 miljoonan käyttäjän tiedoista tulee niinkin halvalla miljoona euroa. Aika pieni tuntipalkka minullekin sen sentin jakamisella tunneilla jää, vähistä Geniin syöttämistä tiedoistani, jos minä tämän sentin saisin vähennettynä kulut verot ja Geni,com:n osuus.

Arkistoihin, kuten uusimpiin kirkonkirjoihinkin jo nyt, tavallisella sukututkijalla ei tulevaisudessa ole mitään pääsyä. vaan pääsy on ulkoistettu jollekin yriykselle, joka asian halvimmalla on luvannut hoitaa, Tiedoista itse 1 sentti per haluttu tieto rahastaminen ei ole tullut mieleenkään, vaan pyydetään paljon enemmän virkailijan tuntipalkalla tekemästä työstä. Ei sovi myöskään yhteisön imagoon tämmönen rahastaminen tietotekniikalla, vaan kymmenyksiä on kerätty silti vuosisatojen ajan. Nykyään sekin, kymmenysten kerääminen, tapahtuu kyllä verohallinnon tietotekniikan avulla.

Sama koskee sitten valtiota, jonka mielestä arkistolaitos on vain kustannus, jossa pitää säästää niin paljon kuin mahdollista. Ei siis senttejä keräämällä tienata niin paljon kuin mahdollista yhteiseen kassaan, kun verohallinnon nykyjärjestelmillä prosentteja kaavoissa muuttamalla voidaan säädellä tulovirtaa ilman pienintäkään innovatiota. Vaikka moinen termi johdon suunnitelmissa teoriatasolla aika merkittävä on, siis alamaisten toiminnassa, hallituksen mielestä;).

Siis 2020 tai mitä vuosilukuja näissä projekteissa, jotka liittyvät sukututkimukseen, nyt esitetäänkin on vaan aivan liian myöhään, epäilen pahasti, oli lopputulos kuinka hieno tahansa.