PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Digitoitujen kirkonkirjojen indeksointihanke


istvank
10.06.11, 14:12
Kansallisarkiston, Suomen Sukuhistoriallisen Yhdistyksen ja Suomen Sukututkimusseuran yhteisessä hankkeessa luodaan Arkistolaitoksen Digitaaliarkistossa oleville noin 28 000 kirkonkirjoille hakemistot alkaen rippikirjoista. Hanke on avannut verkkosivut, josta löytyy hankkeen taustaa, tiedotteita ja tavoitteita sekä ohjeet vapaaehtoisille indeksoijille sekä excel -muotoinen syöttöpohja hakemistojen tekoon. Sivulla kerrotaan myös maaliskuussa 2011 alkaneen hankkeen etenemisestä. Sivua päivitetään hankkeen edetessä.

http://www.arkisto.fi/fi/arkistolaitos/tehtavat/hankkeet/kirkonkirjojen-indeksointi/

István Kecskeméti
Yksikönjohtaja
Kansallisarkisto

Tuula Cu
10.06.11, 16:33
Kiitos näistä tiedoista, nyt näkee selkeämmin, mihin voisi luvata vapaaehtoiseksi...

Luin Ohjeita ja kysyisin tarkennusta

"Näihin sarakkeisiin ei saa laittaa mitään muuta tietoa kuin kylien, talojen ja torppien nimiä. Sellaisia
selittäviä sanoja kuin torp, torppare, klockare, soldat, inhyse, rustholli, rälssitalo, yksinäistalo, nro.3
(talon numero), käsityöläiset jne. ei tila-kenttään (eikä muihinkaan kenttiin) voida laittaa. Esimerkiksi
tapauksessa, jossa käsityöläiset on merkitty omalle rivilleen, sanaa käsityöläiset ei voida hakemistoon
laittaa. Ko. rivi jätetään siis kokonaan pois."

Tarkoittaako tämä sitä, että mm. SSHY:n hakemistoissa erinomaisena tietona mukana ollut tieto tietyn kylän loisista (esim. Porvoosta: "Illby Ilola Inh et b:boer", monta sivua lähes kaikissa kylissä) jää pois ja sitten täytyy vain selata kaikki kylänloppulaiset, käsityöläiset ym? Isoissa seurakunnissa tämä vaikeuttaa tutkimista, kun kylätkin ovat isoja.

Ja jos on jäämässä pois, eikö tietokantaan voisi millään lisätä vapaatekstikenttää näitä huomautuksia varten?

Tuula K

Mikko Meriläinen
10.06.11, 23:19
Kannatettava hanke, mutta ihmetyttää se, että talojen numeroita ei saa indeksoida. Laajoissa osissa Itä-Suomea rippi- ja lastenkirjoihin ei merkitty talojen nimiä vaan nimenomaan numerot. Näin meneteltiin monin paikoin ainakin 1800-luvun puoleenväliin asti.

istvank
11.06.11, 09:35
Arkistolaitoksessa säilytettävän asiakirjallisen kulttuuriperinnön sisällölliset metatiedot löytyvät VAKKA arkistotietokannasta. VAKKA perustuu arkistojen kansainvälisen yhteistyöelimen ICA:n (International Council on Archives) vuonna 1994 hyväksymään ISAD(G) –standardiin, joka päivitettiin vuonna 1999. Hierarkisen kuvailumallin ylin käsite on arkistonmuodostaja. Hierarkia etenee tasoilla arkisto, sarja ja arkistoyksikkö. Vakassa tarkimpana entiteettinä oleva arkistoyksikkö (esim. sidos) riittää hyvin kun kyseessä ovat analogiset aineistot.

Digitoitaessa tilanne muuttuu, ja tarvitaan tarkempi metatietotaso, joka yltää arkistoyksikön sisältötasolle, asiakirjatasolle. Näitä metatietoja varten Digitaaliarkistoon on päätetty laatia asiakirjatasolle ulottuva tarkempi metatietotaso.

Arkistoyksikön osien metatietojen määrittelyn lähtökohdaksi on otettu asiakirjahallintoa varten tuotettu standardi SFS 5914 Asiakirjojen metatiedot, joka on Dublin Core –metatietoformaatin kansallinen standardisointi. Nämä asiakirjatason metatiedot on tallennettu Digitaaliarkistoon.

Asiakirjataso on muotoiltu siten, että se on mahdollista viedä osaksi myöhempää kansainvälistä integraatiota (KDK, Europeana). Metatietokenttien sisällön on oltava aineistoista toiseen vertailukelpoisia. Siksi kenttien sisältö on tarkkaan määritelty ja esitetty indeksoinnin ohjeistuksessa, joista ei saa poiketa.


Istvan Kecskeméti
Yksikönjohtaja
Kansallisarkisto

eeva häkkinen
11.06.11, 09:45
Joo, näinhän tää on. Esim. Mikkelin rippikirjoissa, jotka 1800-luvulle asti on laadittu kinkerinkiertojärjestyksessä, monet kylät (mm. kirkonkylä) ovat jakautuneet niin, että eteläpuoliskon talot sisältyvät osaan I ja pohjospuoliskon talot osaan II. Jollei talonnumeroita mainita, ei hakemistosta ole juurikaan hyötyä, koska talojen nimiä ei käytetä, eikä usein ollutkaan. Vasta myöhään 1800-luvulla annettiin henkikirjureille määräys antaa jokaiselle talolle sopiva nimi ja merkitä se kirjoihin. Onkohan joku länsisuomalainen ideoinut nää säännöt?

Siis vastaukseni oli Mikko Meriläiselle vaikka Istvank ehti väliin. Eikä minkäänlaiset byrokratiamääräykset poista tätä ongelmaa tietojen käytettävyydestä - ne olisi pitänyt antaa jo alkuperäisille asiakirjojen laatijoille. Nyt joudumme elämään sen kanssa, mitä olemme saaneet.

TimoK
11.06.11, 12:19
Arkistolaitoksessa säilytettävän asiakirjallisen kulttuuriperinnön sisällölliset metatiedot löytyvät VAKKA arkistotietokannasta. VAKKA perustuu arkistojen kansainvälisen yhteistyöelimen ICA:n (International Council on Archives) vuonna 1994 hyväksymään ISAD(G) –standardiin, joka päivitettiin vuonna 1999. Hierarkisen kuvailumallin ylin käsite on arkistonmuodostaja. Hierarkia etenee tasoilla arkisto, sarja ja arkistoyksikkö. Vakassa tarkimpana entiteettinä oleva arkistoyksikkö (esim. sidos) riittää hyvin kun kyseessä ovat analogiset aineistot.

VAKKA-tietokannassa kuitenkaan sarja ei ole vain yksi taso, vaan sarjoille on alasarjoja. Esimerkiksi seurakuntien arkistoilla ovat sarjoina väestörekisteri-, hallinto- ja talousarkistot, ja näistä esim. talousarkisto-sarjasta löytyvät edelleen vaikkapa pöytäkirjojen ja tilien sarjat.
Digitaaliarkistossa taas noudatetaan hyvin jäykästi kyseistä jakoa, siten että seurakunnan arkistossa ovat kaikki sarjat yhtenä listana. Tämä hankaloittaa selailua huolimatta siitä, että sarjat sentään on järjestetty siten, että ensin tulevat väestörekisteri-, sitten muut sarjat. Vielä merkittävämpi tämä puute on esimerkiksi Maanmittaushallituksen uudistusarkistossa, jossa kaikki kunnat ovat yhtenä luettelona, sen sijaan että ensiksi saisi valita läänin. Mistä syystä Digitaaliarkiston käyttöliittymä on tehty näin hankalaksi?

istvank
11.06.11, 13:12
Vastaus Timo K:lle:

Jos Digitaaliarkiston puunäkymä tai hakutoiminnot tuntuvat hankalammilta kuin aineiston löytäminen Vakan kautta, on hyvä tietää että Vakasta on kunkin digitoidun arkistoyksikön kohdalta linkit Digitaaliarkistoon (ja päinvastoin).

Esimerkiksi Uudistuskartat ovat Vakassa lääneittäin ja kunnittain järjestettyinä, ja sitä kautta usein on nopeampaa löytää etsimänsä aineisto.

Istvan Kecskemeti, Kansallisarkisto

keijo_h
11.06.11, 15:03
Standardit helpottavat elämää, tai sitten ei. Tallennuspohjaa katsellessa tuli mieleen pari kysymystä.
Alfa-numeerinen tallennus sinänsä lienee mahdollista? Miksei kylää voisi tallentaa muodossa Kylä1, Kylä2, Kylä3 jne? Tai tilaa muodossa Tila1, Tila2 jne?
Tilan nimet ilmestyvät kirkonkirjoihin varsin vaihtelevasti, esim. Rantasalmen kirkonkirjoissa niitä on käytetty varsin säästeliäästi ja varsin myöhään. Sen sijaan tilanumerot esiintyvät jo ensimmäisessä säilyneessä rippikirjassa vuosilta 1761-1772. Kun samaa kylää saattaa olla toistakin sataa sivua, jokin lisämääre olisi hyvinkin hyödyllinen –esim. tilanumeron käyttäminen tila-sarakkeessa, varsinkin jos tilan nimeä ei ole rippikirjassa.
Toinen kysymykseni koskee syntyneiden, kuolleiden, vihittyjen jne. luetteloita. Miten hakemistomalli toimii niissä?

kkylakos
11.06.11, 22:30
Digitoitaessa tilanne muuttuu, ja tarvitaan tarkempi metatietotaso, joka yltää arkistoyksikön sisältötasolle, asiakirjatasolle. Näitä metatietoja varten Digitaaliarkistoon on päätetty laatia asiakirjatasolle ulottuva tarkempi metatietotaso.

Arkistoyksikön osien metatietojen määrittelyn lähtökohdaksi on otettu asiakirjahallintoa varten tuotettu standardi SFS 5914 Asiakirjojen metatiedot, joka on Dublin Core –metatietoformaatin kansallinen standardisointi. Nämä asiakirjatason metatiedot on tallennettu Digitaaliarkistoon.

Asiakirjataso on muotoiltu siten, että se on mahdollista viedä osaksi myöhempää kansainvälistä integraatiota (KDK, Europeana). Metatietokenttien sisällön on oltava aineistoista toiseen vertailukelpoisia. Siksi kenttien sisältö on tarkkaan määritelty ja esitetty indeksoinnin ohjeistuksessa, joista ei saa poiketa.

Ei käsittääkseni kuitenkaan olisi ollut mahdotonta tallentaa useampia, erilaisia kenttiä? Yksi standardimuotoinen ja yksi oikeasti käyttökelpoinen? Kuten edellä olevat ovat jo kommentoineet, on isoja kyliä ja myös isoja taloja, joiden hakemiseen esitetyn mallin mukainen hakemisto ei käsittääkseni auta paljoakaan. Onkohan SSHY:n edustaja vetänyt kotiinpäin - yhdistyksen sivut tulevat jatkossakin olemaan lyömättömät yksityiskohtaisine hakemistoineen?

Pikaisesti läpiluettuna ohje ei tunnu soveltuvan ollenkaan kaupunkeihin, joita maassamme myös muutama on. Merkitsemättä jäävät kaupunginosat, tonttinumerot - puhumattakaan sukunimen alkukirjaimista?

Kataja
12.06.11, 08:40
Pikaisesti läpiluettuna ohje ei tunnu soveltuvan ollenkaan kaupunkeihin, joita maassamme myös muutama on. Merkitsemättä jäävät kaupunginosat, tonttinumerot - puhumattakaan sukunimen alkukirjaimista?

Olen käyttänyt sellaisiakin kirjoja, jotka on järjestetty etunimen mukaan! Siis Andersit, Annat jne. Tämä oli jossain Itä-Suomessa, en nyt äkkiseltään muista, missä seurakunnassa.
Marjatta

Tuisku
12.06.11, 18:02
"Onkohan SSHY:n edustaja vetänyt kotiinpäin - yhdistyksen sivut tulevat jatkossakin olemaan lyömättömät yksityiskohtaisine hakemistoineen?"

Ehei ehei! Vaan arkistolaitoksen tapa tuottaa metatietoa ja asiakirjahallintoa on vanhakantaista ja tehty henkilökunnalle itselleen. Kuka olisikaan se rohkea joka uskaltaisi muuttaa arkistojen ja valtiohallinnon asiakirjahallinnon järkeväksi ja ihmisystävälliseksi.

Julle
12.06.11, 21:23
< Vaan arkistolaitoksen tapa tuottaa metatietoa ja asiakirjahallintoa on vanhakantaista ja tehty henkilökunnalle itselleen. Kuka olisikaan se rohkea joka uskaltaisi muuttaa arkistojen ja valtiohallinnon asiakirjahallinnon järkeväksi ja ihmisystävälliseksi. >

Elämä on?
Tietojen tallennus ja talletus talletusmuodossa ovat eri asia kuin niiden käyttö ja hyödyntäminen varmaankin vähän eri muodossa.
Perustotuus kuitenkin on, että niille on löydyttävä talletusmuoto, joka on hierarkinen muoto, joka ei tietysti aina sovi niiden hakemiseen ja etsimiseen, koska jokainen eri tieto on oltava omana tietonaan.

Joku jo viittasi täällä käyttöliittymään ja sen käyttöön. Yleisin virhe niissä on, että hierarkisten tietojen tallennuksessa ei ole määritelty alemman tason tiedon kuulumista isompaan kokonaisuuteen, jotta voitaisiin käyttää edes tuoterakenne/resepti/osaluetteloa apuna - vieraskieliseltä termiltään Bill of Material (BOM) hyväksi.

Silloin löytyisi alemman tason tiedolla ylemätkin tasot, vaikka ne olisivat muuttuneetkin myöhemin. Kuten varmaan olette huomanneet talot tai kylät ovat siirtyneet toisiin seurakuntiin ja lääneihin ja joskun jopa takaisin. HisKissä naapuriseurakunnat hieman helpottaa hakemista paremmin kuin SSHYn tarkat kylä- tai talohakemistot.

Siinäpä kehittämistä kaikille osapuolille, niin HisKille, SSHYlle ja digitaaliarkistolle käytöliittymän osalta!

Käyttäjäyställistä käyttöliittymää odotellen

eeva häkkinen
12.06.11, 22:10
Olen käyttänyt sellaisiakin kirjoja, jotka on järjestetty etunimen mukaan! Siis Andersit, Annat jne. Tämä oli jossain Itä-Suomessa, en nyt äkkiseltään muista, missä seurakunnassa.
Marjatta

Tällainen kirja on ainakin Mikkelin pitäjän loisten kirja 1757. Yleensä toki myös loisten kirjat laadittiin Itä-Suomessa sukunimijärjestyksessä. Asuinpaikkoja ei näissä mainita, mutta kullekin loisperheelle on annettu numero, joka mainitaan asuintalon kohdalla tilallisten kirjoissa.

Mutta varsinaiseen asiaan: Tila tunnistettiin Länsi-Suomessa sen nimellä, Itä-Suomessa numerolla. Voiko todella olla tarkoitus, että hakumekanismi toimisi vain läntisellä systeemillä? Eikö maarekisterissä ole lännessäkin kylä ja tilan numero kylässä? Voisiko ongelman kiertää käyttämällä tilan "tunnistetta" oli se sitten nimi tai numero? Jos haluaa osoittaa, että kyseessä on nimen vastineena toimiva numero, voisi sen varmaan merkitä jotenkin, esim: [23] tai <23>.

kkylakos
13.06.11, 13:02
Elämä on?
Tietojen tallennus ja talletus talletusmuodossa ovat eri asia kuin niiden käyttö ja hyödyntäminen varmaankin vähän eri muodossa.
Perustotuus kuitenkin on, että niille on löydyttävä talletusmuoto, joka on hierarkinen muoto, joka ei tietysti aina sovi niiden hakemiseen ja etsimiseen, koska jokainen eri tieto on oltava omana tietonaan.

En ymmärrä kommenttiasi hierarkisesta muodosta. Olen itse tehnyt työtä lähes vuosikymmenen kuluttajatietojen parissa ja tottunut siihen, että yhteen kuluttajaan voidaan liittää huomattavan suuri määrä attribuutteja. Loppukäyttäjät haluavat yleensä aivan liian suurta määrää, mutta Arkistolaitoksen ohjeessa kuvailtu ~yhden kentän malli on minulle käsittämätön. Kuulisin mielelläni minkälaisten käyttöesimerkkien (use case, user story) pohjalta ohjeistus on rakennettu.

Omassa (epärealistisen työläässä) unelmamaailmassani rippikirjan sivuista olisi kirjattu tietue, jossa kenttiä kuten

Sivunumero
talon/tontin nimi originaali
talon/tontin nimi normalisoitu
talon numero
kylän nimi originaali
kylän nimi normalisoitu
muu otsikointi
sivun sukunimiä...Ja näiden arvoista yhdistämällä olisi kyllä saatu KDK/Europeana yhteensopiva versio.

KKujansuu
11.08.11, 18:49
Hei

jos nyt näyttää siltä että Arkistolaitoksen hakemistot eivät oikein tyydytä sukututkijoiden tarpeita, niin estääkö mikään tekemästä "ulkoisia" hakemistoja digitaaliarkistoon? Siis niin, että hakemistot olisivat jollain erillisellä sivustolla ja niissä olisi vain linkit Arkistolaitoksen kuviin.

Askartelin tästä jonkinlaisen prototyypin osoitteeseen http://digihakemisto.appspot.com/.

Tein sinne myös muutaman hakemistontyngän, esimerkiksi: http://digihakemisto.appspot.com/index_ay?amnimeke=Tampereen+tuomiokirkkoseurakunna n+arkisto&sarnimi=P%C3%A4%C3%A4-+ja+rippikirjat&aynimi=Rippikirjat+1860-1866&ay=1764014&sartun=224727.KA&atun=314303.KA

Tässä vasemman reunan linkistä pääsee editoimaan hakemistoa ja oikean reunan linkistä pääsee suoraan Arkistolaitoksen vastaavalle sivulle.

Ajatukseni olisi siis myös se että kuka tahansa voisi tehdä näitä hakemistoja suoraan nettiin ja olemassaolevia hakemistoja voisi myös korjata ja täydentää.

Mitä mieltä olette? Olisiko tässä järkeä?

Kari

istvank
11.08.11, 19:24
Indeksointihankkeen ideana on, että kuka tahansa vapaaehtoinen voi arkistolaitoksen excel-pohjalle luoda tai kopioida jo tehdyn oman hakemistonsa (noudattaen metadataohjeita), hakea Digitaaliarkistosta kyseisen aukeaman jaksonumeron (linkki kuvaan) ja lähettää meille liitettäväksi järjestelmään. Vaihtoehtona on pyytää meiltä valmis hakemisto, johon vapaaehtoinen liittää jaksonumeron.

Rippikirjoista kerätään alkuperäinen sivunumero, päättyvä rajavuosi (silloin kun sen avulla saadaan osa arkistoyksikköä eli rippikirjaa avattua 125 v säännöltä julkiseksi), kylän nimi, talon/tilan nimi sekä jaksonumero (linkki kuvaan).

Indeksointihankkeen kerättävät metakentät ovat nimenomaan sukututkijoiden kanssa valittuja. Hankkeessahan on mukana Suomen Sukututkimussseura ja Suomen Sukuhistoriallinen yhdistys arkistolaitoksen ohella. Hankkeen sivulta löytyy ajankohtaista tietoa http://www.arkisto.fi/fi/arkistolaitos/tehtavat/hankkeet/kirkonkirjojen-indeksointi/

Ohjeet ja syöttöpohja löytyvät em sivulta, joten kaikki mukaan talkoisiin! Saanko ehdottaa KKujansuulle että tekisit vastaavat hakemistot meidän pohjaamme ohjeittemme mukaisesti ja vaikka lähettäisit excelit minulle henkilökohtaisesti (istvan.kecskemeti*narc.fi). Lupaa liittää ne heti Digitaaliarkistoon itse.

KKujansuun esittämä toimintatapa kertoo kiitettävästä aktiivisuudesta, jonka soisin kohdistuvan yhteiseen indeksointihankkeeseemme. Valitettavasti Digitaaliarkiston ulkopuoliset linkit eivät välttämättä toimi sen jälkeen kun pian laajennamme verkkopalvelujamme. Edellisessä viestissä esitetyllä tavalla tehtynä työ ei ole pitkäikäistä, toisin kuin indeksointihankkeessa, jossa sekä kuvat että hakemisto ovat samoilla Kansallisarkiston palvelimilla, jotka ovat toiminnassa niin kauan kuin digitaalisia kuvia yleensä halutaan näyttää.

Indeksointityömme on vasta alussa, mutta etenee syksyn aikana nopeasti. Kaikkien vapaaehtoisten työpanosta kaivataan, jotta pääsemme rippikirjojen jälkeen jatkamaan muiden digitoitujen aineistojen indeksoinnilla.

Lopuksi vielä linkki uusimpaan tällä viikolla ladattuun hakemistoon:
http://digi.narc.fi/digi/hak_view.ka?hakid=3171

Yhteistyöterveisin
István Kecskeméti
yksikönjohtaja, Kansallisarkisto
Kirkonkirjojen indeksointihankkeen ohjausryhmän puheenjohtaja

Bertarido
11.08.11, 22:28
Eikös nuo linkissä kuvatut Merijärven kylät ole tehty vastoin ohjeita - talojen numeroitahan ei saanut alkuperäisen ohjeen mukaan lisätä (Ohje indeksoijille, sivu 2)?


Rippikirjoista kerätään alkuperäinen sivunumero, päättyvä rajavuosi (silloin kun sen avulla saadaan osa arkistoyksikköä eli rippikirjaa avattua 125 v säännöltä julkiseksi), kylän nimi, talon/tilan nimi sekä jaksonumero (linkki kuvaan).

Indeksointihankkeen kerättävät metakentät ovat nimenomaan sukututkijoiden kanssa valittuja. Hankkeessahan on mukana Suomen Sukututkimussseura ja Suomen Sukuhistoriallinen yhdistys arkistolaitoksen ohella. Hankkeen sivulta löytyy ajankohtaista tietoa http://www.arkisto.fi/fi/arkistolaitos/tehtavat/hankkeet/kirkonkirjojen-indeksointi/

Ohjeet ja syöttöpohja löytyvät em sivulta, joten kaikki mukaan talkoisiin! Saanko ehdottaa KKujansuulle että tekisit vastaavat hakemistot meidän pohjaamme ohjeittemme mukaisesti ja vaikka lähettäisit excelit minulle henkilökohtaisesti (istvan.kecskemeti*narc.fi). Lupaa liittää ne heti Digitaaliarkistoon itse.

KKujansuun esittämä toimintatapa kertoo kiitettävästä aktiivisuudesta, jonka soisin kohdistuvan yhteiseen indeksointihankkeeseemme. Valitettavasti Digitaaliarkiston ulkopuoliset linkit eivät välttämättä toimi sen jälkeen kun pian laajennamme verkkopalvelujamme. Edellisessä viestissä esitetyllä tavalla tehtynä työ ei ole pitkäikäistä, toisin kuin indeksointihankkeessa, jossa sekä kuvat että hakemisto ovat samoilla Kansallisarkiston palvelimilla, jotka ovat toiminnassa niin kauan kuin digitaalisia kuvia yleensä halutaan näyttää.

Indeksointityömme on vasta alussa, mutta etenee syksyn aikana nopeasti. Kaikkien vapaaehtoisten työpanosta kaivataan, jotta pääsemme rippikirjojen jälkeen jatkamaan muiden digitoitujen aineistojen indeksoinnilla.

Lopuksi vielä linkki uusimpaan tällä viikolla ladattuun hakemistoon:
http://digi.narc.fi/digi/hak_view.ka?hakid=3171

Yhteistyöterveisin
István Kecskeméti
yksikönjohtaja, Kansallisarkisto
Kirkonkirjojen indeksointihankkeen ohjausryhmän puheenjohtaja

kkylakos
12.08.11, 06:47
Indeksointihankkeen kerättävät metakentät ovat nimenomaan sukututkijoiden kanssa valittuja. Hankkeessahan on mukana Suomen Sukututkimussseura ja Suomen Sukuhistoriallinen yhdistys arkistolaitoksen ohella. Hankkeen sivulta löytyy ajankohtaista tietoa http://www.arkisto.fi/fi/arkistolaitos/tehtavat/hankkeet/kirkonkirjojen-indeksointi/

Kun yllä esittettyihin, minusta oleeellisiin, huolenaiheisiin hakemistomallista ei vastata mitään, on niitä turha toistaa ja herää mielikuva, ettei sukututkijoiden edustajienkaan mielipiteitä ole suuremmin työryhmässä kuunneltu. Aikaisemmassa viestissäni ollut kuittaus SSHY.n edustajan kotiinpäinvedosta oli tarkoitettu vitsiksi, sillä oli mielestäni itsestään selvää, ettei hän kokemuksellaan olisi hyväksynyt tätä hakemistomallia ehdottamatta siihen oleellisia parannuksia.

KKujansuun esittämä toimintatapa kertoo kiitettävästä aktiivisuudesta, jonka soisin kohdistuvan yhteiseen indeksointihankkeeseemme. Valitettavasti Digitaaliarkiston ulkopuoliset linkit eivät välttämättä toimi sen jälkeen kun pian laajennamme verkkopalvelujamme. Edellisessä viestissä esitetyllä tavalla tehtynä työ ei ole pitkäikäistä, toisin kuin indeksointihankkeessa, jossa sekä kuvat että hakemisto ovat samoilla Kansallisarkiston palvelimilla, jotka ovat toiminnassa niin kauan kuin digitaalisia kuvia yleensä halutaan näyttää.

Olen nyt jonkin aikaa yrittänyt puolihuolimattomasti seurata kulttuuriperinnön digitoinnin ympärillä käytyä keskustelua. Ymmärtääkseni siinä pidetään yleisesti hyvänä ideana, että digitaalisen/digitoidun aineiston päälle voidaan rakentaa ulkopuolisia ratkaisuja. Toivottavasti Arkistolaitos on sen verran trendeissä mukana, ettei kuvien URL:jä aivan alvariinsa muuteta ja, että niissä pysyy mukana joku fiksattu tunniste. Ja että kuviin voidaan viitata suoralla linkillä! Sinänsä URL:ien muuttuminen tulee harmittamaan varmasti monia digitaaliarkistoa tähän mennessä käyttänyttä, esimerkiksi minulla on tallessa kymmeniä sivuja tutkimusprojektiin liittyviä voudintiliviitteitä, joita ei mielellään lähtisi hakemaan polkujen takaa.

Minusta Karin ehdotus oli mielenkiintoinen ja tuli mieleen Yhdysvaltain Kansallisarkiston kesällä aloittama protyyppihanke, jossa arkiston käyttäjät itse päättävät mitkä sanat kuvaavat yksittäistä dokumenttia (http://blogs.archives.gov/online-public-access/?p=5379 ). Tällaiseen toimintaan olisin itsekin innokkaammin osallistumassa kuin takomassa hakemistoja, jotka katson suurelti hyödyttömiksi. Näkemyksiäni (ilmiselvästi) turha enää toistaa, jos jollekin epäselviä, niin yksi versio löytyy blogistani kesäkuulta http://sukututkijanloppuvuosi.blogspot.com/2011/06/metatiedoista-indeksoinnista-ja.html

istvank
12.08.11, 12:06
Eikös nuo linkissä kuvatut Merijärven kylät ole tehty vastoin ohjeita - talojen numeroitahan ei saanut alkuperäisen ohjeen mukaan lisätä (Ohje indeksoijille, sivu 2)?

Indeksointihankkeen projektiryhmä on pohtinut asiaa kesän aikana ja päätynyt siihen, että talon numero saa olla tila/talo metakentässä. Uudet ohjeet on päivitetty indeksoinnin verkkosivuille tänään. Viestissäni linkin alla esitelty hakemisto on tehty uusien ohjeiden mukaan.

István Kecskeméti, Kansallisarkisto

istvank
12.08.11, 12:19
Kaisa Kyläkosken viesteistä;

Näistä Kyläkosken unelmatoiveista indeksointihanke toteuttaa seuraavat, eli puolet:

Sivunumero
talon/tontin nimi originaali
talon numero
kylän nimi originaalisekä tietysti linkin itse kuvaan

Metatietokenttien on oltava standardien mukaisia. Indeksoinnissa me toimimme valittujen metakenttien avulla, emmekä aio toistaiseksi laajentaa kentästöä tästä laajemmaksi.

Arkistolaitos seuraa aktiivisesti digitoinnin ja verkkopalvelujen kehitystä ja on mukana uusimmassa kehityksessä. Kyläkosken mainitsemien ulkopuolisten palveluiden sekä fiksattujen tunnisteiden käyttöönotto on tärkeää. Varsinkin kiinteän viittauskäytännön soveltaminen on meille tärkeää ja valmistelutyön kohteena.

terveisin
István Kecskeméti, kansallisarkisto

admin
12.08.11, 17:06
Sain nyt vasta aikaa selata tämän viestiketjun läpi. Muutama tenkkapåå tuli mieleen...

Maalaisjärjellä ajatellen olisi ehkä fiksuinta tallentaa tarpeeksi paljon tietoja sivuilta silloin kun jokaista sivua kerran kuitenkin käy läpi. Tämä ettei turhaan "joudu" sivuja käymään läpi toisenkin kerran jos ja kun on tarvetta paremmille hakutoiminnoille.

Ymmärrän täysin että hakukenttiä täytyy ainakin löytyä niin että standardi täyttyy mutta tämä ei estä että samalla tallennetaan myös esim. Kyläkosken esilletuomia kenttiä - kuten sivukuvassa esiintyviä sukunimiä. Kansallisarkiston väki saa sitten siirtää se osa taulukosta tietokantaan mikä mahtuu nykystandardiin ja loput tiedoista jää ns. tulevaisuuden varalle joko Kansallisarkiston omaan tietokantaan tai - mikäli siihen löytyy tarvetta - johonkin sukututkijoiden omaan laajempaan kantaan joka pelkästään viittaa Kansallisarkiston kuviin/sivuihin.

Itse lähdin tallentamaan ns. omaan käyttöön pieneen KBBAS -tietokantaan tällaisia kenttiä/tietoja (ote Kruunupyyn seurakunnan kirjasta 1855-1861) - samalla kun olin etsimässä yhtä henkilöä "heinäsuovasta"...
http://suku.genealogia.fi/ohje/KBBAS_01.png

Itseäni hiukan askarruttaa miten sivun otsikkoa kannattaisi merkata. Rippikirjojen kohdalla talo tai sivun otsikko (mahdollisesti ko. talonimi /-nimet jonka alle torppa kuului lisättynä) tuntuisi loogiselta, mutta ohjeiden mukaan mielestäni jää epäselvyyksiä:

... hakemistossa ei ole omaa riviä jokaista sivunumeroa varten. Jokainen talo tai torppa merkitään hakemistoon, joten jos samalla sivulla on esim. useampi talo, peräkkäisillä riveillä voi olla sama sivu- ja jaksonumero...

Esimerkkiaineistoni 280 sivujen joukossa oli 37 sivua jossa otsikko "Torpare", 34 sivua "husfolk", 8 sivua "å socknens gemensamma mark boende". Eli paljon "silppua" joka ei välttämättä helposti väänny ohjeen mukaiseen muotoon ilman pelkoa että tallennettu tieto voi olla puutteellinen.

Esimerkki on maaseudulta ja oletan kaupungeista löytyvän muitakin mielenkiintoisia "hakuehtokandidaatteja" - mutta niistä minulla ei ole kovin paljon kokemusta.

Jos ajattelen käytön kannalta niin ainakin minua kiinnostaisi pystyä etsimään millä sivuilla on esim. mainittu naapuriseurakunnasta tulleita, tietyn sukunimen omaavia sekä käsityöläiset/ammatinharjoittajat/viranhaltijat ilman että joutuisi selaamaan läpi koko kirja - varsinkin kun nyt selaaminen ei ole kovin nopea. Tästä syystä kirjansin pääpiirteittäin sivulla esiintyviä sukunimiä/ammattinimikkeitä jne. erilliseen "Info" kenttään. Samoin jokaiselle sivulle tein oman tietueen. Mikäli sivulla oli kahden talonalaista torppaa ym. mainitsin otsikossa näiden talojen nimet lisätietona. Voin siis etsiä
missä löytyy Bäck sukunimellä oleva henkilö torppareiden ja muiden ei-talollisten joukosta
mistä löytyy suutari/-t tai -kisällit tms.
missä "Kackurs" talon torppia,
missä Kackurs talon tiedot
missä henkilöitä jotka ovat siirtyneet Kackursilta tai Kackurs'iin jne.
hae kaikki torpparit
...Olisiko täysin mahdotonta aikaansaada ylimääräinen indeksoitu/hakukelpoinen (freetext) infokenttä vai onko todellakin ajatus että mikäli "husfolk'ien/torppareiden/kunnan mailla asustelevien" joukosta etsii jonkun henkilön niin joutuu mahdollisesti 80 sivua selaamaan läpi kuten omassa esimerkkitapauksessani? Tietojen syöttäminen tietokantaan ja indeksien teko hakumoottoria vartenhan pitäisi mielestäni yrittää saada mahdollisimman joustavaksi ja toimivaksi. Ylimääräinen kenttä ei sekään riko standardia - se vaan lisää mahdollisuuksia, standardimuotoisen haunhan pystyisi kuitenkin tekemään...

Olenkohan ymmärtänyt asian/mahdollisuudet/standardit täysin väärin?

Hasse

istvank
12.08.11, 18:10
Vastauksena Hassen kommentteihin:

Arkistolaitoksen Digitaaliarkistoon tulevien rippikirjojen hakemistojen metatiedot kerätään ja viedään exceliin ohjeiden mukaan. Metatietokentät on tarkoituksellisesti rajattu vain muutamaan.

Hakemiston tekijä voi ja saa tehdä niin laajan hakemiston excel pohjaamme, kun haluaa, mutta meille tulevassa versiossa "ylimääräinen" tieto pitää karsia pois. Meillä ei ole siihen resursseja.

Käytännössä tämä tarkoittaisi, että vapaaehtoiset tekisivät kaksi versiota hakemistosta. Otamme toki vastaan laajemmatkin versiot ohjeiden mukaan tehtyjen kera, mutta ne jäävät sitten odottamaan mahdollista myöhempää käyttöä. Laajemmista versioista voi olla hyötyä SSHYn kannassa.

István Kecskeméti
Kansallisarkisto

E Juhani Tenhunen
15.08.11, 19:11
Kylien 1700-luvulla käyttöön otettu (kanta)tilanumerointihan on edelleen käytössä kiinteistörekisterissä. Viralliset tilanimet ovat myöhempää perua. Samoin kaupunkien kaupunginosanumerot ovat edelleen suurelta osin käytössä. Kun käytetään numeroita eli digitoidaan, olisi syytä käyttää numeroita myös indeksoinnissa. :D: