PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Korjaukset ennen tarjokaskantaan vientiä


tkukkonen
26.11.14, 13:45
Siteeraan itseäni.
onko syytä tehdä ensin siirto Finfamilystä johonkin muuhun ohjelmaan ensin, siis sellaiseen ohjelmaan, jonka tekemää gedcomtiedostoa Taapeli lukee ja "kääntää" sujuvasti. Tai vaihtoehtoisesti, kun Taapelin välineillä analysoidaan "raaka" gedcom, siitä palautettaisiin uusi ja osin automaattisesti korjailtu versio tutkijalle ladattavaksi toiseen ohjelmaan, jossa esimerkiksi lähdeviitteiden viimeistely on tehokasta. Mikä on kokonaisuuden kannalta tehokkain eli tutkijan käsityötä säästävä tapahtumien kulku ja mikä on suositeltava ohjelmisto?
Tiedän asiasta nyt enemmän (koska olen nähnyt tarkistusvälineiden löytämiä poikkeavuuksia). Huomaan, että kyllä omassa Finfamilyssänikin voi tehdä monenlaisia korjauksia, jotka vievät kohti toivottua lopputulosta. Tiedostojen edestakaisin lähetys on tässä tapauksessa ollut oleellista tämän tiedon lisäämisessä. En olisi ilman tätä palautetta havainnut näitä korjauskohtia. Niitä on esimerkiksi aviottomien lasten kuvaus ja aikatarkistusten havaitsemat löydökset (liian nuori avioon mennessä jne).
Osan näistä voisi havaita jo ohjelman (kuten minun tapauksessani FF:n) omilla etsintätyökaluilla tai sen tekemästä gedcomista.

Ohjeistus esimerkiksi Taapeli-projektin taholta olisi hyväksi, että muutkin tutkijat huomaisi hakea kannastaan korjattavia henkilö- tai perhetietoja esille jo ennenkuin ne menevät Taapelin tarjokaskantaan.

PekkaV
28.11.14, 16:55
Hyvä vinkki hyödyntää oman sukututkimusohjelman tarkistusominaisuuksia, jos niitä löytyy. Kertokaapa, mitä oma ohjelmasi tarjoaa tarkistustukena. Jos se puuttuu kokonaan, niin vanhemmista erillistyökaluohjelmista Genealogia Graficassa löytyy koko joukon loogisia ristiriitoja.

Seuran syyskokouksessa esiteltiin Taapeliprojektin valitsema GSP työkalusetti gedcomin tarkistuksiin ja rakennemuokkauksiin. Sitäkin tutkijoiden kannattaa hankkia omaan käyttöön, jos haluaa aloittaa laatutyön ajoissa tai vastaanottelee toisten tutkijoiden gedcomeja. Suomennos on tekeillä ja tukea saa ainakin allekirjoittaneelta.

http://ofb.hesmer.name/gedserpro_e.html

Taapelin puolesta
Pekka Valta

PekkaV
28.11.14, 16:59
Toki Taapeli antaa suosituksia ja ohjeita tietojen syöttötapoihin, mutta vasta jonkin ajan kuluttua. Seuratkaa tämän foorumin ilmoituksia.

Sama

Jukkis
28.11.14, 19:01
Voisiko näistä automaattisista tarkastuksista keskustellä ohjelmien suunnittelijoiden kanssa "taapelin" vaatimuksista jo ennakkoon?

Ainakin Suomalaisten ohjelmien tekijät voisivat olla kiinnostuneita jo markkinoitimielessä.

t-Jukkis

PekkaV
11.12.14, 11:03
Sukututkimusohjelmasta johtuvia puutteita gedcom-tiedostossa, joita ei voisi korjata jälkikäteen sopivalla työkalulla, on useimmiten onneksi melko melko vähän. Vakavimmat liittyvät siihen, että ohjelman tietokantaratkaisu ei tue lainkaan esim. lähteiden antamista kolmijaolla "lähde - tarkempi paikka siinä - arkisto".

Vaikuttamismahdollisuudet parantaa tutkija-aineistoja suomalaisten sukututkimusohjelmien kehittämisen kautta ovat hyvin rajalliset. Onko muita kuin Sukujutut ja rajoitetusti FinFamily, joille löytyy edes kehtystukea?

Taapelin puolesta
Pekka Valta

ps. Taapeli on sen projektin nimi, joka kehittää Suomi-tietokantapalvelua.

Julle
12.12.14, 21:54
< Sukututkimusohjelmasta johtuvia puutteita gedcom-tiedostossa, joita ei voisi korjata jälkikäteen sopivalla työkalulla, on useimmiten onneksi melko melko vähän. Vakavimmat liittyvät siihen, että ohjelman tietokantaratkaisu ei tue lainkaan esim. lähteiden antamista kolmijaolla "lähde - tarkempi paikka siinä - arkisto".>

Minusta se lähdeviitteen muoto eli viittausteknikka pitäisi erottaa itse lähdeluettelon muodosta! Siis kaksi eri asiaa!

Yleensä käytän kahta viittaustekniikkaa sitä ylänumerolla olevaa ja toista Harvardin muotoa, johon kuuluu tekijän sukunimi (tai tekijät), julkaisun nimi tms. painovuosi + mahdolliset sivut. Ongelma onkin yleensä, että näillä yhteisön tekemillä rippikirjoilla tms. ei ole varsinaista tekijää? Sukukirjat ovat eri juttu, niiille löytyy tekijä, teoksen nimi ja vuosiluvut sekä sivunumerot tai -taulut. Ja yleensä tähän samaan rippikirjaan on paljon viitteitä samasta perheestä.

Toinen juttu on lähdeluettelon muoto, joka mielestäni koostuu yleensä Kuka (Kirjoittaja), Milloin (Aika), Mitä (Otsikko), Missä (Julkaisukanava tai julkaisija), mutta siihen löytynee säännöt Hirsjärven & kumppanit kirjasta Tutki ja Kirjoita, kuten varmaan myös viittaustekniikkaan. Lähteitäkin on sitten kuutta eri muotoa ainakin, esim. kirjat, artikkelit, raportit, audiovisuaalinen aineisto tms.

Eikä nämä sitten olleet mitään pyyhkeitä Taapelille, niitä näyttää löytyvän Marimekon tuotevalikoimistakin ;-)

Tutkimisiin

PekkaV
12.12.14, 23:10
Kommenttisi Julle on "jautaa" , kun on kysymys kirjallisuuslähteistä. Itse asiassa ne eivät kuitenkin ole sukututkimuksen tavanomaisia lähteitä. Niitähän ovat Suomessa seurakuntien historiakirjat, rippikirjat, veroluettelot, tuomiokirjat yms.

Olemme Taapelissa kaavailleet niille alustavan suosituksen, joka ehkä selviää parhaiten esimerkeistä. Niissä 1. osa on Arkisto (REPO), 2 osa Lähde (SOUR) ja 3. osa Tarkempi paikka (CITA="volume/page):

Joutsan seurakunnan arkisto, Joutsa KH 1880-1889, s. 145
Henkikirjat, Joutsa HK 1880-1889, aukeama 56
Jussi Liukkosen kotiarkisto, Mäntylän kauppakirja 1898, s. 3 todistajat
Nettisivustot, Berneriana sivusto, Ylioppilasmatrikkeli 1640-1852
Historiallinen sanomalehtiarkisto, Itä-Häme, 27.5.1891 s. 3 palsta 2

Näissä ns. Julkaisu tieto (Publication) olisi NARC:In, SSHY:N ja vastaavan digipalvelun URI (nettiosoite). CITA-tiedon lisätiedossa olisi ao. digipalvelusivussa avatun kuvan URI, josta on vaivaton siirtyä tarkastamaan digikuvaa. Sehän on tässä tapauksessa alkuperäisen lähteen veroinen.

Huomannet, että Hiskiä ei mainita em. esimerkeissä. Tarkoituksellista. Vaikka Hiski-tapahtuman tiedot on pääsääntöisesti johdettu oikein alkuperäisestä lähteestä, se ei tee Hiskistä itsestään lähdettä. Hiski-linkin URI on kuitenkin hyödyllinen lisätieto ja se voitaisiin kirjata varsinaisen lähdetiedon lisätiedoksi. Toinen mahdollisuus on, että tutkija perustaa Hiski-nimisen yleisen "lähteen" ja kirjaa sen alle "tarkempia paikkatietoja" eli Hiski-tapahtuman URI-tietoja. Nehän ovat muuten muotoa http://hiski.genealogia.fi/hiski?fi+t13678. Näin "Hiski-lähdeviittaukset" pysyvät sivuroolissaan.

Vakioitu lähdekäytäntö on edellytys sille, että myös lähdetietoja voidaan käyttää, kun puhdistetaan henkilökahdennuksia tutkijan aineiston ja Suomi-tietokannassa jo olevien henkilöiden välillä.

Miltä yllä oleva tuntuu?

______________________
Taapelin puolesta
Pekka Valta

Pietari Jörönpoika
13.12.14, 06:31
Kommenttisi Julle on "jautaa" , kun on kysymys kirjallisuuslähteistä. Itse asiassa ne eivät kuitenkin ole sukututkimuksen tavanomaisia lähteitä. Niitähän ovat Suomessa seurakuntien historiakirjat, rippikirjat, veroluettelot, tuomiokirjat yms.

Olemme Taapelissa kaavailleet niille alustavan suosituksen, joka ehkä selviää parhaiten esimerkeistä. Niissä 1. osa on Arkisto (REPO), 2 osa Lähde (SOUR) ja 3. osa Tarkempi paikka (CITA="volume/page):

Joutsan seurakunnan arkisto, Joutsa KH 1880-1889, s. 145
Henkikirjat, Joutsa HK 1880-1889, aukeama 56
Jussi Liukkosen kotiarkisto, Mäntylän kauppakirja 1898, s. 3 todistajat
Nettisivustot, Berneriana sivusto, Ylioppilasmatrikkeli 1640-1852
Historiallinen sanomalehtiarkisto, Itä-Häme, 27.5.1891 s. 3 palsta 2

Näissä ns. Julkaisu tieto (Publication) olisi NARC:In, SSHY:N ja vastaavan digipalvelun URI (nettiosoite). CITA-tiedon lisätiedossa olisi ao. digipalvelusivussa avatun kuvan URI, josta on vaivaton siirtyä tarkastamaan digikuvaa. Sehän on tässä tapauksessa alkuperäisen lähteen veroinen.

Huomannet, että Hiskiä ei mainita em. esimerkeissä. Tarkoituksellista. Vaikka Hiski-tapahtuman tiedot on pääsääntöisesti johdettu oikein alkuperäisestä lähteestä, se ei tee Hiskistä itsestään lähdettä. Hiski-linkin URI on kuitenkin hyödyllinen lisätieto ja se voitaisiin kirjata varsinaisen lähdetiedon lisätiedoksi. Toinen mahdollisuus on, että tutkija perustaa Hiski-nimisen yleisen "lähteen" ja kirjaa sen alle "tarkempia paikkatietoja" eli Hiski-tapahtuman URI-tietoja. Nehän ovat muuten muotoa http://hiski.genealogia.fi/hiski?fi+t13678. Näin "Hiski-lähdeviittaukset" pysyvät sivuroolissaan.

Vakioitu lähdekäytäntö on edellytys sille, että myös lähdetietoja voidaan käyttää, kun puhdistetaan henkilökahdennuksia tutkijan aineiston ja Suomi-tietokannassa jo olevien henkilöiden välillä.

Miltä yllä oleva tuntuu?

______________________
Taapelin puolesta
Pekka Valta

Pari seikkaa jäi näin ensilukemalta askarruttamaan:

1. Noiden URI-viittausten pysyvyys - osoitteet saattavat joskus vaikka yllättäen muuttua ja sen vaikutus lähdeviitteisiin. Toisaalta sama asiakirja voi löytyä useasta saman arkiston säilytyspaikasta sähköisessä muodossa ja ehkä myös mikrofilmiltä tai -kortilta.
Olisi ehkä hyvä jos lähdetiedot olisi selkokielellä, esim. Joutsan seurakunnan arkisto, Rippikirja 1880-1889, s.145 (nämä tiedot pätevät arkiston säilytyspaikasta riippumatta) ja lisäksi (rinnakkaiset) linkit tiedossa oleviin ko. lähteen/arkiston säilytyspaikkoihin (NARC, SSHY, ja mikrofilmin/kortin tunnistetiedot). Taitaa tämä säilytyspaikkojen rinnakkaisuus ja mahdollinen linkkiosoitteiden muuttuminen/päivitystarve olla teillä jo valmiiksi pohdittunakin?

2. Lähteiden luokittelu: primääriset (alkuperäiset asiakirjat) ja sekundääriset (alkuperäisten asiakirjojen tietojen perusteella laaditut uudet julkaisut, esim. sukukirjat, HisKi). Sekundääriset lähdetiedot ovat monesti ainakin tutkimustyötä jouduttavia ja muutoinkin kiintoisia, vaikka lopullisia johtopäätöksiä niiden perusteella ei voi tehdä. Olisiko tälläisessä luokittelussa mitään ideaa? Rajanvetokysymyksiin tässä voi kyllä ehkä joutua?

ps. Kirjoiteltu aamutokkuraisin silmin...

PekkaV
13.12.14, 10:36
Komppaan.

Lähdetieto selkokielisenä on lähtökohta ja edellytys. Johdonmukaisista lyhenteistä (kuten esimerkissä KH=kuolleet ja haudatut) annettaneen ohjeet. Lyhenteet säästävät tutkijan kirjoitustyötä.

URI-tiedot ovat vain helpottamassa alkuperäisen digikuvan nopeaa löytämistä. Niihin liittyy mainitsemasi pysyvyysongelma. Onneksi ainakin NARC:lla on jo suunnitelmissaan "permanentit" digiosoitteet.

Sukukirjat, Hiski yms. "Mestersonit" ovat toki meidän kaikkien käyttämiä esitutkimusvinkkejä, mutta ei kai ne ole edes historiallisen tutkimuksen sekundäärisiä lähteitä? Ks. esim. https://peda.net/oppimateriaalit/e-oppi/k2/tohmajarvi-2014/epookki2/hpl. Tutkimusviitteitä korkeintaan?

Esimerkeissä oleva "Ylioppilasmatrikkeli 1640-1852" kuuluu nähdäkseni siksi sekundäärisiin lähteisiin, että se perustuu yliopiston hallussa olleisiin opiskelijatietoihin, joita on sitten hieman laajennettu bibliografian suuntaan.

______________
Taapelin puolesta
Pekka Valta

Pietari Jörönpoika
13.12.14, 14:10
Sukukirjat, Hiski yms. "Mestersonit" ovat toki meidän kaikkien käyttämiä esitutkimusvinkkejä, mutta ei kai ne ole edes historiallisen tutkimuksen sekundäärisiä lähteitä? Ks. esim. https://peda.net/oppimateriaalit/e-oppi/k2/tohmajarvi-2014/epookki2/hpl. Tutkimusviitteitä korkeintaan?

Esimerkeissä oleva "Ylioppilasmatrikkeli 1640-1852" kuuluu nähdäkseni siksi sekundäärisiin lähteisiin, että se perustuu yliopiston hallussa olleisiin opiskelijatietoihin, joita on sitten hieman laajennettu bibliografian suuntaan.

______________
Taapelin puolesta
Pekka Valta

Perusajatukseni oli erotella varsinaiset primääriset lähteet muista "lähteistä" ja nimesin ne tässä sekundäärikisi lähteiksi - nimitys ei liene paras mahdollinen tähän tarkoitukseen (muut viitteet tms.?). Mikään ei estäne käyttämästä useampaakin luokkaa, jos niiden merkitys vain pystytään määrittelemään yksikäsitteisesti ja jos luokittelusta on ylipäätään mitään hyötyä. Luokittelu voisi ainakin selventää viittauksen merkitystä, jos se ei ilmene jo muutoin asiayhteydestä. Onko tarkoitus kytkeä lähdeviittaukset henkilöön vaiko tapahtumiin?

Julle
13.12.14, 15:29
< Perusajatukseni oli erotella varsinaiset primääriset lähteet muista "lähteistä" ja nimesin ne tässä sekundäärikisi lähteiksi - nimitys ei liene paras mahdollinen tähän tarkoitukseen (muut viitteet tms.?). Mikään ei estäne käyttämästä useampaakin luokkaa, jos niiden merkitys vain pystytään määrittelemään yksikäsitteisesti ja jos luokittelusta on ylipäätään mitään hyötyä. Luokittelu voisi ainakin selventää viittauksen merkitystä, jos se ei ilmene jo muutoin asiayhteydestä. Onko tarkoitus kytkeä lähdeviittaukset henkilöön vaiko tapahtumiin? >

Ymmärrän. Brother´s Keeper ainakin tukee lähdeaineistojen laadun ilmoittamista luokittelulla
3 Ensisijainen tai erittäin luotettava
2 Toissijainen tai melko luotettava
1 Kyseenalainen
0 Epäluotettava

Enpä ole tuota nollaa, tarvinnut, koska silloin jätän sen pois!
Samoin BK tukee lähdeviittauksen antamista tapahtumittain, henkilötaso ei mielestäni edes riittäisi ajallisen janan takia.

Pekan esimerkit näyttävät ihan hyviltä, vaikka taidan silti pyrkiä varmuuden vuoksi ISO 690 eli SFS 5989:2012 soveltuvin osin. Viittaus tarvinnee laatijan, otsikon, vuoden ja sivunumeron, miten se sitten ilmoitetaankin fyysisestä asiakirjasta.

Näyttää Yucca jo kommentoineen myös "haihtuvien" veppiosoitteiden kannalta, joiden ilmoittamisesta ja ylläpidosta luovuin.
https://www.cs.tut.fi/~jkorpela/kielenopas/5.7.html

Tutkimisiin

Julle
13.12.14, 15:50
< Hyvä vinkki hyödyntää oman sukututkimusohjelman tarkistusominaisuuksia, jos niitä löytyy. Kertokaapa, mitä oma ohjelmasi tarjoaa tarkistustukena. Jos se puuttuu kokonaan, >

Laatutarkastus - missä yleensä lapset syntymäajan mukaan väärässä järjestyksessä
Tuplavanhemmat - harvoin, mutta joskus
Yksittäiset henkilöt, joilla ei sukuyhteyksiä ollenkaan - löytyy yleensä yhdistämisien jälkeen
Sopivuustarkistus - elinkaari oikein eli syntymä, kastettu, kuollut, haudattu, vihitty, isä elossa, äiti elossa, kun lapsi syntyi, sekä lisäksi epäillyttäviä, joiden rajoja voi vielä säätää. Katso liitteet, vaikka niissä on myös todellisia tapahtumia, eikä virheitä.
Kaikkia karkauspäiviä ei huomaa, mutta yleensä tarkat päiväykset huomaa ja antaa myös syöttää epämääräisiä päiviäkin tai vuosia. Joitakin GRAMPSin tarkistuksia toisin kaipailisin, lasten ikäero ei liian iso tms.

Tutkimisiin

PekkaV
14.12.14, 12:29
Tarkistuksia käsitellään myös TODO -keskustelussa (http://suku.genealogia.fi/showthread.php?t=32375).