PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Joukkovertailu Hiskistä - onko järkeä?


oh7lua
18.08.09, 12:43
Kertokaa onko tässä ajatuksessa mitään järkeä:
Sain ajatuksen: otan Hiskistä kaikki tutkimuskohteeni syntyneet esim. Excel-taulukkoon. Generoin omasta sukuohjelmistostani Excel taulukon ja vertaan tuloksia ajatuksena, että saan ikään kuin tarkistettua koko ko. pitäjän versus Hiski-tiedot. Jos joku tieto ”kirraa”, tarkistan tietty lastenkirjoista. Eli joukkoajona koko oma tietokanta. Onko tämä jo vanha juttu? Ja edelleen, voisiko Hiskistä saada ko. Excelin ilman omaa käsityötä?

harrysme
03.09.09, 16:20
Hiskin tiedot ainakin tallennetaan Exelinä, joten periaatteessa Hiskivastaavien avulla ne saisi.

Antti Järvenpää
03.09.09, 16:56
Mikäpäs niitä tietoja estää vertailemasta, ja niinhän sitä pitäisi koko ajan tehdä. Toisaalta en kyllä tiedä, että excelissä olisi jokin erityinen ominaisuus tällaisen vertailun tekemiseen. Osaa kyllä laittaa järjestykseen numeroiden ja kirjainten mukaan, mutta ei juuri muuta.

En ole kuitenkaan aivan varma, mitä ajat takaa. Joskus aikaisemmin on keskusteltu Hiskiin oikeellisuudesta. olen omana mielipiteenäni kirjoittanut, että jos Hiskii ja rippikirjat ovat samaa mieltä päivänmääristä, ei ole syytä tarkastaa tietoa alkuperäisistä syntyneistä tai kuolleista, koska on äärettömän epätodennäköistä, että niissä olisi jokin muu päivänmäärä. Luulen kuitenkin, että vertailtavat tietosi olisi nyt jostakin muualta, ja riippuen lähteestä, pelkkä vertailu Hiskiiseen ei välttämättä tee tuloksesta juuri parempaa.

Tiedon luottavuuden kannalta on tärkeää, että vertailtavat lähteet ovat toisistaan riipumattomia (kuten Hiski ja rippikirjat), jolloin vertailun tuloksen luotettavuus P = 1 - (tietojen epäluotettavuuden tulo). Esim. sinulla on kaksi lähdettä joiden kummankin luotettavuus on 99% - jos niitä vertaillaan, ja tiedot ovat samat, on tuloksen luotettavuus P = 1- 0,01 x 0,01 = 1- 0,0001 = 0,9999 eli 99,99%. Jopa tilanteessa, jossa yksittäisten lähteiden luotettavuus olisi 95 %, niin kahden toisistaan rippumattoman lähteen parivertailu antaa kokonaisuuden luotettavuudeksi 99,75%, mikäli molemmissa lähteissä tieto on sama.

Mutta itse otsikko joukkovertailu Hiskin avulla olisi kyllä vaikkapa opinnäytteen arvoinen asia. Tarkoitan tällä esimerkiksi erilaisia analyysejä väestöstä, kuolinsyistä tms. Tällaisessa mielessä Hiskii on mielenkiintoinen aineisto, jota voisi hyödyntää aivan uudenlaisen historiallisen tiedon synnyttämiseen.

oh7lua
04.09.09, 10:38
Puhumme ehkä vähän eri asiasta – täsmennän hieman mitä ajan takaa:

Minulla on SukuJutuissa nimiä, syntymäaikoja, -paikkoja jne.. Osa näistä nimistä löytyy Hiskisä, osa ei. Ideana on, että jos/kun saisin Hiskistä esim. tietyn paikkakunnan tiedot esim. Excel-formaatissa, voisin verrata mitkä tiedot omissa nimissäni täsmäävät Hiskin tietoihin (se on ihan pikku juttu Excelissä). Kun joku nimi täsmää Hiskiin, voin syventyä ko. nimeen – ja ellei täsmää, syvennyn silti, että tiedän mistä onkaan kyse. Lopputuloksena saan omista SukuJuttujeni sekavista listoista täsmällisempiä ja oikeellisempia, jos kun tiedot löytyvät ainakin Hiskistä. Se, onko tieto oikeellinen kummassa tahansa paikassa, on tietenkin tarkistettava historiakirjoista, mutta ”joukkoajolla” voisi keskittyä pieneen ryhmään/alueeseen. Jos/kun Hiskin tiedot ovat sähköisiä, niin mainitun Excel/Access ajon yksittäiselle seurakunnalle pitäisi olla Hiski-experteiltä helppo juttu.

Nyt nimiä otetaan sieltä täältä, useampana erillisenä hakuna netin yli. Jos lista olisi kotona, voisi ko. seurakuntaa syventyä omalla koneella, tehdä tilastoja yms… Enkä ole vaatimassa tätä kaikille, mutta ajatuksena onko järkeä?!?

Juha
04.09.09, 13:37
Ihmettelen vain sitä, että miten olet vain alunperin kirjata jonkun tiedon tietokantaasi, mikäli et ole varma sen oikeellisuudesta?

Ja voithan sinä Hiskistä koska tahansa siirtää copy/paste -toiminnolla tietoja taulukkolaskentaohjelmaan ja tehdä sitä kautta vertailuja.



Juha

oh7lua
04.09.09, 13:44
Ihmettelen vain sitä, että miten olet vain alunperin kirjata jonkun tiedon tietokantaasi, mikäli et ole varma sen oikeellisuudesta?

:) Ihminen on erehtyväinen ja lehmä on märehtiväinen.
Näin on kuitenkin päässyt käymään... joo-o. Tiedetään, että tällä tiedolla, jonka oikeellisuudesta ei ole täyttä varmuutta, ei periaatteessa tee mitään. ;)Kuitenkin tämä ei-varmistettu tieto ei ole ihan nolla tietoa, on sillä arvoa ja luulen että se on suurimmalta osalta oikeaakin. Kun nimiä on tuhansia, ei niitä jaksa kaikkia tsekata millään yksitellen...

Copy-pastellahan sen saa sivu kerrallaan Hiskistä, mutta...jos sen saisi .xlm:nä suoraan.

Juha
04.09.09, 13:47
Itseasiassa Hiskistä saa kerralla 1000 tapahtumaa, joten ei syynä yhden seurakunnan kohdalla aivan valtavaa työtä ole


Juha

oh7lua
04.09.09, 13:49
Ok. Kiitos tiedosta. No, sitten se ei ole iso työ jos näin on. Tämä on siltä osin selvä juttu ja teen sen "manuaalisesti"... Luulin alkuun, että vain näytöllisen saa kerralla...

Antti Järvenpää
04.09.09, 14:57
Mikään ei tosiaan estä Hiskiin käyttäjää ottamaan näyttöön 1000 nimen luetteloa ja siirtämästä sitä selaimelta exceliin. Tämä vaatii vain jonkin verran vaivaa. Muutaman kopioinnin jälkeen koko seurakunta on excelissä, jos sitä kaipaa. Hiskii operaattorit varmaankin saisivat ne kyllä helposti dumpattua tietokannasta excel-muotoon, mutta käsittääkseni tällaista palvelua ei Hiskiistä ole, eikä myöskään resursseja palvelun toteuttamiselle.

Jos siis haluat asiaa kokeilla, voit tehdä sen itse selaimella ja excelillä. Kaikki tiedot eivät kuitenkaan mene kerralla oikeisiin sarakkeisiin, joten vaivaa siinä joutuu hiukan näkemään.

Vastauksestasi kuitenkin heijastuu se, että sukutietokantasi on kerätty muista kuin kirkollista lähteistä. Tällaisen kannan peilaaminen Hiskiiseen tietenkin parantaa sen kannan luotettavuutta jossakin määrin, mutta ei ole riittävä, jos puhutaan hyvästä sukutukimustavasta, johon viittasin aiemmin. Toisaalta myös tiedetään, että Hiskii ei yksinään ole riittävä, mutta on niitäkin, jotka eivät hyväksy tuossa edellä esittämääni kantaa, vaan ovat sitä mieltä, että asiat olisi tarkastettava myös alkuperäisistä synteneiden, kuolleiden ja vihittyjen luetteloista 100 %:sti.

Luulen kuitenkin ymmärtäväni, mitä ajat takaa. On muodostunut kohtuullisen iso sukutietokanta, jonka luetettavuudesta ja lähteistä ei ole kunnollista tietoa. Tällöin tulee mieleen, että jonkinlaisella massa-ajolla voisi parantaa sen luotettavuutta. Kuitenkin tilanne on se, että jos haluaa tehdä julkaisukelpoisen tutkimuksen, pitäisi ne jokainen tieto tarkastaa, ihan siitä riipumatta missä ja miten sen julkaisee - pienelle tai suurelle ryhmälle. Tuollainen epävarma tietokanta ei kuitenkaan ole hyödytön, kuten sanot, sillä se on parempi kuin aloittaa tyhjästä.

Siteeraisin tässä kohdassa vapaasti tuntematonta sotilasta: "kannattako sitä asentoa korjata, vai tehdä kokonaan uusi". Tarkoitan tällä sitä, että hyvälle tutkimukselle on oleellista, että jokainen tieto on tarkastettu erikseen ja se tapahtuu yleensä helpoiten lähtemällä uudestaan alusta liikkeelle. Siinä voi hyödyntää epävarmojakin tietoja, kunhan ne vain tarkastaa sitä myöten, kun ne tulevat vastaan.