Sukuohjelmiston jatkokehitys [Arkisto]

Kirjaudu sisään

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Sukuohjelmiston jatkokehitys

kaila

13.10.07, 13:19

Olen ryhtynyt miettimään millä tavalla ja mihin suuntaan Sukuohjelmistoa pitäisi kehittää.

Mikään vaihtoehto ei ole vielä poissuljettu muuta olen hieman protoillut sellaisella mallilla jossa ohjelma on tehty Java-kielellä ja tietokantana on PostgreSQL relaatiokanta ja ohjelma toimii sekä paikallisesti että etänä. Etänä tarkoittaisi sitä, että tietokanta sijaitsisi esim Sukututkimusseuran palvelimella ja sitä pääsisi käyttämään verkon kautta.

Nämä ratkaisut aiheuttaisi sen, että ohjelma toimisi useimmissa ympäristöissä (Windows, Linux, Mac)

Tämä vaikuttaa lupaavalta joskin tekemistä riittää vielä paljon. Riippuu tekijöiden määrästä koska tätä voisi ajatella otettavaksi käyttöön.

Haluaistko osallistua tähän projektiin? Ainakin seuraavan tapaisia tehtäviä tuntuisi olevan:

Ohjelmointi: java, xml, sql tekniikat. Java versio 6
Dokumentointi: käyttöohjeet, käsikirjat ym
Koulutusta: Käyttäjien opastusta, kurssit.
Testausta: Ohjelman koekäyttöä. Palautteen antamista. Virheiden löytämistä.Palkkaa näistä tehtävistä ei makseta eli harrastuksen nimissä tätä pitäisi tehdä.

Jos olet kiinnostunut niin ilmoittaudu minulle.

Miten ohjelman omistus järjestettäisiin? Alla muutama vaihtoehto:

KK-Software omistajana. Ainakin jos minä olen ainoa tekijä ei tässä ole ongelmaa.
Suomen Sukututkimusseura omistajana. Mikäli mukaan tulee muitakin tekijöitä voisi olla mielekkäämpää, että ohjelman omistaisi yleishyödyllinen yhdistys.
Open Source. Mahdollistaisi myös ulkopuolisten mukanaolon. Ehkä maailmanlaajuisesti jos idea saisi riittävää kannatusta Suomen ulkopuolella. Vaikea arvioida onnistumista.Tapauksissa 1) ja 2) olisi mahdollista myydä ohjelmaa kaupallisena tuotteena. Ainakin tapauksessa 3) sen pitäisi olla ilmainen tuote. Ohjelmointia harrastavat aika usein suosivat ilmaisia OpenSource ohjelmistoja. Sukututkijat toisaalta eivät pääsääntöisesti ole ohjelmoijia. Hieman luulen että ilman markkinointia ym ohjelma ei ehkä tavoittaisi käyttäjäkuntaansa. Koulutusta ja käyttöoppaitahan voisi OpenSource ohjelmallakin olla mutta esim maksettua mainosta jonkun lehden takasivulla luultavasti ei.

===================================
Jos aihe kiinnostaa niin tule tapaamaan minua 19.-21.10.2007 pidettävässä Valtakunnallisessa Sukutapahtumassa (http://www.suvut.fi/vs2007/index.htm)Karjalatalolla. Esittelen siellä lähinnä Sukuohjelmisto 2004:ää mutta voin demota myös tätä uutta mallia.

terveisin
Kaarle Kaila

Martin Josefsson

13.10.07, 21:31

Nyt minun täytyy tulla mukaan tähän keskusteluun. Nimittäin, minä olen myös suunnitellut semmoista uutta ohjelmaa/portaalia joka perustuu siihen että sukututkijoiden työt ovat keskitetyt yhteen samaan paikkaan netissä.

Maaliskuussa 2004 projektini ensimmäinen vaihe valmistui. Silloin lähetin 15-sivuisen artikkelini kuvineen Suomen Sukututkimusseuralle ja pyysin että artikkelia julkaistaisiin Sukutieto-lehdessä. Muistaakseni puhuimme myös vaihtoehtona Genoksesta ja Vuosikirjasta. Minulle luvattiin näyttää artikkelia seuran hallitukselle. Sain lopuksi sen käsityksen että artikkeli ei sopinut Sukutieto-lehteen (liian monta sivua) eikä Genokseen tai Vuosikirjaan, ja muusta kannanotosta en ole kuullut joten artikkeli on vielä julkaisematta. Voi olla että artikkelini on päättynyt sinne jonnekin cyberspace:iin. Ehkä monet on sen lukeneetkin jo, en tiedä.

Olen monta kertaa miettinyt että mitä on paras menetelmä aloittaa tämmöinen projekti - yksityisyydessä vai open source:na vai joku välimuotona. En ole vieläkään varma, mutta nyt kun sinä Kaarle kerrot ajatuksistasi näin foorumissa on kai parasta että minä tulen mukaan keskusteluun.

Tärkein asia minulle on kuitenkin että sukututkijat Suomessa saavat parhaat mahdolliset työkalut käsiinsä. Olen nimittäin sitä mieltä että tämän päivän kaikki sukuohjelmat edustaa huonosti toteutettua tekniikkaa, vaikka kuinka hyvin niitä on ohjelmoidut. Puhun siis siitä kokonaisesta menetelmästä joka saa aikaan tätä tietovaihtorumbaa joka nyt on kestänyt ainakin kymmenen vuotta.

Tämä uusi tapa joka perustuu keskitettyyn tietokantaan tulee tavallaan olemaan erittäin suuri muutos sukututkijan tutkimusmenetelmien kannalta (ainakin minun suunnitelmani mukaan) mutta jo keskitetty tietokanta sinänsä on niin suuri etu tuhansien tutkijoiden kesken että olen aika varma että mainontaa ei paljon tulee tarvitsemaan. Jos projekti onnistuu edes vähän niin sukututkijat ryntäävät mukaan - "porkkanoita" on helppoa löytää semmoisessa projektissa.

Onnistuaksemme yksi asia on minusta kuitenkin erittäin tärkeä. Oikeastaan on kyseessä "globalisaatiosta" (aluksi ehkä vain Suomen sisäpuolella). Joskus se on yhdyskunnassamme huono juttu ja joskus se on hyvä. Kun nyt puhutaan tietojen keräämisestä ja tavallaan tietojen vaihtamisesta tämä globalisaatio on erittäin hyvä ilmiö.

Jotta tämä väite olisi totta on tärkeä ymmärtää että kun puhutaan itse tietokannasta ei saisi hyväksyä sen että on olemassa enemmän kuin yksi semmoinen. Jo silloin kun toinen kilpailija ilmestyy markkinoille "epäonnistuminen" on lähellä. On tärkeää että kilpailevat ohjelmoijat ymmärtäisivät tätä. Tuplasti tehty työtä ei saisi sallita - ei tutkijatasolla eikä ohjelmointitasolla. Voihan sitten tietysti kilpailijoille antaa mahdollisuuden kehittää plugins tulostukseen ym.

Jotta tämä keskitetty tietokanta pysyisi ainoana semmoisena, takana täytyy olla vahva organisaatio. Suomen Sukututkimusseura on ilman muuta se oikea tähän tarpeeseen. Esimerkiksi Sukutieto-lehden ja päivälehtien kautta seura voi sitten tiedottaa asiasta kun aika koittaa. Näin on tehty bongarien kesken kun kyseessä on ollut www.tiira.fi ja siinä ne ovat onnistuneet hyvin. Ensin ainakin 2-3 vuotta suunnittelua ja ohjelmointia ja sen jälkeen kaikki bitit ulos nettiin. 1½ vuotta on sen jälkeen nyt mennyt ja 2,5 miljoonaa havaintoja on jo ilmoitettu sinne, ja porkkanoita on riittänyt vaikkapa linnuillekin!

Minä ainakin osallistun tähän sukututkimustietokantaprojektiin, tavalla tai toisella, jos kaikkien keskenämme saadaan hyvä alku tuossa omistusasiassa, työskentelytapa-asioissa ym. En tiedä kuinka pitkälle sinä Kaarle olet päässyt suunnitteluvaiheessa mutta ehkä löytäisimme joku tapa poimia parhaat ideat molemmilta puolelta.

kaila

13.10.07, 23:42

Mielenkiintoista.

Sinun suunnitelmissasi on ymmärtääkseni ollut, että kaikilla tutkijoilla olisi yksi yhteinen tietokanta. Ymmärsinkö oikein? Ainakin teoriassa tuntuu hyvältä ajatukselta. Joitakin kysymyksiä siinä tulee:

Useampi tutkija tutkii samaa perhettä, mutta ei ehkä päädy kaikinpuolin samoihin johtopäätöksiin. Kuka määrää kenen johtopäätös on se oikea?
Kun korjaan tiedon joka tietokannassa on väärin niin se voi muuttaa jonkun muunkin tutkimusta hänen sitä tietämättään.
Sukukirjaa, websivustoa tai vastaavaa tehdessäni en ehkä halua kaikkia haaroja mukaan. Onko tällaisessa yhteisessä tietokannassa mahdollisuus tutkijakohtaisiin rajoituksiin?
Henkilörekisterilaki ei hyväksyisi, että kaikkien suomalaisten nimet ja tiedot ovat kaikkien nähtävissä eikö niin? Saisiko tähän yhteiseen sukututkimuskantaan mukaan 1900 luvun henkilöitä vai olisiko kysymys vain vanhemmista ajoista.Tuossa vain muutama kysymys joka tuli mieleen nyt heti.

Olin yliopistolla mukana Sukututkimustietokanta (http://www.cs.helsinki.fi/u/sippu/g/aihe.html)projektissa jossa oli tarkoitus suunnitella sukututkimustietokantaa johon sukututkijat saisivat ladata valmiita tutkimuksiaan. Ehkä hieman rootswebin tapaan. Näitä ei ollut tarkoitus yhdistää yhteen kantaan mutta yhteisellä haulla oli tarkoitus voida löytää tietokannasta kaikki hakukriteerit löytävät henkilöt eri kannoista. Tästä voisi sitten selata eri tutkijoiden tuloksia.

Minun ajatuksissani ei ole ollut aikanaan tällä hetkellä, että kaikilla olisi yhteiset tiedot. Minun ajatukseni mukaan kunkin tietokanta olisi ko tutkijan omaisuutta jonne muilla ei olisi pääsyä. Niin että se voisi sijaita joko palvelimella tai omalla työasemalla.

Luulisin, että kaikkien yhteinen tietokanta voisi toimia esim yo Sukututkimustietokantasuunnitelman mukaan mutta niin, että sinne talletetaan vasta valmiit tutkimukset. Keskeneräiset tutkimukset pitäisi olla tutkijan omaa omaisuutta. Näin uskoisin olevan parasta.

Kaarle Kaila
PS! Martin, om du kommer på släktforskardagarna nästä veckoslut kom gärna och tala om saken. Man vet ju aldrig i förväg vad man skall göra näst. Jag talar även svenska (http://www.netsonic.fi/~kaila/kalle/home/svenska.html).

Martin Josefsson

14.10.07, 03:45

Hyvä että puhut ruotsiakin. Minä kirjoitan sitten omalla kielelläni. Se on helpompi. Jos joku muu lukija ei ymmärrä, niin huutakaa niin yritän suomeksikin.

Sinun suunnitelmissasi on ymmärtääkseni ollut, että kaikilla tutkijoilla olisi yksi yhteinen tietokanta. Ymmärsinkö oikein?

Jo, alla användare jobbar mot samma databas.

Här berättar jag hur jag har tänkt vad gäller dina övriga undranden:

Useampi tutkija tutkii samaa perhettä, mutta ei ehkä päädy kaikinpuolin samoihin johtopäätöksiin. Kuka määrää kenen johtopäätös on se oikea?

Varje forskare kan själv välja sin version av hur släktingarna skall kopplas ihop. För det mesta kommer man väl att ha samma åsikter och då kommer den första forskarens koppling att synnas för de andra forskarna som sedan, efter en granskning, med ett klick kan godkänna den kopplingen. Man skall också kunna ange med ett procenttal eller textkommentarer m.m. vilken åsikt man har om sannolikheten för ett visst släktskap och så skall man kunna föra en diskussion där.

Kun korjaan tiedon joka tietokannassa on väärin niin se voi muuttaa jonkun muunkin tutkimusta hänen sitä tietämättään.

Varje forskare som delar en släkting med en annan forskare är liksom "delägare" i den släktingen. När en uppgift om en släkting ändras meddelas alla delägare om saken - ungefär så där som med diskussionsämnena i Suku Forum: Då någon skriver ett inlägg i en diskussion som man prenumererar på så kan man ju se det i listan "Nya inlägg".

Sukukirjaa, websivustoa tai vastaavaa tehdessäni en ehkä halua kaikkia haaroja mukaan. Onko tällaisessa yhteisessä tietokannassa mahdollisuus tutkijakohtaisiin rajoituksiin?

Jo. Endast de kopplingar som du själv har godkännt tas med i de olika utskrifterna som du vill göra. Efter att man har loggat in i systemet skall man dessutom kunna välja antingen sig själv eller någon annan person som proband - t.ex. en förfader.

Henkilörekisterilaki ei hyväksyisi, että kaikkien suomalaisten nimet ja tiedot ovat kaikkien nähtävissä eikö niin? Saisiko tähän yhteiseen sukututkimuskantaan mukaan 1900 luvun henkilöitä vai olisiko kysymys vain vanhemmista ajoista.

Just nu är det svårt att med säkerhet säga hur den saken med 1900-talsuppgifterna skall lösas. Det är nog i första hand uppgifter som är äldre än 100 år som alla forskare skall kunna dela och sedan får man väl lov att ha de yngre uppgifterna skilt - kanske lokalt på sin PC, men om lagen det tillåter så kan man begära av de nulevande personerna att man i databasen får mata in grunduppgifterna om dem. Eftersom databasen är gemensam för alla forskare så räcker det ju med att man får lov en enda gång av varje nulevande person.

Man kan också använda en sådan morot som går ut på att släktforskarna först kopplar ihop många av 1800-talets personer. Därefter säger man åt Finlands medborgare ungefär att "om du tillsammans med dina närmaste släktingar tillåter att era grunduppgifter publiceras i databasen så får ni se vad vi har forskat om era förfäder". Det blir ju naturligtvis många grenar som inte kommer med, men det är kanske värt att fundera vidare på i alla fall.

De webbtjänster som strävar efter att samla in personliga uppgifter finns nog (t.ex. www.koulukaverit.com med drygt 750.000 personer) men de har inte slagit igenom så där riktigt bra. Jag tror att morötterna, som man har lockat med, inte har varit de rätta. Men vi som släktforskare har ju turen på vår sida - nästan alla medborgare är ju intresserade av att få veta mera om sina rötter. Den vanliga fysiska telefonkatalogen eller släktböckerna är exempel på sådana projekt som har lyckats med den saken. Jag tror för övrigt att de juridiska aspekterna nog klarnar inom de närmaste åren.

Olin yliopistolla mukana Sukututkimustietokanta projektissa...

...Luulisin, että kaikkien yhteinen tietokanta voisi toimia esim yo Sukututkimustietokantasuunnitelman mukaan mutta niin, että sinne talletetaan vasta valmiit tutkimukset. Keskeneräiset tutkimukset pitäisi olla tutkijan omaa omaisuutta. Näin uskoisin olevan parasta.

Jo, vi skall nog komma ihåg alla de forskningsarbeten som forskare har matat in under de minst 15 senaste åren. Det är ju frågan om väldigt mycket arbete som folk har lagt ner. Dessa inmatningar kan man säkert integrera med den huvudsakliga databasen. Men nu kommer vi in på min största hemlighet och den vill jag i så här tidigt skede inte avslöja annat än mellan fyra ögon :cool::cool: så vi får prata om det skilt. Jag hade inte tänkt komma till släktforskardagarna men jag borde väl ändra mig så att vi får prata vidare om det här. :)

kaila

14.10.07, 15:11

Martin,

Som det väl framgår har vi utgått från lite olika håll. Du har tänkt dig en databas som är gemensam för alla och jag hade tänkt mig en server som innehåller åtminstone logiskt skilda databaser för alla.

Diskuterar gärna med dig om saken nästa veckoslut. Kanhända kan vi hitta något gemensamt där.

Vi kunde t.ex tänka oss nåt sånt att var och en har en egen databas därifrån kontakten till den gemensamma databasen skulle fungera åt båda hållen. Låter inte alltför lätt men torde vara möjligt. Då skulle åtminstone dataformatet gärna få vara kompatibelt.

mvh Kalle

Alf Blomqvist

15.10.07, 07:44

God morgon Kalle och Martin!

Måste börja med att jag inte blivit du med hur Suku Forum fungerar - och har inte lyckats prenumera på önskade ämnen.

Till saken. En gemensam databas, TALKO, har funnits på en sever i Seattle, Washington ett antal år. I den finns åtminstone finländska, svenska, amerikanska och kanadensiska forskares material. Den sköts av Hasse Nygård i Vanda (utgången från Kronoby) och är inte en gemensam databas, utan de släktforskare som gett eget material får också tillgång till övrigas material.

Jag kan tänka mej att det blir problem med namnen på personer i en gemensam stor databas eller kanske det kan lösas med parallellnamn - vem besluter om vilka namn som skall vara "huvudnamn"?

Är nog beredd att jobba tillsammans i ett projekt. Nu förefaller det som om den naturligaste ägaren skulle vara Genealogiska Samfundet.

tkukkonen

15.10.07, 11:07

Hej alla,

Det syns att svenska är bäst för det här ämnet...

Har ni studerat vad GeneWeb (GW i korthet) har att bjuda? Med den erfarenhet som jag har numera tänker jag att det kanske lönar sig att studera GW lite närmare. Man kan flytta sina genealogiska dator till Internet in i webservicen Geneaweb, i fall databasen hade bygtts upp med GW. Och det syns att ni syftar på något mycket liknande.

Se här > http://cristal.inria.fr/~ddr/GeneWeb/en/index.html (http://cristal.inria.fr/%7Eddr/GeneWeb/en/index.html)
http://www.geneanet.org/

Jag har samlat tillsammans data på några tusen personer i mina GW databaser och är mycket nöjd. Bara rapporteringen enligt finländsk tradition (numrering osv.) går inte, men man kan ju använda överföring med GEDCOM till någon annan plattform när databasen är färdig för rapportering.

En av de bästa saker som jag har lärt att respektera bara efterhand är att GW passar väldigt bra för mitt arbetssätt som i början var lite ostrukturerat eller kaotiskt . Man kan ha skapat flere lite olika varianter av densamma personen; och i det där fallet kan man ganska snabbt integrera dom ihop till en enda person. Tänker man integrera stora mängder av personer i en gemensam databas från olika håll så måste man först leta och bearbeta dessa duplikater, kanske t.o.m. "triplikater" osv.

Tänk på saken. Jag har kanske 7000 personer. Någon annan forskare från densamma trakten kan ha exempelvis 20000, och säkert finns det potential att ha "overlap" flere hundra duplikater, mina varianter och den andras. Det är ingen enkel sak att kombinera dem, om det så önskas.

(1) det kommer att ta tid at söka kandidater, särskilt om man inte kan lite lita på någon automatisering. När man har funnit dom (2) så ska programmet göra kombineringen åtminstone manuellt, gärna på något delvis automatisk sätt.

Jag har så nyligen flyttat till GW version 5.00 att jag har inter prövat "sökningsfunktion på multiplikatskandidater" som lär vara med i programmet. Om det finns intresse så kommer jag att rapportera mera on saken efter ett par veckor.

Ni kan sluta här om ni har ingen intresse för detaljer på GW.

GW finns i flera språksvarianter, bland andra finska och svenska. Översättningen från ett indoeuropeisk språk syns ha gått tämligen bra men den finska genetivformen (t.ex. langon siskon isoisä) är mycket olik. I franska "fil de" och engelska "son of" är mycket liknande. Alla finska pluralformer (i 3 varianter; t.ex. "5 poikaa", "poikia", "pojat") stödas numera inte av GW på ett komplett sätt. (Det finns liknande pluralformer i ungariska som jag har lite studerat).

Jar studerar just nu med översättningen på versionen 5.00 till finska, för att göra det så bra som möjligt. För en optimal resultat måste kanske databasen ändras för att handla den finska språksyntaksen. Om den franska utvecklaren har intresse att göra så, vet jag inte, men i det positiva fallet skulle någon först ge honom stöd i saken.

Den idén att genealogisk data samlas in i programmet på språket A och sedan någon annan kan läsa samma data över användärsnitt på språket B i inte unik, men med GW har man gått en rätt lång väg till i där riktningen.

Med vänlig hälsning,

admin

15.10.07, 11:17

Hade tänkt hålla tyst i denna sak ev. tills släktforskardagarna men...

Personligen tror jag vi inte är riktigt "där" när det gäller att skapa en gemensam databas där alla skulle samlas runt samma köttgryta och ges rätten att editera/lägga till material. Administrationen av en sådan databas kunde bli ganska jäklig, likaså kunde jag se framför mig en situation där en vettig presentation av informationen inte skulle vara sådär rysligt enkel.

Som man ser i Talko databasen, som Alf nämnde, finns samma herr Ragnvald Koiraniemi i väldigt många forskningar. Hans namn är inte stavat på sådär rysligt många olika sätt, men värre är det när vi kommer mera mot 1700 och 1800 -talen där forskarna namnger personen på de vitt skilda sätt, både vad gäller mappningen av patronym/gård och stavningar. "Släktnamnet" registreras lite hur som helst, dvs. patronymen, födelsegården, alla de olika gårdar personen vandrat via tills han/hon sedan jordfästs med ett sista gård-/familjenamn. Kanske inte det ens det sista namnet för senare händer det sig att forskare ännu översätter och skriver ner sin tolkning av namnet.

Namngivning i databasen, eller hur man kokar ner en person till en unik idenfikator är nog ännu ganska svår. Har själv suttit med otaliga försök att t.ex. "standardisera" namnen för att med bl.a. olika hash -tekniker kunna räkna sig fram till en unik identifikator - eller åtminstone till en indikation till en identifikator. Inte så enkelt. Kunde kanske börja tro att det inte går. Sotu -liknande identifikator för personen??

Vågar påstå att vi skulle råka ut för en mängd dubletter hur man än vrider och vänder på saken om vi skulle sträva till att göra en "gemensam" arbetsdatabas. Ett problem som onekligen i värsta fall skulle göra slutresultatet oanvändbart.

Som sagt - tvivlar på att vi är där ännu - men jag kanske har fel...

Talko -idén utgick från att alla jobbar olika, allas gedcom material i databasen behandlas som separata sökbara entitetsmassor - och "read only". Samma Ragvald Koiraniemi kan sökas från alla forskares samlingar eller enbart från en enda. Forskarens tolkningar i skrivsätt gör man inget åt - utan den som söker måste vara den kreativa personen och söka på olika sätt. På det sättet kan man veta att databasen levererar vad den lovar - och inget mer.

Talko basen innehåller som bäst ca 1,500,000 personrecords. Man kunde editera i databasen också men den saken har jag inaktiverat - kanske jag är paranoid...

Den ursprungliga tanken som Kalle började diskussionen om skulle vara intressant. Ett släktforskningsprogram som arbetar mot en ordentlig (egen) relationsdatabas antingen lokalt på egen maskin eller på en server någonstans. Såsom jag privat framfört åt Kalle ser jag här en intressant vinkel om en sådan lösning skulle vara php, MySQL/Ajax driven. Distributionen av ett sådant system, som vid första åtanke kunde anses för svår för gemene släktforskare att installera, kunde helt enkelt ske t.ex. som LAMP, MAMP, WAMP -paket. Enkelt att installera och allt hermetiskt inneslutet i en mapp.

En utveckling baserad på Ajax/php/MySQL skulle, såvitt jag förstår, inte bli så värst problematisk eftersom php-kunniga finns kanske mer än många för många andra utvecklingsverktyg/-språk. En bra början till databasmodell för gedcom material finns redan - den som används i Talko basen.

Kalle har rätt imho - först en applikation som ser på det personliga behovet. Att man här tar i beaktande att man i senare skede från sin klient kan vara i kontakt med en central databas är kanske något som måste beaktas när man planerar den personliga klienten.

...och som sagt - gärna AJAX/php/MySQL...om jag skulle önska av julgubben

Hasse

Martin Josefsson

16.10.07, 00:46

Man kan ha skapat flere lite olika varianter av densamma personen; och i det där fallet kan man ganska snabbt integrera dom ihop till en enda person. Tänker man integrera stora mängder av personer i en gemensam databas från olika håll så måste man först leta och bearbeta dessa duplikater, kanske t.o.m. "triplikater" osv.

Bra att du nämner att det verkligen finns program/portaler som kan behandla dubbletter. Men nu då jag tittar tillbaka på åren som gått och ser att konceptet med att utbyta släktuppgifter med varandra (via GEDCOM-export/import) fortfarande finns kvar efter flera årtionden, så får jag nog en känsla av att vi borde ta några steg bakåt så att vi ser vad vi håller på med. Vi skall komma ihåg att det inte ens fanns någon Webb då GEDCOM började användas. Det här med GEDCOM-export/import är egentligen en ganska dålig lösning om vi ser på saken från informationsförädlingssynvinkel. Man har då och då också pratat om att vi borde höja kvaliteten på släktforskningsarbetena i vårt land. Man ordnar tävlingen "Årets släktbok" och man visar forskningsexempel i Genos men man gör ingenting åt den här personutbytesrumban som nu har hållit på under en ganska lång tid. Jag är nämligen övertygad om att sådan "GEDCOM-verksamhet" sänker kvaliteten på forskningarna. Hoppeligen står denna GEDCOM-verksamhet inte som grund för de släktböcker som nuförtiden publiceras. Jag anser att tiden är inne för ett paradigmskifte då det gäller lagring och utbyte av släktuppgifter och det är då vi kommer in på det här med en gemensam databas som alla forskare samtidigt arbetar mot.

Tänk på saken. Jag har kanske 7000 personer. Någon annan forskare från densamma trakten kan ha exempelvis 20000, och säkert finns det potential att ha "overlap" flere hundra duplikater, mina varianter och den andras. Det är ingen enkel sak att kombinera dem, om det så önskas.

Mycket bra observation!! Det är just det här som är det problematiska med separata databaser som är skapade på olika håll och kanske t.o.m. med olika program. Man bör dessutom komma ihåg att ju större de enskilda personernas databaser efterhand blir, desto flera dubbletter finns det att sköta om då man för ihop databaserna med varandra. Och då skall man komma ihåg att nästan samma hopföring kanske sker på annat håll eftersom de små ursprungliga databaserna till en början spred sig ungefär som förgreningarna i ett släktträd. Oj, oj vad ineffektivt dubbelarbete det kommer att finnas efter några år! Det finns en risk för att effektiviteten kommer att minska mer och mer - beroende på hur man bedömer det här med effektivitet. Det blir som i en trafikstockning:mad::(:mad::(, och "triplettar" och "multiplättar" kommer då att vara vardagsmat.

Domedagsprofeten Martin har talat!

Martin Josefsson

16.10.07, 05:27

Personligen tror jag vi inte är riktigt "där" när det gäller att skapa en gemensam databas där alla skulle samlas runt samma köttgryta och ges rätten att editera/lägga till material.

Det beror på vad man menar med "där" och vad man har för ambitioner. Artikeln som jag skrev 2004, och som handlar om en gemensam databas, började jag fantisera om några år innan det. Orsaken var att jag i en högre grad tyckte mig kunna börja se tendenser till ineffektivitet, dubbelarbete och möjligen sjunkande kvalitet bland släktforskarnas arbeten (se mera om det i mitt tidigare inlägg idag). En portal med gemensam databas kräver troligen fler arbetstimmar än programmeringen av ett vanligt släktforskningsprogram, men å andra sidan borde flera programmerare vara intresserade av ett sådant projekt om de bara informeras om fördelarna med att ha en gemensam databas.

Fördelarna har jag delvis beskrivit i min artikel men som exempel kan jag här nämna det faktum att man ur en gemensam databas som saknar dubbletter kan göra avancerade statistiska undersökningar som gör det möjligt att utveckla helt nya metoder för slutledning om släktskap och sannolikheten för en del andra typer hypotetiska påståenden. Uteslutningsmetoderna får en helt annan kraft ifall man enkelt kan få fram statistiska uppgifter över t.ex. förnamnstraditionerna i en församling.

P.g.a. den stora arbetsinsatsen som behövs, då man programmerar för en gemensam databas, tror jag att det fr.o.m. idag går åt minst 3 år av planering, programmering, testning och dokumentering (utan avlönad arbetsinsats) innan man för forskarna kan lägga ut en användbar produkt. I det skedet konkurrerar den ännu inte i alla hänseenden med de traditionella släktforskningsprogrammen. Ytterligare ett par år går väl åt innan funktionaliteten har utvidgats till god kvalitet och innan man kan börja se den stora nyttan med den gemensamma databasen. Då närmar vi oss redan år 2013 vilket gör att en viss datateknisk utveckling har hunnit ske då det gäller t.ex. bandbredd för dataöverföring och skärmstorlek (för antavla/stamtavla m.m.). På mjukvarusidan kommer säkert även verktygen och möjligheterna att bli lite bättre, både vad gäller programmering och databasunderhåll. Jag är också helt övertygad om att vi efter några år kommer till ett sånt skede då det blir en självklarhet att man går till sin datorskärm eller dataprojektor då man för sina släktingar vill visa sin släktutredning som naturligtvis finns ute på webben. Böckerna har redan länge varit alldeles för statiska till sitt format t.ex. för att kunna visa en antavla utgående från just en viss släkting. Mobiltelefonmarknaden verkar nu också bidra till att folk i allt högre grad tar för givet att jobba mot en skärm vilket ytterligare bidrar till att utskrifter i framtiden kommer att bli överflödiga. Det här sista har dock endast i mindre grad att göra med hur man programmerar, men det är ändå värt att ta i beaktande.

Nu tror säkert läsarna att jag är en teknikfreak som helt förlitar mig på att framtidens teknik skall lösa alla problem. Men nej..... Det viktigaste tror jag ändå är det att man bygger upp databasmodellen på ett förnuftigt sätt (mer om det här nedan). Man bör också kunna se på vilka punkter man måste begränsa möjligheterna för forskarna. Det är inte tänkt att lösningen med en gemensam databas skall bli en perfekt produkt som är felfri. Det kommer helt säkert att finnas en del problem som är helt nya, men det viktiga är att lösningen skapar en god grund att bygga vidare på och att den är bättre än den vi hittills använt. Den lösning som vi nu använder oss av begränsar starkt möjligheterna till att utveckla hela systemet och det kommer att vara svårt att på ett förnuftigt och kraftfullt sätt kunna dra nytta av inmatningarna. Möjligheterna till att dra nytta av inmatade släktuppgifter torde öka dramatiskt ifall man lagrar allting i en gemensam databas med gemensamma tekniska möjligheter.

..."Släktnamnet" registreras lite hur som helst, dvs. patronymen, födelsegården, alla de olika gårdar personen vandrat via tills han/hon sedan jordfästs med ett sista gård-/familjenamn. Kanske inte det ens det sista namnet för senare händer det sig att forskare ännu översätter och skriver ner sin tolkning av namnet.

Problemet med standardisering av personnamn och geografiska namn har inom släktforskningen alltid varit ett problem och kommer på sätt och vis alltid att vara det. Man har nu i årtionden med jämna mellanrum diskuterat problemet om och om igen men man har oftast till sist konstaterat att ingen lösning finns på problemet. Det är sant. Vi kan inte få alla släktforskare att använda samma stavningar eftersom prästerna inte heller gjorde det. Att man från "högre ort" inte har kommit med några fungerande entydiga rekommendationer angående praxisen har resulterat i att vi nu har att göra med en massa enskilda databaser som p.g.a. olika namnstavningar är svåra att sammanföra med varandra. "Som man bäddar får man ligga". Och inte har ju programtillverkarna heller vågat lägga in entydiga anvisningar i programmens hjälpfiler. Det är lite som med fri uppfostran. Om man i början inte gör de där besluten som känns svåra så kommer man att i ett senare skede få stora problem. Vi måste alltså hitta lösningen på ett annat plan än var vi hittills har letat efter den.

Då det gäller stavningen av geografiska platser är det idag inte så svårt eftersom man kan placera en gemensam databas ute på Internet. Färdiga ortsdatabaser har redan länge existerat i vissa släktforskningsprogram. Då det gäller personnamn så blir det svårare. Där måste man utgå från att det för en person finns de normaliserade namnen och att forskaren sedan, om så önskas, har möjlighet att därtill för sin egen del välja en annan stavning. De normaliserade namnen används sedan av datorprogrammet då t.ex. sökningar görs. Det här förfarandet är inte något nytt. Jag antar att det är ungefär så som det har fungerat i samband med HisKi-projektet. Det primära stavningsformatet för personens namn bör alltså skapas i ett mycket tidigt skede.

Vågar påstå att vi skulle råka ut för en mängd dubletter hur man än vrider och vänder på saken om vi skulle sträva till att göra en "gemensam" arbetsdatabas. Ett problem som onekligen i värsta fall skulle göra slutresultatet oanvändbart.

Nej, jag har nog en lösning på dubblettproblemet också (men nämner jag den nu här så avslöjar jag den största hemligheten med min modell, så vi tar det i ett senare skede). Så mycket kan jag säga att det igen väl har att göra med att lösa problemet på ett annat sätt än vad som är väntat. Och så har dubblettproblemet ju också ganska mycket att göra med hurdana beslut vi gör då vi bygger upp databasen. Vi får som sagt inte kräva för mycket av systemet i ett tidigt skede (men inte heller följa principen med en alltför "fri uppfostran" hos användarnas inmatningspraxis).

Den ursprungliga tanken som Kalle började diskussionen om skulle vara intressant. Ett släktforskningsprogram som arbetar mot en ordentlig (egen) relationsdatabas antingen lokalt på egen maskin eller på en server någonstans. Såsom jag privat framfört åt Kalle ser jag här en intressant vinkel om en sådan lösning skulle vara php, MySQL/Ajax driven. Distributionen av ett sådant system, som vid första åtanke kunde anses för svår för gemene släktforskare att installera, kunde helt enkelt ske t.ex. som LAMP, MAMP, WAMP -paket. Enkelt att installera och allt hermetiskt inneslutet i en mapp.

Om vi pratar om en modell där forskarens egen databas finns på en server så är det inte sagt att det egentligen är så stor skillnad mellan den modellen och min modell. Påpekas bör att det nämligen i min modell nog också skall gå att från vissa grenar/rötter utestänga övriga forskare, men inte nödvändigtvis från en forskares ALLA inmatningar. En sak som sedan slår mig, när vi har att göra med sådana här abstrakta diskussioner, är att vi kanske inte nödvändigtvis skall diskutera databasstrukturen nu i det här skedet. Om vi skall följa den planeringspraxis som ur användarvänlighetssynvinkel anses vara helig så borde vi lämna nästan allt tekniskt snack i början och starta från släktforskarens nuläge, hur forskningssituationen borde vara, vilka funktioner som då behövs i dataprogrammet och kanske hur användargränssnittet skall vara uppbyggt. Ungefär i det skedet kommer vi till det här med databaserna skulle jag våga påstå. Visst har ju de tekniska resursernas begränsning en avgörande betydelse men om vi funderar för mycket på det i början och glömmer släktforskarens behov så resulterar det i att vi får en produkt som inte fyller önskad funktion.

Ifall vi nu har alltför olika åsikter gällande de här databasfrågorna så kan det nog också bero på missförstånd. Det blir ju som sagt ganska abstrakt så här utan grafiska skisser, så vi får väl ta de motstridiga åsikterna med en nypa salt. Ingen av oss vet väl egentligen med säkerhet vad som är möjligt och vad som är bäst, men jag tror att det i alla fall är själ att börja fundera på allvar på det här med en gemensam databas. Efter att man har jobbat uppskattningsvis 20-25% av den slutliga arbetsmängden, och då hoppeligen fått färdigt en databasmodell, så torde man väl kunna börja se om det är realistiskt eller ej. Om man sedan tycker så kan man ju på lång sikt försöka få dagens existerande släktprogram att närma sig kompatibilitet med en kommande gemensam databas. Förr eller senare kommer man väl att övergå till en gemensam databas, så inget arbete är väl då helt bortkastat och den dagen man börjar använda den kommer inte att vara en dag för tidigt om man tänker på hurdant trassel vi nu har med utspridda uppgifter.

Lasse1951

18.10.07, 12:13

Kalle, Hasse, Martin och alla andra,

Jag skulle också gärna deltaga i disskussionerna, vilken tid är det tänkt att ske?
Själv är jag på plats både lördag och söndag från omkring kl. 12 ->

Hälsningar,

Lasse Holm

admin

18.10.07, 12:24

Själv kommer jag att vara på plats enbart lördag morgon till ca. kl 13 max. Bör nämligen hinna hem via förrän följande evenemang kl 15 i Hagalund. - Men jag är knappast den viktiga i sammanhanget.

Hasse

kaila

18.10.07, 12:34

hel Lasse,

Vi har inte planerat något möte om dethär. Jag har talat med olika deltagare att jag gärna träffar dom på veckoslutet och diskuterar som rubriken säger utveklingsideer om Släktprogrammet men nog gärna även annat som gäller behandlingen av släktdata. Utveklingen av framtidens "Släktprogrammet" är i ett protoskede och om någon har bättre ideer än jag och kanske också tänkt hur utveklingen kunde ske tar jag gärna emot såna tankar. Metoder och programmeringsverktyg osv bör man väl försöka hitta bland det som "projektgruppen" känner till.

"Projektgruppen" består för tillfället av underteknad men vi får ju hoppas att andra kommer med i gruppen och att vi hittar en lösning som passar alla deltagare. Jag har en enkel prototyp med vilken jag kan visa hurudana mina tankar har varit. Åtminstone för tillfället innehåller den inget av det som Martin har beskrivit eller nån egentlig koppling till Hasses Talko databas om man frånser vanlig gedcom överföring.

Jag är på plats hela veckoslutet.

Martin Josefsson

18.10.07, 19:42

Jag kommer väl till Helsingfors på fredag kväll och har möjlighet att träffa folk åtminstone t.o.m. lördag kväll, kanske ännu på söndag. Jag har inga speciella tider då jag är upptagen, bortsett från det att jag kommer att lyssna på någon enstaka föreläsning eller dylikt.

Lasse1951

18.10.07, 19:56

Hejsan,

Jag försöker hitta Kalle, och sedan ser vi vilka andra jag får tag i och kan tala med angående saken:

Lasse Holm

Martin Josefsson

18.10.07, 20:22

Det är värt att påpeka att de långa inläggen som jag skrev här i den här diskussionen för några dagar sedan alltså inte på något sätt handlar om Kaarles Släktprogrammet. Jag ville inte göra några anspråk på att redan i det här skedet komma med åsikter om hur det programmet skall utvecklas. Mina inlägg bestod snarare av allmänna filosoferingar över vad jag personligen tycker att är värt att för släktforskarnas del tänka på inför framtiden då det gäller delandet av inmatade släktuppgifter. Den här diskussionstråden skall ju egentligen handla om planerandet av den fortsatta utvecklingen av Släktprogrammet. Det blir så där då man ibland kommer igång riktigt ordentligt med skrivandet, någon gång sent på natten.:oo:

kaila

18.10.07, 20:35

Det är värt att påpeka att de långa inläggen som jag skrev här i den här diskussionen för några dagar sedan alltså inte på något sätt handlar om Kaarles Släktprogrammet.

Det har jag förstått bra och jag skulle tro att även de andra som deltagit i diskussionen har gjort det. Med mitt senaste inlägg ville jag bara påminna de andra som har följt diskussionen om varifrån diskussionen började och var mitt främsta intresse ligger. Som det väl ofta brukar har diskussionen handlat om olika saker som nog är släkt med varandra.

Jag väntar inga beslut eller dylikt under veckoslutet men kanhända något att fundera på.

Kalle

JLausas

21.10.07, 14:29

Erittäin mielenkiintoinen keskustelu. Ilahduin heti Kaarlen uuden version mallista, joka toimisi useampien käyttöjärjestelmien alaisena, koska käytän itse Linuxia (oma lehmä ojassa). Osallistun mielelläni testaamiseen Linuxia käyttäen. Ohjelmien testailu on oikeastaan ollut ammattinani ja jopa harrastuksenani (jep, olen tietokonenörtti :)) 70-luvulta lähtien.
Jatkokysymys omistuksesta olisi mielestäni ajankohtainen oikeastaan vasta seuraavan kehittelyn vaiheessa - ainakin, jos keskustelun kaikken kunnianhimoisempien suunnitelmien kaltaisia asioita alettaisiin toteuttaa. Silloin ei enää yhden miehen harrasteluresurssit tunnu riittäviltä. Ehkä Open Source olisi houkutteleva vaihtoehto, sillä eri mallisia listauksia ja raportteja voisi lisäillä tarpeen mukaan jälkeen päin. Mutta ikävä kyllä monetkaan sukututkimuksen harrastajat eivät osaa ohjelmoida.
Toivon mukaan saat hyvää palautetta Valtakunnallisesta Sukutapahtumasta.