PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Todennäköisyys


PekkaLehtonen
11.05.15, 14:56
On olemassa henkilöt A, B, C, K, L ja R. B ja C ovat A:n poikia. K periytyy isälinjaa B:stä kymmenennessä polvessa ja 335 :ssä vuodessa. R periytyy isälinjaa C:stä yhdennessätoista polvessa ja noin 350 :ssä vuodessa. K:n ja R:n genealoginen etäisyys YDNA67 testissä on 2 ja yhteiseksi esi-isäksi on saatu normaalin sukututkimuksen keinoin A. Näinollen kummassakin linjassa on 1 mutaatio tai toisessa jommastakummasta on 2 mutaatiota. K:n ja L:n genealoginen etäisyys on 1 eikä heille löydy sukututkimuksessa yhteistä esi-isää, mutta L:n kaukaisin tunnettu esi-isä sopisi B:n pojaksi patronyymiltään ja iältään. Se olisi uusi tieto. Mikähän todennäköisyys tuohon tulisi, jos jätetään sivusta tullut isävaihtoehto pois ?

JHissa
11.05.15, 15:15
On olemassa henkilöt A, B, C, K, L ja R. B ja C ovat A:n poikia. K periytyy isälinjaa B:stä kymmenennessä polvessa ja 335 :ssä vuodessa. R periytyy isälinjaa C:stä yhdennessätoista polvessa ja noin 350 :ssä vuodessa. K:n ja R:n genealoginen etäisyys YDNA67 testissä on 2 ja yhteiseksi esi-isäksi on saatu normaalin sukututkimuksen keinoin A. Näinollen kummassakin linjassa on 1 mutaatio tai toisessa jommastakummasta on 2 mutaatiota. K:n ja L:n genealoginen etäisyys on 1 eikä heille löydy sukututkimuksessa yhteistä esi-isää, mutta L:n kaukaisin tunnettu esi-isä sopisi B:n pojaksi patronyymiltään ja iältään. Se olisi uusi tieto. Mikähän todennäköisyys tuohon tulisi, jos jätetään sivusta tullut isävaihtoehto pois ?
Mikä on L:n ja R:n genealoginen etäisyys (1, 2 vai 3) ja onko K:n ja L:n välinen mutaatio eri kuin jompikumpi K:n ja R:n välinen mutaatio?

PekkaLehtonen
11.05.15, 19:53
Mikä on L:n ja R:n genealoginen etäisyys (1, 2 vai 3) ja onko K:n ja L:n välinen mutaatio eri kuin jompikumpi K:n ja R:n välinen mutaatio?

En näitä ainakaan toistaiseksi tiedä. Pyrin saamaan selville

PekkaLehtonen
12.05.15, 10:42
Mikä on L:n ja R:n genealoginen etäisyys (1, 2 vai 3) ja onko K:n ja L:n välinen mutaatio eri kuin jompikumpi K:n ja R:n välinen mutaatio?

Katselin tuota projektin karttaa ja ilmeisesti on seuraavasti
DYS 460 K=11, L=10, R=10
DYS 442 K=13, L=13, R=12
Muut ovat samoja kaikilla

Vertaamalla ryhmään näyttäisi siltä, että 11 ja 13 olisivat mutaatiot.
Ja L:n ja R:n etäisyys olisi 1.
Kun 13 on K:n ja L;n yhteinen mutaatio, sen on täytynyt tapahtua A:n ja B:n väissä. !! olisi sitten A:n K:n puoleisesa linjassa.
Saanen vahvistuksen L:n ja R:n etäisyydestä ja R:stä yleisemminkin myöhemmin. Nyt R on päätelty ryhmästä, mutta lienee oikea

Olenko kartalla ?

Antti Järvenpää
13.05.15, 17:26
Kun teetin Y-DNA testin, minua kiinnosti, miten Family Tree laskee todennäköisyydet. Netistä löytyi ja löytyy jos jonkinlaista artikkelia, joissa yritettään formuloida kaavoja.

Käsittääkseni kyseessä on kuitenkin sen verran monimutkainen laskenta, että sen johtaminen ja esittäminen kaavoilla on lähes mahdotonta (kukaan e ainakaan tunnu tietävän näitä kaavoja), samoin kuin on mielestäni kysymyksesi laita.

Nykypäivä kuitenkin antaa mandollisuuden simuloida numeerisia ratkaisuja. Sitä voi yksinkertaisimmillaan tehdä excelillä ja mutkikkaammin erilaisilla matematiikka ohjelmilla. Idea on laittaa satunnaislukugeneraattori generoimaan noita mutaatioita, ja sitten vain simuloidaan tuhansia kierroksia ja tulokseksi saadaan todennäköisyys jakaumat kokeellisesti, kunhan on vain virittänyt mallinsa oikein.

Kun FT:ltä saa läheisen matchin, saa ikkunasta halutessaan näkyviin nk. S-käyrän todennäköisyysarvot. Mielestäni kuitenkin FT ongelmana on, että se laskee näitä asioita aika lyhyellä aikajänteellä, ja monella sukututkijalla mielenkiinto mennee yli 10 sukupolven isonvihan tuolle puolen, johon FT ei juuri annakkaan eväitä.

Jos sitten palataan kysymykseesi. Sinulla K:n ja R:n lähin yhteinen esi-isä olisi siis 350 vuoden (10 sukupolven) takana. Jos asiaa katsoo oheistamastani grafiikasta (jossa on 9 tai 11 sukupolvea muttei 10:tä).

Haarukoimalla kymmenessä sukupolvessa voi olla mutaatiota 0-12 välillä ja odotusarvoisesti niitä on 5-6 (käyrän kohdalla 0,5). Tähän nähden 2 mutaatiota 10 vuodessa on harvinainen. Mahdollisuus lienee noin 6 % luokkaa. Kuvassa punaiset viivat ovat non 2 keskihajonnan rajat (siis noin 2/3 tapauksista näiden välissä)

Kun sitten kysyt millä todennäköisyydellä L:n esi-isä olisi B:n poika, kun K:n ja L:n välillä on yksi mutaatio. Kokeelista käyristä voi lukea, että tuolla etäisyydellä 1 mutaation todennäköisyys on noin 2 % luokkaa ilman lisätietoa, että K:n ja R:n välinen etäisyys on 2 mutaatiota.

En osaa noin suoraan sanoa, miten tämä lisätieto vaikuttaa lopputulokseen, muuten kuin että se parantaa todennäköisyyttä. Toisaalta emme tiedä, missä sukupolvessa ja kummassa (kummasakin) haarassa nuo mutaatiot ovat tapahtuneet. Lisäksi on mahdollista, että L:n mutaatio on hänen oman haaransa mutaatio. Ja vielä lisäksi on mahdollista edestakaiset muutokset markkereissa. Jollakin tavoinhan tätä varmaankin voisi simuloida ja vaikka nk. ympäristövaikutus jätetään pois, niin tietyyn määrään sukupolvia osuminen ei ole mielestäni kovin korkea, vaikka en voi sitä tämän paremmin perustella.

Antti Järvenpää
17.05.15, 08:36
.....
.....
Kuvassa punaiset viivat ovat non 2 keskihajonnan rajat (siis noin 2/3 tapauksista näiden välissä)


Huomasin vasta nyt virheni:

Punaisella on 1 keskihajonnan rajat. Ei siis 2 keskihajonnan rajoja.