Shared cM project v4 er ute


Innlegget er en forenkelt og fornorsket utgave av «Introducing the updated shared cM tool, av Jonny Perl«

Den nye fjerde utgave av Shared cM Project er lansert, med nye verktøy

Siden 2015 har Blaine Bettinger hatt en nettdugnad hvor han har samlet inn data om delt DNA mengde av kjente relasjoner. Noe som har hjulpet mange å forstå hvordan man er i slekt med ett ukjent DNA treff. Leah Larkin har også bidratt med sannsynligheter, noe som også brukes i «What are the Odds» (omtalt hos meg som Hva er Oddsen)

Oppdatert versjon – Shared cM project

Siste versjon baserer seg på 60.000 kjente slektskap, noe som er en økning på 147% fra versjon 3. Dette gir økt nøyaktighet og flere detaljer. Verktøy er veldig likt som før men med følgende endringer:

Oppdaterte tallverdier

Tallene har ikke endret seg i stor grad, men noen er endret fordi tallgrunnlaget er forbedret. Blaine forklarer dette på sitt nettsted

Grand tante/onkel smed veid snitt, og forventet intervall

Histogramm er ett klikk unna

Du kan nå klikk på relasjoner, etthvert slektskap i blandt sannsynlighetene for å se histogram i ett nytt vindu. Histogrammer er grafer over over tallene bak. Disse kan gi deg bedre forståelse som:

  • Foreldre/barn bare noen få har registret delt DNA mengde under 3000cM
  • Minste verdi er derfor endret ned til 2376
  • Noen kan være det som kalles uteliggere, disse kan skyldes inntastingsfeil.
  • Histogrammet viser at majoriteten av data ligger mellom 3300 og 3900
Hvordan lese data: (Graf er for slektskap – Forelder). Tallverdier på x akse er gruppert, og fungerer som kurver. Tallverdier over søyler er antall registereringer i hver kurv

Om datagrunnlaget

Relasjonene

Blaine Bettinger har gjennomgått datagrunnlaget sitt og fjernet opplagte feil og uteliggere han har beskrevet dette i en rapport. Histogrammene er tatt derfra

Sannsynlighetene

Sannsynligheter er gruppert etter hvor sannsynlige de er og soteret fra høy til lav sannsynlighet.

Sannsynligheter for 1240 cM

Datagrunnlaget for disse sannsynlighetene kom fra en helt annen kilde Figur 5.2 Ancestrys fagartikkel om sammenligning (White paper on Matching). Figur viser hvor sannsynlig en spesifikk mendge delt DNA samsvarer med gitte slektskap, basert på Ancestry’s simuleringer. Noe Leah Larkin forklarer i sin blogg. Leah bearbeidet dataene videre

Disse omarbeidede data gir oss svaret på hvor sannsynlig ett 1240 cM treff er for ulike grupper. Den første gruppen Oldeforeldre, Gandtante/ grandonkel, Halv- tante/ onkel, søskenbarn, Halv niese/ nevø, Grand niese/ nevø, oldebarn har ca 74% sjanse, og netse gruppe har ca 26% sjanse (Besteforelder, Tante/ onkel, halvsøsken, niese/ nevø, Barnebarn)

Uenigheter

Siden det er to ulike datakilder og dermed ulike måter å se på disse, vil det ikke komme overaskende for noen at simulerte data og data fra nettdugnaden ikke alltid enes. Eksempelvis 400cM kan være en søskenbarn med lavt anslag av delt DNA basert på nettdugnaden, men simulerte verdier gir dette 0% sannsynlighet.

Når dette inntreffer vil verktøyet si ifra at dette er utenfor forventet sannsynlighet:

  • Nedenfor ser vi at for 150cM kan det være mnge slektskap som er mulig (positivt anslag 17-0,5%) Har merket disse med gult nedenfor
  • 1C1R – (barn av ett søskenbarn) har tilnærmet 0% sannsynlighet, men fordi omfavnes innefor de grenseverdier som er mulig er de listet opp som en mulighet.
† – Gitt 99% konfidensintervall havner enkelte slekskap utenfor hva som er sannsynlig

Advarsler

De samme advarslene finnes som før, men nå er de plassert i en blå boks på høyresiden. (Disse vises ikke på mobilversjon)

Flere slektskap og endogami

Hverken shared cM project, simuleringer, nettdugnader kan håndtere flere slektskap mellom testedes aner med påfølgende anesammenfall eller edogami. Har du dette vil ikke dette verktøy være treffsikkert nok.

Gjennomsnittlige verdier vist i boksene er bare bestemt av slektskap som er kjent. For mer fjerne slektskap er det større sannsylighet at du ikke vil DNA med fjerns slektninger enn at du gjør det. Les mer om dette

Veidsnitt og intervall for seksmenning

Eksempelvis, veid gjennomsnitt for en seksmenning er 25cM. Men vi deler bare DNA med 30% av våre seksmenninger (red: min artikkel: Hvorfor alle slektninger ikke er dine DNA slektninger )

  • Forventet intervall for seksmenning er 0 til 117cM
  • 25cM er ett veid snitt for relasjonen. Dette betyr ikke at det er det du vil dele med dine seksmenninger

Tips #2 Foreldre er i slekt?


Eksempel på hvordan det kan se ut når dine foreldre er tremenninger

På Gedmatch kan man gjøre noe snedig. Man kan sjekke om foreldrene dine er i slekt med hverandre!

Hvordan er dette mulig uten DNA fra foreldrene?

Siden alt ditt DNA kommer bare fra dine foreldre. Du fikk 2 kromosomer, ett fra hver av dine foreldre. Det som ikke kom fra den ene kom det fra den andre. Om disse er i slekt de ha like verdier på SNP’er. Mange like verdier etter hverandre over lengre «strekninger» om biten er stort nok vil indikere slektskap.

Små biter med grønt er trolig ikke entydig bevis på slektskap til dette bør segmenter være over 7cM og dermed blått.

Segmenter på over 7 cM er med 5% sikkerhet bevis på felles ane innen 6 generasjoner

SEGMENT LENGDE (CM)SANNSYNLIGHET FOR FELLES ANE (6 GEN)
> 3090%
20-3050%
12-2020%
6-125%
< 6< 1%
Tim Janzen https://isogg.org/wiki/Endogamy

Delt mengde går ikke opp?


Noen ganger får man DNA resultater som gjør at man stusser. Fikk spørsmål om hva jeg tenkte om dette tilfelle som gjengis i bildet nedenfor

Hvordan skal man forklare dette?

A, B og en person la oss kalle vedkommende for Barn hadde alle delt DNA mengde på ca 800-900 cM. Barnets relasjon til de andre som er testet er nevø/niese. Dersom man sjekker shared cM prosjektet så sier den at dette forholdet er svært lite sannsynlig.

NB Dagen etter jeg skrev dette endret Shared cM project seg. Grenseverdier kan ha endret seg. Og Jonny Perl skrev «Hverken shared cM project, simuleringer, nettdugnader kan håndtere flere slektskap mellom testedes aner med påfølgende anesammenfall eller edogami. Har du dette vil ikke dette verktøy være treffsikkert nok»

Sannsynlighet for 880cM relasjon
tabell med sannsylighet for 880cM relasjon

Hva skal vi trekke ut av dette? Siden alle har nesten lik mengde delt dna er alle søskenbarn? Hæ? Er noe galt i slekta, sier du?

Kjent relasjon er ikke ett valg

Ikke trekk konklusjoner for fort

Å hoppe til incest er svært betenkelig og muligens ganske spekulativt, bare fordi delt DNA ser likt ut på tvers betyr det ikke at familierelasjonene er de samme. Det er mange relasjoner som kan komme ut med samme verdier på delt DNA.

Jeg har tidligere skrevet om Halvsøsken når at delt dna kan komme fra flere kanter og at hvordan dette kan slå ut. Når man er i slekt fra flere kanter har man fått DNA fra flere aner. Dette hoper seg opp slik at hver relasjon legger til sin relasjons DNA. Feks dine foreldre er tremenninger?

  • Foreldre gir barn ca 3487 cM (eller egentlig alt mellom 3330 og 3720) du får altså 3487 fordi du er ett barn.
  • Tremenninger deler 233 cM (46 – 515). La oss si at tallet er 233. Du får dermed 233+233 fra dine foreldre, men husk at dine foreldre gir deg 50% av sitt dna, ergo du arver ca 233 pga denne relasjonen.
  • 3487 + 233 = 3720 cM

Hvorfor morfar ikke er far til Barn (ergo halv tante/onkel + 1CR1)

  • Normal verdier: 1330 (891+439) Verdiene er ikke i nærheten av 1300 tallet så jeg synes det alternativet virker søkt.
  • Min: 641 (500+141)
  • Maks: 2297 (1446+851)
  • Selv om minimums verdier gir dette som en sannsynlighet, men dette er sannsynlighetsberegning. Jeg er rimelig sikker på om man tar i bruk fornuftige sikkerhetsmarginer (konfidensintervaller) vil dette alternativet falle bort

Hvordan regne seg bakover

Man kan aldri være sikker på hvem som har gitt deg hva uten å kjenne sine forfedres DNA. Man arver aldri 50% delt på n for hver generasjon bakover. Dersom man for enkelheten skyld sier at at mot A og B deler man 880 cM og denne relasjonen er av typen onkel/nevø eller sagt på annen måte søkenbarn forskjøvet 1 generasjon som forkortes til 1CR1. Viser Shared cM prosjekt at:

Forventet verdi på en slik relasjon er 439 cM, men kan være så lavt som 141 eller så høyt som 851 (sikkerhetsmargin på 99%). Ved å ta disse verdiene og trekke det ifra 880 står man igjen med 441 (739-29).

Dette betyr at restverdien av DNA fra en eller flere relasjoner kan være så lite som 29 cM, og så stort som 739 cM, men i snitt 441 cM.

Om foreldrene er i slekt med hverandre så må jeg ta høyde for at ca 50% forsvant på veien ned. Foreldre som deler 58 cM kan være i slekt med hvaernadre langt ut i. 1478 kan være halvsøsken, eller onkel/niese type forhold men også flere men lite trolig pga generasjonsgap.

«Normalen» 882 kan være søskenbarn, eller halv onkel/niese. Men feilen kan skyldes noe annet

For nære relasjoner påvirker rekominering sterkere enn slektskap lengre ut. Ofte går små biter uforandret fra foreldre fordi rekombinasjon inntreffer 1-3 ganger pr kromoson som igjen gjør at disse bitene ikke blir omfattet av rekombinering som opptod mellom foreldre og barn. Større biter har større sjanse for å bli brutt opp enn små (artikkel om rekombinering av xDNA)

En bedre forklaring?

All DNA som dukker opp som delt DNA skyldes ikke slektskap, det kan skyldes tilfeldigheter. Segmenter under 7 cM bør aldri telles opp, og der hvor man vet at det kan være slektskap mellom foreldre, eller at deres aner er fra samme område det som kalle endogamy eller «lite oppfinnesomme» aner som ikke gikk langt for å finne ektefelle. så bør man ikke telle med segmenter under 10, 15, 20 cM (hvilket all du skal bruke avhenger litt av hvor tett dine aner «bodde»)

DNA painter har en tjeneste for å vaske små segmenter om du har vansligheter å plukke vekkde små og summere opp de store segmentene https://dnapainter.com/tools/imf

Dette er svært viktig å huske på om du har teste deg hos FTDNA de tar med alt over 1cM om man har ett segment større enn 9cM (eller ett segment på 7,69cM og totalt 20cM sammenlagt). Myheritage tar med segmenter alle over 6cM om man har ett over 8cM.

En vask av segmenter kunne fort gitt ett annet resultat og tatt vekk mange segmenter. det skal så lite som 30 cM for å komme inn under en mulig relasjon for 1CR1 !

Segment lengde (cM)Sannsynlighet for felles ane (6 gen)
> 30 90%
20-3050%
12-2020%
6-125%
< 6< 1%
Tim Janzen https://isogg.org/wiki/Endogamy

DNA testing er heller ikke uten feil les mer om dette: DNA testing prinsipper

Er foreldre i slekt med hverandre?

På Gedmatch kan man gjøre noe snedig. Man kan sjekke om foreldrene dine er i slekt med hverandre! DNA tips #2 Er dine foreldre i Slekt? (Viser slektskap mellom foreldre som er tremenninger)

Konklusjon

Aldri start diskusjoner med familien basert på løse antagelser. Det kan være helt naturlige forklaringer på hvorfor statistikken ikke virker. En vanlig forklaring er at «Folk i Norge» er ofte mer i slekt med hverandre enn det de først tror. Folk tar ofte med for store verdier på delt DNA som burde vært vasket vekk og da får man ofte ett mindre antall på totalt delt DNA.

Normalen er man bommer på hvor felles aner må ligge med en generasjon. Den skal en generasjon lengre bak fordi delt DNA mendge er for stort.

Dersom man har (uoppdagede) halvsøken relasjoner så vil delt DNA mendge være ca halvparten av foreventet verdi (man mangler 50% i utgangpunktet). Når dette inntreffer bommer folk flest med delt DNA mendge viser. Relasjonen er en generasjon nærmere enn man skulle først anta.

Hvor mange aner har vi?


Det er flere måter å se på denne problemstillingen. Rent matematisk er dette enkelt å angi, siden vi har 2 foreldre, de har 2 foreldre osv. Dette kan regnes ut etter formelen 2n, hvor n er antall generasjoner bakover.

Ulike former for anetrær kan være:

  • Ditt formelle anetre – Basert på slektforskning tradisjonelt
  • Faktisk genetisk anetre – de du faktisk har arvet dna ifra, som er mulig å spore med DNA tester av bare deg
  • Jurdisk anetre, hvem du har lovmessig rett til arv etter. Adopterte hører i ett slikt tre.
  • Sosiolektiske tre – hvor du føler tilhørighet, hvor ikke biologiske personer kan intreffe.

Når vi gransker slekta bakover på våre aner, så lager de fleste sitt juridiske anetre, eller sin sosiolektiske anetre. Slike anetrær vil følge overnevnte mønster med 2n aner for hver generasjon. Det vil alltids finnes folk som gjentas. Hvor mange unike aner har vi? Alle familier har dets som kalles anesammenfall før eller senere i sitt anetre. Når folk som er i familie får avkom blir det gjerne «dobbelt opp» med noen aner. Anetreet kollapser, antall unike aner reduseres.

Briters aner – med anesammenfall

Det ble gjort en studie av Ian J Heath i 2018 om hvor mange britiske aner briter har. Tallene for aner vil være litt lavere enn enn hva man normalt har for unike aner, siden de også i sin beregning ikke regnet med «innvandrere». Men tallene er interresante alikevell. Veldig forenklet sa dette studiet at det maksimalet antall aner var etter 25 generasjoner med ca 1,5 millioner aner, etter det kolapser anetrærne voldsomt igjen. Det interesante er at det er fra generasjon 4 og bakover at anetreet «normalt» skrumper inn (for en gjennomsnitts brite). Tallene lengre bakover er ikke så ulikt hva man finner på hvem som er våre genetiske aner.

   Gen# Ancestors2n
122
244
388
41516
52832
65564
7107128
8207256
9401512
107781024

Kilde: https://www.researchgate.net/publication/323757098_How_many_ancestors_does_a_Briton_have

Genetiske aner

Når ett barn «lages» blandes foreldrenes DNA på en måte som kan forklares med å sammenligne DNA strengen med ett perlekjede. Hvert kromsonpar deles normalt inn i 0, 1 eller 2 like biter. Perlekjedene (kromosonparet) deles på samme vilkårlige sted for hvert kromonosonpar. Lengde på hver bit er parvis lik. Deretter bytter biter av samme lenge plass med hverandre, slik at man blander fars og mors dna vilkårlig. Hos damer skjer det i snitt 41 ganger på 23 kromosoner som de putter i sine egg, og hos menn er det 26 ganger på 22 kromosoner de putter i en sædceller. Det 23 kromosonet som er Y-kromosonet går «uforandret» videre. Jeg tror det er derfor damer har litt mer oppdeling av DNA og dermed litt større sjanser for å ha flere genetiske aner.

Illustrasjon på hva som skjer når kromosoner blandes under meoise. Bare den ene av de to til høyre går til ett egg, eller sædcelle

Siden alle ikke arver eksakt like mye av alle sine aner vil det være noen aner man ikke arver noe ifra. Som igjen har sammenheng med hvor mye dna blir oppdelt hos foreldre. Rapporten jeg kikket på deler inn i kvinner og menn, men jeg har slått sammen tallene. Dette kan summeres opp slik:

GenerasjonMinMaxSnitt
5 – 2xtipoldeforeldre010
6 – 3xtipoldeforeldre 030
7 – 4xtipoldeforeldre 0134
8 – 5xtipoldeforeldre 185536
9 – 6xtipoldeforeldre 135207171
10 – 7xtipoldeforeldre 505606556

Tabell – Hvor mange aner du ikke har arvet dna ifra og du vil aldri finne etterkommer etter

Dersom flere i slekta har testet seg vil disse arve biter du ikke arvet fra sine forfedre som du ikke har arvet. Det kan derfor være en grunn til å samarbeide om dere skal på sikt kartlegge, eller forsøke å gjenskape hvilket dna diner aner har. Noe som igjen er viktig får å drive målrettet jakt på etterkommere av disse.

Aner du faktisk har arvet dna ifra

NB Antall genetiske aner etter 10 generasjon øker ca med 68 for hver generasjon og ikke eksponentielt slik som den forventende gjør.

Kilder:

Dette forklarer også litt hvorfor du ikke vil finne etterkommere av disse anene på din treffliste. Dersom dine aner bare har 1 barn som overlevde lenge nok til at det selv fikk barn, vil 50% av alt arvematerialet bli borte fra alle etterkommere av den grenen. Mer om dette med kommer i en senere artikkel. (Hvor mange x-menninger har du egentlig)

Mitt foreløpige genetiske tre

Jeg har forløpig ikke funnet mange etterkommer hos alle mine tipoldeforeldre som også har DNA testet seg. Jobber med saken. Har derfor ikke kunne bekrefte at jeg har DNA etter mange av min forfedre. På DNA Painter har det kommet en ny funksjon som kan vise hvilke aner jeg har klart å DNA kartlegge.

Mitt faktiske genetiske anetre
Mitt dna anetre

Ser jeg har en jobb å gjøre for å finne mine farmors- , og min morfars- aners etterkommer. Bare de kan hjelpe meg til å sannsynliggjøre at mitt papirspor (tegning under) er rett. Man kan forvente å finne avvik. Ca 2% av alle som er født har «feil» foreldre (far). Før eller senere finner jeg nok ett avvik.

Mitt foreløpige anetre – Slektsforsket

Aner jeg har funnet i min slektsforskning
Mitt ane tre – «papirsporet»

Stort sett har jeg kartlagt alle mine aner i 6 ledd bakover. 6 personer mangler i denne generasjonen. Å treffe ett slikt hinder kalles ofte en slektsmur (eng: Brick wall). Mine skyldes dårlig informasjon om foreldre som har for vanlige navn til å enkelt finne i kilder jeg har kikket i og litt uklareheter i hvor de er fra. Jeg har også kartlagt enkelte av mine aner lengre tilbake enn 9 generasjoner som er maks som vises i DNA Painter anetreet mitt. Min mor har 3 aner som er i slekt med sine ektefeller. Så jeg har flere anesammenfall. Kanskje finner jeg noen på min farsside også, hvem vet.

Jeg har DNA til begge mine foreldre, ved å bruke teknikken i https://holte.nu/2019/06/29/liste-magi/ har jeg funnet hvem av mine treff som tilhører fars eller morssiden. 64% av alle mine treff tilhører farsiden, mens knappe 12% til hører morssiden. Resten anser jeg som falsketreff. En ville tro at siden min farsslekt dominerer i trefflistene at jeg har funnet ut av flere på hans side, men nei. Finner foreløpig ut mest ut av slekt på morssiden, pga dna slektskap.

Fotnote

Liste magi


Ofte når man jobber med DNA så jobber man med ulike former for lister. Enten fordi man samarbeider med slektninger og utveksler lister, eller fordi man administrerer DNA for flere og av den årsak har flere lister. Man kan bruke listene til å finne ut mer enn bare ved å se på sin egen lille liste isolert.

Nedenfor viser jeg deg Hvordan bruke excel til å jobbe for deg med å sortere ut forskjeller, eller likheter mellom 2 lister. (Jeg bruker Office 365 PC versjon). Fremgangsmåten er forenklet og veldig generell fordi ulike selskaper har ulik former på sine lister. (MyHeritage lister må bearbeides litt før de kan brukes*  Listen jeg bruker her, er ekstrem enkel.  (Denne bruksanvisning i pdf, med bilder + demofiler)

* MyHeritgage matchlister inneholder «ID for deg» – «ID for treffperson», Din ID må fjernes om du skal sammenligne lister fra ulike personer. Første linje ID hos MH kan se slike ut: D-52B0754F-8EFF-36AA-9B05-B56ACC6F359E-D-1E0A3A3A-85BC-45F6-A26F-D0A019615CDF, har markert ut hva som må bort.

Forutsetninger:

  • Excel
  • 2 filer av samme oppbygging
    • Excel filer eller filer med tabellarisk struktur (komma, semikomma, tab separert, eller fast feltlengde). Filene må ha kolonner og rader
ID;NAVN;cM
AE123;Dag Holte;1876
WD541;Runa Grøndahl;3560

Fremgangsmåte:

  1. Åpne excel
  2. Gå til data fanen. Velg rett å åpne rett filtype (dette eksempelet har csv filer)
  3. Velger «DNA_MOR.CSV», trykker «importer»
  4. Trykker «Last inn»
  5. Endrer navnet på arket til «Mor»
  6. Gjentar punkt 2-5 for «DNA_BARN.CSV»

Like i begge lister (morsslekt)

  1. Hent data, Kombiner spørringer, Slå sammen
  2. Velg
    1. Data kilder DNA_BARN, DNA_MOR
    2. Kolonne som skal være lik i begge (Klikk på tittelfelt for å aktivere)
    3. Sammenføy type:
      1. indre == like i begge
    4. Trykk ok. (Kan du ikke trykke ok, har du trolig glemt pkt 2. kolonne som skal være lik)
  3. Lukk og last inn (Du får nå nytt ark med det som er likt i begge lister)
  4. Gi arket nytt fornuftig navn (I dette eksempelet er ett naturlig valg å kalle det morsslekt)
  5. Endre navn på spørring ifra Merge1 til Morsslekt (høyreklikk på navn i spørringer i høyre marg, velg endre navn)

Farsslekt

Dersom man ikke har en far hvor er dennes slektninger?
Svar: De vil hovedsaklig være de som moren ikke har, men barnet har

Vi tenger å vite hvem er i listen til barnet, men ikke er felles med mora.

Gjør som over, men velg

  • kilde: DNA_BARN (først), Morslekt 
  • sammenføy type,  «Anti – bare rader i første»
  • lukk og last inn
  • Navngi arket og spørringen «Farslekt»

AUTOMAGI

Du har nå koblet ditt regneark til 2 eksterne datakilder.  Lagd 2 lister hvor du har delt inn slekta etter mor og far. Får du nye lister kall de det samme og overskriv de gamle listene. Sidene dataene ligger utenfor og er oppdatert, alt du trenger å gjøre i ditt regnerak er å gå til arkfane «Data» og trykk på ikon for Oppdater alt. (Mener bestemt at tastekombinasjonen Alt+F9 er hurtigtasten, for oppdatert alt)

Alle dine lister vil ha oppdatert seg i regnearket, helt automagisk.

En mulig utvidelse er å lage en masterliste for hver av dine dna personer. Om du døper om den nye lista til «person»_ny kan du ha en lignende spørring som ser om det er noen nye i listen og legge disse til i master listen. Hvordan du gjør dette er likt det du har gjort her, men du må velge Full ytre, og senere finne funksjonen fjern duplikater (menypunkt under Data)

Hva er oddsen?


Bakgrunn

What are the Odds? eller WATO som noen forkorter dette til, er ett verktøy på «DNA Painter» sittt nettsted som er verdt å undersøke. Spesielt om du ikke vet hvordan man skal plassere noen inn slekta og du vil leke med mulighetene.

Eksempelet som brukes er 80% oppdiktet. Det eneste som er reellt at Bjarne Betjent er født ca 1945, oppgitte cM verdier (andel delt DNA) og at han har en ukjent far. Dette er gjort for å skjule identiteten til nålevende, og det er uenighet om hvordan "Bjarne" passer inn i slekta.

Bjarne Betjent har fått nokså 2 nære treff på 564,2 og 444 cM med noen som han antar er på hans fars side, Bodil og Johan. Andre disse også DNA treff med er Inger, Lisa, Julie, Tove samt Vivian. Alle treffene var på Gedmatch. Men ingen av disse 2 treffene er synlig i slekt med hverandre.

Hvordan kommer man videre? Jo man må finne ut hvordan folkene er innbyrdes i slekt med hverandre å tegne slektstrær. Hvordan kan man det, jeg vet bare at de er i slekt med meg?

På Gedmatch kan man se sine treff, og man kan se sine treffers treff. (egentlig alle sine treff). Nøkkelen er å bruke GedmatchID, Gedmacth er en åpen dna database som lar (alle sine registrete brukere) se den informasjonen du har lagt inn i databasen, unntatt hvilken DNA kode du har*)

*) Matcher du noen på kromosonene fra plass 50420 til 51620 og du vet hva du har av dnakode i dette område, vet du hva den andre også har mellom disse punktene, og bare der. Du vet ett lite fragment av ett lite fragment av hva denne personen har. En autosomal test avslører 0,02% av ditt DNA om du deler hele "koden" du fikk kartlagt, (ca 700.000 av 3 milliarder bokstaver) så om du eksponerer 1200 av dine 3 milliarder bokstaver så ville jeg ikke bekymret meg over dette.

En nøkkel til å DNAforske slekt på er å bruke «shared cM project» på DNA Painter. Taster man delt DNA i cM verdi får man opp hvilke relasjoner som er mulige, med sannsynligheter. (Med MyHeritage får du dette direkte i 1-1 trefflisten). Ved å se på trefflisten til de ulike matchene på Gedmatch fant man følgende relasjoner:

NavnTrecMSlektskap
BodilA0564,2Mor til Tove og Vivian
ToveA1256,7Datter av Bodil
VivianA2224,3Datter av Bodil
JohanB0444 Onkel til Inger og Lise
IngerB1239,7Niese av Johan.
LisaB2 269,6Niese av Johan. Mor til Julie
JulieB21195,4Datter av Lisa

Ved å kontakte noen i slekta til Bodil og Johan fikk man vite at ovenstående stemte, og at familiene hang sammen på følgende måte:

* angir hviken søsken som er forelder for neste generasjon

Utfylling av WATO

For å kunne bruke «What are the odds» må man starte med en kjent ane. I eksemplet ovenfor er dette ikke tilfelle. Dette er 2 slekter med en felles forbindelse. Dette betyr at man kan tegne 2 (4) forskjellige tavler. Hver boks i WATO kan være ett par, eller en person. Tegner derfor opp 2 tavler; Etterkommere av Truls, deretter Ingrid. (Å tegne opp nedenstående er ganske enkelt, forklarer ikke hvordan jeg kom dit. Utfordringen med å bruke verktøyet kommer i neste steg). Bare de du har en cM verdi på skal oppgis med dette. Det er disse’s delt DNA som brukes videre i teoriene.

Teorier – hvordan passer Bjarne Betjent inn?

WATO virker ikke med mindre man har flere teorier. Man kan ikke bare putte inn det man tror er rett og få ett svar. Hele poenget med dette verktøyet er å analysere hvilke teorier kan være rett. Når man har store andel delt DNA typisk foreldre/barn, søskenbarn, halvsøsken trenger man egentlig ikke dette verktøyet. Det holder med å bruke «shared cM prosject» i slike tilfeller. Prøver nevø/niese for å vise hva man velger (ikke fordi det er en god teori).

Hypotese kommer ut med score 0 (bilde under), som betyr usannsynlig. Døper om barn av Edna til hel/halv (fordi jeg skal vise hvordan legge til halvsøsken), samt se hvordan det slår ut.

Skal være halvsøsken til alle de andre søskene. Velger derfor alle

Tester alle avkom i hver generasjon av «halvsøskenet». Hypotese 3 får høyest tall, som betyr det er mest sannsynlig.

Rapporten under grafen som tegner opp er viktig å sjekke, den oppsummerer alle funnen på alle teoriene. Foreløpig sier den dette:

Hypotese 3 er 1178x mer sannsynlig. OBS! Dette betyr ikke at den som er mest sannsynlig, er den faktiske forbindelsen. Kan noe være mulig så kan det være mulig. LIvet er fult av tilfeldigheter! Vi har fortsatt mange andre alternativer som ikke er utforsket. Legger til alle mulige varianter jeg kan komme på for denne delen av slekta. Så få vi se hva som dukker opp:

De med «no» emoji, passer ikke pga alder

Lagde de alternativer jeg kom på, men flere av disse passer ikke inn om alder på far i forhold til fødsel av Bjarne Betjent. Satte emoji på de alternativer som ikke går opp, og fjerner før neste bilde.

WATO diagram familiegren 1: 4 ulike alternativer er like sannsynlige! Må derfor se på den andre famliegrenen

Familiegren 2

Viser bare oppsumeringen og ikke hvordan jeg kom dit i detalj. Tar hensyn til at Bjarne sin far kan ikke være født senere enn ca 1930, siden Bjarne er født ca 1945.

WATO – del 2

WATO diagram for famlien over

Konklusjon

Om man tar ett steg tilbake og ser på opplysningene pånytt. Hva er det som utmerker seg med dette tilfelle? I jakten på en ukjent forelder, så har man 2 familiegrupper som ikke er i slekt med hverandre, men er forbundet via en tredje person. Det logiske er at det er personen som er nøkkelen. Reiulf, eller en av hans sønner må være faren til Bjarne Betjent. Alternativt en helbror av han og eller sønn av denne, eller helsøsters sønn. Men han har neppe en helsøsken fordi han er ett resultat av ett flyktig forhold, så det må være han. Slektskap til begge «klyngene» er ikke mulig på andre måter. Folk som leter etter ukjent far er som regel ikke så heldig å ha denne familietvisten. Slekt som er mulig pga 2 halv familier, som ikke er i slekt med hverandre men bare «deg» via din ukjent ane.

Kombinasjonene av begge WATO diagrammene understøtter denne teorien. Dette er mest plausible forklaringen om man ser på alle fakta samlet. Mener du noe annet ta gjerne kontakt!

Bli konge på familehaugen du og!


Familieklynger hjelper deg til å forstå hvor andre hører hjemme i din slekt. Genetic Affairs har gitt MyHeritage tilgang til deres verktøy for å lage familieklynger. Her er noen tips for at du skal kunne mestre dette verktøyet du og.

Liten advarsel, selv om man deler dna med noen er dette ikke et endelig bevis på slektskap, men en meget sterk indikasjon. Slektsforskning må til. Mengden delt dna spiller inn, små mendger kan tilfeldigvis kommet fra ulike grener og dermed mistolkes, slik at man finner likt dna ved tilfeldigheter og ikke fordi man har felles opphav – IBC – Identified by Chance. Siden grenseverdiene er satt nokså høyt er det normalt å se relle slektninger i klyngerapporten.

Intro

Har du DNA hos MyHeritage og premium abonnement eller bedre kan du be om å få tilsendt en «Auto cluster» rapport. (Cluster = Klynge). Dette er en sammenligning av dine matcher som deler mellom 30 og 350 cM *) med hverandre. På «Genetic Affairs» kan kunder hos 23andMe, Ancestry og FamilyTreeDNA abonnere på sine matcher, og selv bestemme hvor ofte man skal få denne rapporten, samt utifra hvilke grenseverdier. Hos MyHeritage kan du bestille rapporten manuelt 1 gang pr døgn.

*) Usikker på om disse verdiene justeres automatisk basert på dine data, men antar dette.

Alle matcher sammenlignes mot hverandre. Forenklet betyr dette om Person A,B,C og D matcher deg så sjekkes A mot ABCD, så B mot alle osv. Deler 2 personer segmenter merkes krysningspunktet mellom de med en farge. Flere med samme farge betyr de tilhører en klynge av folk som innbyrdes deler DNA. Alle innad i en slik gruppe trenger ikke å ha arvet samme hele segment, men innbyrdes så deler de DNA på ett eller flere segment.

Samme farge = Samme familieklynge / familiegruppe

Hvordan tolke rapporten grafisk

(1) Hvem er Derek i slekt med?


  • Går man først horisontalt bortover og kikker opp ser man at han er i slekt med seg selv. Krysningspunktet er merket med (rød)farget boks.
  • Neste person er Stephanie. Hun ser ikke ut til å være en match. Her kan vi bli lurt. De kan dele mindre enn 30 cM seg i mellom. Isolert sett kan man derfor ikke si de er i slekt med hverandre utifra denne rapporten. (Det er sterke indisier for at de er i slekt, fordi de begge er si slekt med andre som er i samme røde grupppe A).
  • Fortsetter vi bortover er; Samantha, Gerald, Jan og Desiree også i samme familiegruppe.
  • Kikker vi lengst bort finner vi en grå boks. Derek ser ut til å være i slekt med Maritha, men slektskapet er grått. Forklarer dette bedre i detalj rett nedenfor.

(2) Grå utenforliggere (Spøkelsene)

  • Alle i en gruppe 1, er grå. Dette betyr at de slekt med flere grupper, De får derfor ikke en entydig farge utenfor sin egen nærmeste gruppe. De er «spøkelser» som viser at det er en forbindelse mellom de ulike klyngene/familiene. (spøkelser er «mitt» ord, i mangel av noe bedre å kalle det)
  • Ser vi på Bernt Ole er han i slekt med 3 stk grå (Jan, Frida, Paulette). Disse tilhører egentlig rød gruppe A, men han er også i familie med folk i grønn gruppe D (Seg selv, Kerry, Maritha).
  • Alle 7 i gruppe 1 ser ut til å være i klynge D, men også i slekt med noen i klynge A. Om du tenker etter er kanskje noen av dine søskenbarn i slekt med deg via din morsslekt, andre søsken barn er i slekt med deg via din farsside. Dette betyr ikke at disse grå er i slekt med deg både via far og mor, men att dine «cousins» kan være på forskjellige grener. men det kan være på samme side av en familie også fordi søskenbarn arver ulike biter av sine felles besteforeldre/oldeforeldre. Noen kan også være i slekt med deg lengre bak i anetreet og derfor være litt i slekt med begge grener.

(3) Grå spøkelser er hint

  • Bernt Ole og Kerry i slekt med Jan som igjen er slekt med alle i rød gruppe. (Se på jan horrisontalt). Vi så på Bernt Ole i forrige runde, Kerry er lik Bernt bortsett fra at Bernt macther Dale og det gjør ikke Kerry. Derimot matcher Kerry, Maritha og det gjør ikke Bernt Ole.
  • Videre undersøkelser på segmenter må gjøres. De grå forbinder 2 grupper hovedsaklig fordi de man må se på at de er slekt med en som er i gruppen. De hinter sterkt om slektskap mellom disse klyngene. Jo flere grå utenforliggere mellom 2 jo sterkere indisie. Totalt er der 7 grå i gruppe 1. Men det kan bli for mange også slik at man ikke ser åpenbare sammenhenger. Noe som er vanlig med steder hvor alle er i slekt med alle, eller folkegrupper gifter seg bare innen sin religion/kaste.

(4) Alle matcher hverandre


  • Alle i klynge C er innbyrdes i slekt med hverandre. Jeg ser dette fordi alle matcher hverandre – og vises som en perfekt forkant. Av dette kan man også anta at det er trolig er nært slektskap de i mellom. (Alle triangulerer på minst ett delt segment – se lengst ned på siden at dette stemmer)
  • Fra «Theorem om slektskap», vet jeg at alle disse har samme stamfar/mor. Suzette er mor til Kyle, Debbie og Alison. Dag Albert er min mors tremenning. (Suzette har jeg forøvrig korrespondert med endel uten å vite at det er tatt DNA test av hennes barn. Jeg har slektsforsket endel på hennes kobling til meg. Jeg avviste nemlig først hennes forfar som en del av min slekt basert på feilaktig oppført fødested hos henne og «alle» andre på MH (Stangeby, Hedmark), men personen viste seg å være en «Stangeby» fra Hof i Vestfold.
  • At alle ikke får en farget kloss betyr ikke at de ikke har samme ane men de har arvet ulike segemeter av DNA. De vil da ikke kunne sammenlignes. 99% av alle tremenninger deler dna, går man en generasjon bakover vil 90% av firmenninger kunne bevise slektskap gjennom dna. femmenninger deler i 50% ikke dna med hverandre. Dette er fordi man arver ikke de samme bitene av sine forfedre.

(5) Alle er i slekt med seg selv

  • Alle sjekkes mot alle også seg selv, det er derfor at bilde sentrerer rundt en akse.

(6) Symmentri

  • Som nevnt i (5) sjekkes alle mot alle, man får derfor en akse. Denne gir en symmentri. Spiller derfor ingen rolle om man ser på en personene i venstre marg, eller starter med personene i liste øverst.
  • 4 stk i Gruppe 1 ser ut til å være tett i slekt med hverandre. Går man til høyre vil man se igjen dette innefor gruppe D (a)
  • 3×4 personer går igjen i bolker (a,b,c) som du ser nederst til høyre i bildet – (Klynge D). Antar at alle inne for hver av disse minigruppene er tett i slekt med hverandre.
  • Person d kobler minigruppe a med minigruppe b. Her må jeg undersøke videre hvordan de er innbyrdes i slekt med hverandre. Men det er klare indikasjoner på sammenhenger. Antar at Dale er lengre ned i treet enn Bernt eller omvendt (her må jeg sjekket nærmere hvilken retning dette viser)

(7) Alle må ikke dele samme segment for å utgjøre en klynge

  • Klynge C danner en pen firkant og alle matcher hverandre. Her tenker jeg at alle sammen deler samme segment. (Ved sjekk på kromosonleser ser jeg at alle triagulerer på det ene av 3 segmenter)
  • Klynge A er større og løsere sammensatt. Her er ikke alle tilsynelatende i slekt med alle andre, men alle er i slekt med noen som er i slekt med dem. Her vil det være folk på ulike grener hvor noen har arvet segmenter som andre grener har mistet disse.. Fragmenter av DNA som er felles binder disse sammen

Klyngerapporten

Noen mener at den viktigste delen av rapporten er oppsummeringen nederst. Første del er veldig visuell og kan gi deg en forsåelse av sammenhenger. Det hångripelige er oppsummert i listen nederst. Hver klynge finner du igjen i listen. Man ser navnet på Person som matcher (som også finnes på den visuelle). cM er totalt delt dna oppgitt i centiMorgan, den lengste blokken oppgis under «longest cM», så får du vite antall delte dna-biter (segmenter), hvilken klynge, for til slutt å få oppgitt hvor mange personer som finnes i slektstreet

Klynge C

1) Navn på treff

Ved å klikke på navnet til treffet får du vedkommende opp i 1-1 DNA sammenligning. Herfra kan du gjøre mye (dette skriver jeg mye om nå)

2) Notat

Teksten under navnet i feltet «Notes» finnes bare om man på forhånd har skrevet noe i notatfeltet på DNA treffet. Det flere veier til dette notatfeltet, det mest synlige er under «Undersøk DNA», som jeg har markert med 2 i bildet rett over. Er notat feltet utfyllt er boksen farget sterkt lilla. Hvordan du fyller ut dette feltet er opp til deg selv.. Foreløpig gjør jeg det på en bestemt måte (se nedenfor):

  • Første linje: bokstavkode for stien til kjent ane. (M-Mor, F-Far). En bostav for hvert ledd. Så navnet på denne personen,
  • Andre linje: Navn på foreldre som gav gav dna’et til denne personen, samt hvilken relasjon jeg har til tester 4C = femmenning.

3) Slektstre

Finnes testpersonen i ett slektstre så angis dette i siste kolonne i «treff-listen». I eksempleet over vet jeg at jeg har en mor, og barn. Hadde jeg ikke vist dette, eller om jeg lurete på hvilke slektskap det kan være mellom noen i treet får man først ett lite hint ved å se på antall medlemmer i treet. På første bilde ser jeg at det står 812 på 3 stk (De befinner seg i samme treet) Ved å klikke på tallet kommer man inn i slektsstreet og kan se om dette stemmer eller ikke. ett annet tips er å sjekke ut 1-1 på den med mest delt DNA/eller lengste segment. Nedenfor ser jeg at Suzette er mor til 3 barn som alle triangulrer med meg. Bare Allison og Kyle er i klynge 3 (C)

4) Delte segment

Delte segemnt kan visualiseres via kromosonleseren- Man velger en eller flere personer i klyngen og ser om disse triangulerer på en eller flere segmenter. Jo flere man ser på jo mindre blir biten som er felles for alle. Eksempel nedenfor viser at alle matcher hverandre på ett segment, derfor har alle match mot hverandre i den gule klyngen C.

Listen sier at jeg deler 3 segmenter med noen, og 11 med Dag Albert. (tar ikke med alle hans segmeter). Som vist ovenfor har Suzette 3 barn. Alec er ikke med i klyngelisten. Dette er fordi det er en nedre grense for delt DNA på 30 cM og en øvre på 300 (derfor er heller ikke min foreldre eller søsken med i klyngelisten). Alec deler 27,9 med meg.

Oppsummering

Klynger er veien å gå for å finne flere som hører sammen i samme slekt, men kan ikke brukes alene. Å sortere folk i grupper av slektninger er noe av det mest nyttige man kan gjøre for å skjønne sin slekt, og arv av segmenter på kromosonene.

Det er viktig å dokumentere underveis om du finne ut av en forbindelse. Bruk notatfeltet aktivt.

Det skal bare en person til for å finne ut av hvor en gruppe mennesker hører hjemme. Det aller viktigste man gjør er å skille hvem som tilhører farssiden eller morsiden av familien, dna-messig. (Her forventer jeg at test-selskapene finner gode måter å sortere hver eneste «bokstav» på vårt DNA for hver kromoson i fremtiden. Men dette krever høy grad av samtykke mellom slekt. At vårt dna er usortert mht far/mor er trolig årsaken til de fleste misforståelser)

Visuell fasing – DNA Painter


Med DNA Painter kan man visuelt tegne opp dine DNA treff. Disse kan senere hjelpe deg å bestemme hvor andre hører hjemme dersom disse ikke har ett slektstre å vise til.

Dette trenger du:

  • DNA treff som du vet hvor denne hører hjemme i ditt slektstre.
  • Liste over kromosomer som dere har felles (delte segmenter)
  • Konto hos DNA Painter (en profil er gratis) $30 for 6 mnd og $55 for 12 mnd.

Har man funnet ut av ett treff kan dette hjelpe deg videre med andre treff. Alle andre som passer i mellom*) vil enten være i slekt via samme anepar, eller lengre opp i ane rekka.

*) De fleste snubler her – Gitt at de matcher på samme segment (og ikke det samme område som motsatt foreldre har gitt deg).

Det finnes måter å finne ut av dette på, kalles triangulering. Om ABC matcher på samme segment, må de match hverandre innburdes også. A->B, A->C og B->C om ikke siste er tilfelle. Betyr dette: Siden du (A) har ett kromosonpar så kan B Match din morsside og C din farsside. Derfor vil ikke B og C matche hverandre. Hos ftDNA bruker man Matrix, MyHeritage har merker trangulerte på Kromosonleseren. Gedmatch har også verktøy for triangulering.

Overlappende segmenter kan bety at man har arvet disse fra felles forfedre. Alle andre som havner under dette delte segmentet kan derfor være i slekt med deg. Forutsatt at det er på samme segmentparet. (Som nevent overor har man alltid 2 ett kromoson fra fra og ett fra mor). år du ser på leverandørenes kromosonleserer må du være klar over at den bruker begge dine sider mot andre. Du kan ha segment treff som er overoptemistiske, hvor du har treff mot begge sider.

Pratisk eksempel

Først av alt, jeg har ikke DNA etter mine besteforeldre, men begge mine foreldre. Jeg kan enkelt fase miitt DNA i min mors bidrag og fars bidrag. (Enkelt eksempel på fasing). Utfordingen mange har er at de ikke har en forelder som er testet. Hvordan skal man da fase DNA’et. Dette et eksempel

Most Common Recent Ancestor

Siden jeg vet at dette treffet går via min mors mors linje kan jeg derfor fase de delte segmentene mellom min mor f. Grøndahl og herr Svendsen. Digresejon dette er det næremste treffet hun har utenom meg og hennes barnebarn. Denne personen er heller ikke på Gedmatch, eller ftDNA. Om jeg ikke hadde overført mine rådata til MyHeritage ville jeg trolig aldri funnet at han hadde tatt en DNA test.


Man laster ned delt segementer via kromosonleseren (øverst til høyre)

Fra før har en en tom profil opprettet for min mor. For å «male» dette treffet inn velger jeg å importere fila jeg lastet ned i bildet ovenfor.

  • Åpner nedlastet fil i notisblokk (eller excel), kopierer innhold
  • Åpne profil i DNA painter
  • Klikker på «Paint new match»
  • Lim inn innhold fra nedlastet fil
  • Klikk «Save match now»

Redigerer kjent ane. Bruker Prefiks MMF for Mor Mor’s Foreldre. Setter slektside (Maternal), og en lite notat hvor informasjonen kom fra

Jeg kunne ha valgt en annen fremgangsmåte. Import data direkte fra fil dette krever betalt medlemskap (noe som jeg har)

En annen gang skal jeg vise hvordan dette vil se ut med flere delte segementer og hva man kan lese ut av dette

Norwegian Gedmatch DNA Matching


Hvem av dine treff på Gedmatch er også på facebook?

Noe som kan gjøre det lettere å komme i kontakt med disse personene, og samarbeide videre. Det finnes flere slike grupper, de tar for seg en bestemt region eller land.  feks: 

Gruppene er internasjonale så skriv helst på engelsk. 

Før du starter må du ha overført data til Gedmatch, eller Gedmatch Genesis

Hva trenger du før du begynner?

  1. Smør tålmodighets muskelen. Du MÅ følge bruksanvisningen til punkt og prikke.
  2. Skaff deg Gedmatch konto, slik at du får en Gedmatch ID
  3. Google konto – Du trenger ikke gmail adresse, men må være registret hos Google slik at du får tilgang til å laste ned regnearket senere
  4. Du må ha PC eller Mac (Man kan ikke bruke nettbrett eller mobil)
    Nettleser som støttes er: Chrome, Firefox, Safari, Opera.
    • OBS OBS ikke Microsoft sin nettleser virker ikke
  5. Meld deg inn i facebook gruppa:  Norwegian Gedmatch DNA Matching

Fremgangsmåte:

  • Alt på listen ovenfor må være på plass. Har du ikke dette i orden – start forfra.
  • Finn frem din Gedmatch ID, og ditt facebook navn.
  • Svar på 3 spørsmål i spørreundersøkelse  – https://bit.ly/2IdjRdU
    1. Gedmatch/Gedmatch Genesis ID
    2. Ditt facebook navn
    3. Din status i gruppen (1. venter på godkjenning, 2. medlem fra før m nytt kit, 3. vet ikke)
  • Vent minst 24 timer, slik at info kan legges inn i databasen. NB Ha tålmodighet !
  • Logg på Gedmatch
    1. velg ‘One-to-Many’ matches
    2. vent til listen er ferdig generert. Det skal stå noe ala dette nederst under tabellen.
    3. Tast CTRL+A (for å velge alt på nettsiden), så CTRL+C for å kopiere (alt)
2000 matches (6000 – 2237 rows)Query time = 0.28 – Total Search time = 1.79 secondsMatches Excluded – Not Public: 228 – F1: 0 – No Link: 9 – Short Shared: 0 – Duplicate: 0

Fortsettelse: (Gjenta med jevne mellomrom)

  • Last ned regneark – (trykk på knapp – Lag kopi) https://docs.google.com/spreadsheets/d/1tUzJ72JK5NkKRaRWMDAm10VU3FAq4G-l3or8_GvuHhU/copy
  • Etter at regnearket har åpnet seg (du ser ett bilde). Før du gjøre noe som helst, lim inn data fra Gedmatch med å taste CTRL+V.  NB NB Viktig at du ikke klikker i regnearket før du gjør dette.
  • Vent 5-10 min
  • Når data dukker opp i regnearket gå til fane “Matches”. (Statuslinje øverst til høyre vil vise seg)
  • Ta skjermbilde – helst utsnitt av ny treffliste
  • Del bilde i – Norwegian Gedmatch DNA Matching –  “Tag” medlemmene som dukker opp

Gjenta fremgangsmåte «Fortsettelse» med jevne mellomrom (Månedlig/kvartalsvis)

“Check your Data” 

  • En test du kan kjøre i regnearket, for å se om du kan starte.
  • Legg inn din Gedmacth ID, ditt navn bør dukke under, dersom ikke.
  • Ventet du 24t under punkt fjerde kulepunkt?
  • Du må også vente med å laste ned regnearket til du er lagt inn i databasen. Du kan ikke vente 24 t og bruke regnearket pånytt. Du må vente med å hente kopi, som har deg innlagt

Dette dokumentet på Google disk

Klyngetriks i FamilyTreeDNA


Dine DNA-treff kan hjelpe deg, om du vet hvordan å bruke de. Ved å ha ett bevisst forhold til hvem av dine treff du har lenket inn i ditt tre kan du la disse jobbe for deg. Denne artikkelen viser noen tips i denne sammenheng. 

Dette er utdyping av en åpenbaring jeg nevnte på  Facebook Gruppen – «Norway DNA – Norges prosjektet FTDNA» 

Bakgrunn: Jeg hadde slurvet med oppfølging av min mors DNA treff på FamilyTreeDNA (ftDNA), og tenkte jeg skulle gjøre noe med det. Tanken var at siden jeg lekt litt med DNA Painter (DP), skulle jeg legge alle de treffene jeg hadde «løst» inn i DP. På min mors profil i ftDNA var det bare 1 person utenom min sønn og meg, som var lenket. Han er en firmenning (3C-third cousin). Hun har også treff på MyHeritage, og der hadde hun 2 jeg hadde funnet ut av. (Tremenning – 2C og 2C1R) 

Plukket først ut firmenning treffet i ftDNA, og skulle legge bare den inn, men startet på nytt fordi jeg fikk spørsmål om hvilken side kromosomene tilhørte. ftDNA har jo røde damer og blå menn. Tenkte derfor «hva om jeg legger inn alle som er faset på ftDNA?»

Treffene er anonymisert. Siden få personopplysninger avsløres kunne dette stått usladdet

Bare 18 personer er faset hos min mor, og bare på hennes mor’s side (Paternal=0, Maternal=18). Tenkte ikke noe videre på dette først, men dette er en del av observasjonen som følger

Siden DNA painter spør om hvilken side data kommer fra, tenkte jeg det er kjempesmart å plukke alle disse, og sette de på hennes morsside. Fordi poenget for meg er å se hvem andre som matcher oss, utelater derfor oss min sønn og meg, når jeg skal se videre på segmenter.

Via kromosonleseren får man tak i segmentene til DNA Painter
Man kan velge maks 7 personer

I kromosonleseren til ftDNA kan man filtrere på «maternal side» (morssiden). Prøvde å laste ned alle 18(-2) i utvalget, men fant ikke noen enkel måte å gjøre dette på. «Download all segments» er absolutt alle, uansett hvilken avgrensning man gjør på siden. Måtte derfor ta 7 og 7 om gangen (og tilslutt 2). se bilde under

Lastet ned segmentene til disse 14 til PC’en. DNA Painter har nå en funksjon å laste inn mange segmenter fra flere i en jafs. (Masse import). Hadde 3 filer, Det ble derfor 3 grupper i DP. Senere slo jeg sammen disse 3 gruppene til en gruppe, som jeg kalte «ftDNA Maternal Matches Runa Holte»

«Import data» takler segmenter fra 1 fil med flere personer i en jafs
Justerte segment nivå, før jeg valgte fil, og trykket import
View Group: Herfra kan jeg slå sammen grupper

I ftDNA listen dukket ett navn opp, men det var ikke noe tre. Mente jeg hadde sett dette navnet før, og kikket på MyHeritage. Digresjon: dette var ett hendig uhell, min mor har en tremenning med samme fornavn, men annet etternavn. Men fant også denne personen hos MyHeritage. Etter å ha sjekket smart match’ene,  fant jeg veldig raskt ut hvem felles ane var; samme anepar som jeg først jobbet med. Treffet blir mao firmenning forskjøvet ett ledd.

Sakte begynte ting å falle på plass for meg.

En lenket person, gav meg følgende:

ftDNA plukker ikke vilkårlig ut og faser hvem som tilhører hvilken side. Alle som match’er gitte kriterier, blir faset. De er alle antagelig i slekt (IBS – Identified by state). Med bare 1 person lenket vil andre som faser, tilhøre samme familieklynge (cluster). Alle tilhører samme samme slektslinje min mors tippoldeforeldre ligger på. Min (mors) mors mors fars foreldre. Dette vil være informasjon som en match trenger for å finne ut av ting på sin side, eller du trenger om du gjør mer slektsforskning på egenhånd.

OBS! Det er en sjanse for feil/avvik når man sammenligner data. Senere funn kan plukke noen ut av din familieklynge siden. Disse tilfeldige treff kalles (IBC – Identified by chance). 

Om jeg bare legger til folk i treet som tilhører denne gruppen vil jeg kunne finne flere biter av felles denne gruppens felles dna pool. Ved å være bevisst på hvem man har koblet inn i treet har man en enkel måte å klynge slekt på. «Fattigmanns klynge verktøy», bruk 1 lenket person til å bygge denne personens familieklynge.

Lenker man til flere personer, vil dette kunne endre hvem som faser. De på samme side, vil bidra til å avdekke opp hvilke segmenter min mor har fått på den siden. DNA Painter visualiserer hvilke områder som blir avdekket. På den måten kan jeg vite hvilke mer om hvordan hennes dna er faset. Noe som igjen kan brukes til å rekonstruere biter av forefedres dna. Målet er å dele alt DNA inn ente far og mors side.

Verdt å merke seg:

Om du lenker ikke flere matcher, vil du etterhvert se at noen blir lilla. Dette er personer som kan være i slekt med både din mor og far. Disse bør du ikke bruke når du kartlegge videre. 

Bruker man alle i trefflisten i DNA Painter, men ikke de som er nære (kutt de med mer enn 1500 centimorgen), ser man hvor stor grad det teoretisk er mulig å fase/rekonstruere dna. Det vil alltid komme flere til, jo flere som tester seg jo bedre dekning kan man få.

Alle mine mors ftDNA treff. Bilde viser potensielet for å visuelt kartlegge hennes dna