– Forutsier hvordan du kan være i slekt med et DNA-treff, basert på delt DNA mengde og alder. Trolig en av de mest oversette nyhetene fra Rootstech 2003 er en ny måte å se på slektskap.
Alderforskjell og delt DNA mengde kan nå kombineres slik at når man vet alder på deg og/eller treff kan man med mye større nøyaktighet si hva slags slektskap som deles. Sannsynligheten for disse slektskapene kan også predikeres. Folk flest har også utfordringer med betegnelser som 2CR1. Den største utfordringen med disse at retningen på slektskapet er tvetydig. Ved å ta utgangpunkt i alder eliminerer man denne tvetydigheten. Kjønn er også nå en faktor slik at betegnelsene i relasjonen kommer frem.
Alle kan bruke cM explainer man trenger hverken å være medlem eller logge på
Men MyHeritage har bakt dette inn for alle som har DNA hos de. Først av alt i treff listen vil man nå se ett bedre estimat på slektskap. Faktisk de kaller ikke dette estimert slektskap lengre, men «Sannsynlig slektsskapsforhold»
Grunnen til at jeg ikke anbefaler å plukke frem cM eplainer herfra er at man kun får se oversikt med mulige slektskapsforhold går man inn på «Undersøk DNA-treff» og ser på hvilke DNA-treff du deler med treffet får man opp dette treet i tillegg.
Vis flere slektsskapsforold + diagram vises kun på side for delte dna treff (pil over)
forstå hva som ligger bak
Larry Jones, Texaner og genetisk genealog har over noen år utviklet en annen tilnærming til slektskap basert på delt DNA mengde og alder. Han startet med Ball & Pattern metoden, før han la til sannsynligeter for slektskap og kalte det cM Solver Tool. https://www.cmsolver.com/
Superenkelt forklart er «Ball & Pattern» en måte å håndtere størrelser av delt DNA. Man generaliserer hvor mye delt DNA som sendes til neste generasjon eller sett bakover i tid, hvor mye kommer fra generasjonen over dette utgjør en ball som skal virke som en rettesnor. Om man går sidelengs og nedover følger arv også samme prinsippet. Har man delt DNA mengde kan man si hilke baller man kan havne på, som igjen er ulike former for slektskap.
CM solver utnytter aldersforkjell fra deg til andre sammen med ball and pattern. Dette utelukker i stor grad en rekke slektskap. Man kan ikke være en persons søskenbarn til dennes bestemor om man er yngre enn den man har DNA-treff med. Men ett barnebarn til ett søskenbarn av en DNA-treff.
MyHeritage sitt vitenskapsteam har sett på slektskap og aldersforskjeller i sine databaser og forbedret Larry sine sannsynligheter for slektskap basert på alder. Dermed løser de noe av utfordringen folk flest har med forskjøvet slektskap (Once-, Twice removed). De har utviklet en ny algoritme for aldersforskjell
Hvilket svar er rett?
Ofte misfortår folk dette med sannsynlighet, at noe er mer sannsynlig betyr ikke at det er mer korrekt, det er større sjanse for at det er korrekt. Forstår DU forskjellen? Det korrekte svaret kan være mindre sannsynlig. At noe er sannsynlig betyr dermed at det kan være korrekt. Når noe er usannsynlig bruker vi det til å utelukke det alternativet. De viser ikke hvilke slektskapsforhold som er umulig. Vil du vite hvilke det kan være bruk Shared cM tool.
ALLE som er sannsynlige kan være svaret, absolutt alle… med mindre du har andre forklaringer som kan utelukke.
Hvorfor virker ikke dette for meg?
Du eller den du sjekker er i slekt med mange av dine slektninger på flere måter
Du har endogamy i slekta (som er en ennå mer sammenblandet slekt)
Myheritage har innført «Theory of Family Relativity™» (TOFR) og skal man jobbe systematisk med listen kunne det vært kjekt å få tilsendt bare disse. Denne muligheten finnes ikke så jeg har lagd en måte å automatisere dette med en teknikk som kalles webscraping. PS Teoriene er basert på smart macthes og delt dna, og er bare forslag. Siden disse kan være feil er det lurt å undersøke om denne «jukse-metoden» har noe hold. «Juks» siden de bruker Big-data for å forsøke å låse slektsgåten for deg automagisk, for vil vi slektsforskere egentlig få fasiten utlevert?
NB ADVARSEL OG ANSVARSFRAKRIVELSE!
Oppskriften er teknisk og jeg kommer ikke til å drive mye gratis support for at du skal få dette til om du ikke forstår min oppskrift. Pga personvern og generell datasikkerhet kan jeg heller ikke teste dine data for å finne feil, eller optimalisere uthentingen for deg. Jeg tar heller ikke noe ansvar for problemer du kan havne i ved feilbruk. Ikke hent ut listen hundre ganger om dagen, du kan bli utestengt fra MyHeritage i kortere eller lengre tid hvis du bombarderer websiden deres. med forespørsler.... Du er herved advart.
Forarbeid
Først må du ha en nettleser som støtter bruk av chrome utvidelser. Dette kan være Chrome, Microsoft Edge, Opera eller andre. (Finnes også en firefox add-on for dere som bruker firefox)
Gå til Webscraper.io og last installer utvidelsen (se bilde under)
Bilde 1 – Installer chrome utvidelse
Tilpassning av definisjonsfilen
Man kan lage sine egne JSON «definisjonsfiler» for uthenting. Jeg brukte litt tid på å lære dette og hvordan man kan redigere disse enklere. Det er lett å gjøre noe feil og jeg startet pånytt mange ganger før jeg fant en enklere måte, nemlig redigere i selve definisjonsfilen. Det er lett å rote til denne om man er unøyaktig. For å spare deg for å lære hele «opplegget» skal jeg forsøke å fortelle om det viktigste man bør kunne endre. NB Hele teksten nedenfor må kopieres og redigeres før du bruker den.
Tekst i hermetegn blir navnet på navnet på scraperen (uthenteren) som også blir navnet på csv fila som lages og kan importeres i Excel. Navnet kan endres når man importerer definisjonsfila, eller med «edit metadata» NB Navnet må skrives i små bokstaver
Start URL
Har man flere kit kan man velge å ha en uthenting for hvert kit til hver sin fil, eller hente alle etterhverandre til en fil. Skal du hente flere må hver URL være omsluttet av hermetegn og adskilles med komma. Har du bare ett kit fjern komma og «URL2».
"startUrl":["URL1","URL2"]
For å finne din TOFR URL må du gå til dine DNA treff og velge filter (Tredetaljer): Har Theory of Family Realtivity, Deretter må du opp øverst i nettleser og kopiere URL. Punkt 3 i bilde under. (Jeg har flere kit på min profil så jeg kan i tillegg til å velge person, kan jeg velge hvilket av disse jeg skal se på. MH kaller disse for sett på norsk)
NB! Din URL kan ha færre eller flere bestandsdeler. Forklaring på oppbygging er under. Hvert punkt tar opp ulike deler og dens betydning:
Tall etter /matches/ – Er ditt nummer
? – alt etter spørsmålstegnet er paramtre
& – standard skilletegn for parametre
# – spesialtegn (anker) som må være foran dna-kit-nummer
filter=theories_of_family_relativity – filter for å få frem teoriene
&p=1 – Paginering start side er 1. Opprinnelig vises 10 treff pr side. Om man skriver &p=[1-10] skal man i teorien hoppe frem stegvis 1 side av gangen tom side 10. (10×10 = 100 treff skal hentes ut)
&ps=25 – parameter for visninger pr side – betyr at det skal vises 25 treff av gangen.
#dnamatch-D-93E7DFD3-8F57-4190-xxxx….2-88D386A19998 – Har du flere kit pr person må hver kit spesifiseres spesifikt utover den «første» i sett listen.
Rediger "startUrl":["URL1","URL2"] til noe ala "startUrl":["https://www.myheritage.no/dna/matches/342579121?filter=theories_of_family_relativity&ps=25&p=[1-3]"] Du kan ha flere TOFR url'er adskilt av komma
Når jeg testet dette fikk jeg først ikke til å hente ut alle om jeg valgte paginering, ei heller om jeg valgte å øke antall pr side som visningsparameter. Jeg fikk noen ganger bare noen få av alle mine kit. Ved å øke tidsparameter fra 2.000 ms til 20.000 ms under kjøring fikk til slutt med alt. Det kan hende at paginering hadde virket om jeg økte tiden til 10.000 ms (10 sek). Jeg brukte bare &ps=150 fordi jeg hadde på det meste 130 TOFR. Lek derfor litt med hva som passer for deg.
Selectors
Alle elementer som opplegget består av er basert på ulke valgte elementer på html siden. For de teknisk interesserte er dette css basert. feks div.navn betyr velg innholdet mellom <div class=navn»>…</div>. Merknad: Dersom klassen har navn som har mellomrom i seg er det siste leddet som skal brukes fordi » div.navn tekst» betyr <div class=»navn»><tekst>…</tekst></div> og ikke <div class=»navn tekst»>.
Import SITEMAP (definisjonsfila)
Aktiver utvidelsen ved å trykke F12 (jeg har valgt å ha vise disse nederst på siden). Klikk på fane «Web scraper» som vis i bilde nedenfor. Står det ikke Web Scraper har du enten ikke installert tillegget for Chrome, eller så har du ikke aktivert denne.
Klikk på Create new Sitemap, Velg Import Sitemap
Scrape – Uthenting
Se bilde over for hvor du starter innhenting av data. Etter at menypunktet er trykt så kommer en særdeles viktig del. Du skal angi hvor lenge nettleser skal vente på data og hvor lenge nettsiden skal få lov til å bruke før neste side hentes. Jeg la til 0 bak slik at tiden økte fra 2 sekunder til 20. Bedre å vente noen ekstra sekunder enn å ikke få med seg data.
En nettleser åpnes seg og du kan følge med på at den åpner nettsidene og går videre. IKKE LUKK DENNE ved å X’e den ut. Den lukker seg selv når den er ferdig. For å se hva som ble hentet ut, trykker du på refresh knappen
For å lagre må man velge «export data as csv». Deretter kommer en lenke du må trykke på. CSV filen lastes ved å trykke på lenken «Download now»
Virket ikke? – Juster og prøv igjen
Ble det noen krøll? Test deg frem med å øke antall sekunder som scraper skal vente. Om du vil endre på noen av parameterene og prøve igjen kan dette gjøres ved å velge «edit metadata»
Selector Graph viser logikken på ulike steg den bruker for å hente frem data.
Selector Graph: Grafisk oversikt på opplegget
Excel
Norsk versjon dessverre ikke lese csv filer direkte fordi vi i Norge og USA bruker komma og semikolon ulikt. Den enkleste måte å hente inn CSV filer er å bruke en import funksjon i Excel for CSV filer som ligger under menypunkt Data. Under importen kan man velge å manipulere data / fjerne kolonner som du ikke trenger. Dette viser jeg ikke. Bruksanvisningen er for lang allerede
Den nye fjerde utgave av Shared cM Project er lansert, med nye verktøy
Siden 2015 har Blaine Bettinger hatt en nettdugnad hvor han har samlet inn data om delt DNA mengde av kjente relasjoner. Noe som har hjulpet mange å forstå hvordan man er i slekt med ett ukjent DNA treff. Leah Larkin har også bidratt med sannsynligheter, noe som også brukes i «What are the Odds» (omtalt hos meg som Hva er Oddsen)
Oppdatert versjon – Shared cM project
Siste versjon baserer seg på 60.000 kjente slektskap, noe som er en økning på 147% fra versjon 3. Dette gir økt nøyaktighet og flere detaljer. Verktøy er veldig likt som før men med følgende endringer:
Grand tante/onkel smed veid snitt, og forventet intervall
Histogramm er ett klikk unna
Du kan nå klikk på relasjoner, etthvert slektskap i blandt sannsynlighetene for å se histogram i ett nytt vindu. Histogrammer er grafer over over tallene bak. Disse kan gi deg bedre forståelse som:
Foreldre/barn bare noen få har registret delt DNA mengde under 3000cM
Minste verdi er derfor endret ned til 2376
Noen kan være det som kalles uteliggere, disse kan skyldes inntastingsfeil.
Histogrammet viser at majoriteten av data ligger mellom 3300 og 3900
Hvordan lese data: (Graf er for slektskap – Forelder). Tallverdier på x akse er gruppert, og fungerer som kurver. Tallverdier over søyler er antall registereringer i hver kurv
Om datagrunnlaget
Relasjonene
Blaine Bettinger har gjennomgått datagrunnlaget sitt og fjernet opplagte feil og uteliggere han har beskrevet dette i en rapport. Histogrammene er tatt derfra
Sannsynlighetene
Sannsynligheter er gruppert etter hvor sannsynlige de er og soteret fra høy til lav sannsynlighet.
Sannsynligheter for 1240 cM
Datagrunnlaget for disse sannsynlighetene kom fra en helt annen kilde Figur 5.2 Ancestrys fagartikkel om sammenligning (White paper on Matching). Figur viser hvor sannsynlig en spesifikk mendge delt DNA samsvarer med gitte slektskap, basert på Ancestry’s simuleringer. Noe Leah Larkin forklarer i sin blogg. Leah bearbeidet dataene videre
Disse omarbeidede data gir oss svaret på hvor sannsynlig ett 1240 cM treff er for ulike grupper. Den første gruppen Oldeforeldre, Gandtante/ grandonkel, Halv- tante/ onkel, søskenbarn, Halv niese/ nevø, Grand niese/ nevø, oldebarn har ca 74% sjanse, og netse gruppe har ca 26% sjanse (Besteforelder, Tante/ onkel, halvsøsken, niese/ nevø, Barnebarn)
Uenigheter
Siden det er to ulike datakilder og dermed ulike måter å se på disse, vil det ikke komme overaskende for noen at simulerte data og data fra nettdugnaden ikke alltid enes. Eksempelvis 400cM kan være en søskenbarn med lavt anslag av delt DNA basert på nettdugnaden, men simulerte verdier gir dette 0% sannsynlighet.
Når dette inntreffer vil verktøyet si ifra at dette er utenfor forventet sannsynlighet:
Nedenfor ser vi at for 150cM kan det være mnge slektskap som er mulig (positivt anslag 17-0,5%) Har merket disse med gult nedenfor
1C1R – (barn av ett søskenbarn) har tilnærmet 0% sannsynlighet, men fordi omfavnes innefor de grenseverdier som er mulig er de listet opp som en mulighet.
† – Gitt 99% konfidensintervall havner enkelte slekskap utenfor hva som er sannsynlig
Advarsler
De samme advarslene finnes som før, men nå er de plassert i en blå boks på høyresiden. (Disse vises ikke på mobilversjon)
Flere slektskap og endogami
Hverken shared cM project, simuleringer, nettdugnader kan håndtere flere slektskap mellom testedes aner med påfølgende anesammenfall eller edogami. Har du dette vil ikke dette verktøy være treffsikkert nok.
Gjennomsnittlige verdier vist i boksene er bare bestemt av slektskap som er kjent. For mer fjerne slektskap er det større sannsylighet at du ikke vil DNA med fjerns slektninger enn at du gjør det. Les mer om dette
Eksempel på hvordan det kan se ut når dine foreldre er tremenninger
På Gedmatch kan man gjøre noe snedig. Man kan sjekke om foreldrene dine er i slekt med hverandre!
Hvordan er dette mulig uten DNA fra foreldrene?
Siden alt ditt DNA kommer bare fra dine foreldre. Du fikk 2 kromosomer, ett fra hver av dine foreldre. Det som ikke kom fra den ene kom det fra den andre. Om disse er i slekt de ha like verdier på SNP’er. Mange like verdier etter hverandre over lengre «strekninger» om biten er stort nok vil indikere slektskap.
Små biter med grønt er trolig ikke entydig bevis på slektskap til dette bør segmenter være over 7cM og dermed blått.
Segmenter på over 7 cM er med 5% sikkerhet bevis på felles ane innen 6 generasjoner
Noen ganger får man DNA resultater som gjør at man stusser. Fikk spørsmål om hva jeg tenkte om dette tilfelle som gjengis i bildet nedenfor
Hvordan skal man forklare dette?
A, B og en person la oss kalle vedkommende for Barn hadde alle delt DNA mengde på ca 800-900 cM. Barnets relasjon til de andre som er testet er nevø/niese. Dersom man sjekker shared cM prosjektet så sier den at dette forholdet er svært lite sannsynlig.
NB Dagen etter jeg skrev dette endret Shared cM project seg. Grenseverdier kan ha endret seg. Og Jonny Perl skrev «Hverken shared cM project, simuleringer, nettdugnader kan håndtere flere slektskap mellom testedes aner med påfølgende anesammenfall eller edogami. Har du dette vil ikke dette verktøy være treffsikkert nok»
tabell med sannsylighet for 880cM relasjon
Hva skal vi trekke ut av dette? Siden alle har nesten lik mengde delt dna er alle søskenbarn? Hæ? Er noe galt i slekta, sier du?
Kjent relasjon er ikke ett valg
Ikke trekk konklusjoner for fort
Å hoppe til incest er svært betenkelig og muligens ganske spekulativt, bare fordi delt DNA ser likt ut på tvers betyr det ikke at familierelasjonene er de samme. Det er mange relasjoner som kan komme ut med samme verdier på delt DNA.
Jeg har tidligere skrevet om Halvsøsken når at delt dna kan komme fra flere kanter og at hvordan dette kan slå ut. Når man er i slekt fra flere kanter har man fått DNA fra flere aner. Dette hoper seg opp slik at hver relasjon legger til sin relasjons DNA. Feks dine foreldre er tremenninger?
Foreldre gir barn ca 3487 cM (eller egentlig alt mellom 3330 og 3720) du får altså 3487 fordi du er ett barn.
Tremenninger deler 233 cM (46 – 515). La oss si at tallet er 233. Du får dermed 233+233 fra dine foreldre, men husk at dine foreldre gir deg 50% av sitt dna, ergo du arver ca 233 pga denne relasjonen.
3487 + 233 = 3720 cM
Hvorfor morfar ikke er far til Barn (ergo halv tante/onkel + 1CR1)
Normal verdier: 1330 (891+439) Verdiene er ikke i nærheten av 1300 tallet så jeg synes det alternativet virker søkt.
Min: 641 (500+141)
Maks: 2297 (1446+851)
Selv om minimums verdier gir dette som en sannsynlighet, men dette er sannsynlighetsberegning. Jeg er rimelig sikker på om man tar i bruk fornuftige sikkerhetsmarginer (konfidensintervaller) vil dette alternativet falle bort
Hvordan regne seg bakover
Man kan aldri være sikker på hvem som har gitt deg hva uten å kjenne sine forfedres DNA. Man arver aldri 50% delt på n for hver generasjon bakover. Dersom man for enkelheten skyld sier at at mot A og B deler man 880 cM og denne relasjonen er av typen onkel/nevø eller sagt på annen måte søkenbarn forskjøvet 1 generasjon som forkortes til 1CR1. Viser Shared cM prosjekt at:
Forventet verdi på en slik relasjon er 439 cM, men kan være så lavt som 141 eller så høyt som 851 (sikkerhetsmargin på 99%). Ved å ta disse verdiene og trekke det ifra 880 står man igjen med 441 (739-29).
Dette betyr at restverdien av DNA fra en eller flere relasjoner kan være så lite som 29 cM, og så stort som 739 cM, men i snitt 441 cM.
Om foreldrene er i slekt med hverandre så må jeg ta høyde for at ca 50% forsvant på veien ned. Foreldre som deler 58 cM kan være i slekt med hvaernadre langt ut i. 1478 kan være halvsøsken, eller onkel/niese type forhold men også flere men lite trolig pga generasjonsgap.
«Normalen» 882 kan være søskenbarn, eller halv onkel/niese. Men feilen kan skyldes noe annet
For nære relasjoner påvirker rekominering sterkere enn slektskap lengre ut. Ofte går små biter uforandret fra foreldre fordi rekombinasjon inntreffer 1-3 ganger pr kromoson som igjen gjør at disse bitene ikke blir omfattet av rekombinering som opptod mellom foreldre og barn. Større biter har større sjanse for å bli brutt opp enn små(artikkel om rekombinering av xDNA)
En bedre forklaring?
All DNA som dukker opp som delt DNA skyldes ikke slektskap, det kan skyldes tilfeldigheter. Segmenter under 7 cM bør aldri telles opp, og der hvor man vet at det kan være slektskap mellom foreldre, eller at deres aner er fra samme område det som kalle endogamy eller «lite oppfinnesomme» aner som ikke gikk langt for å finne ektefelle. så bør man ikke telle med segmenter under 10, 15, 20 cM (hvilket all du skal bruke avhenger litt av hvor tett dine aner «bodde»)
DNA painter har en tjeneste for å vaske små segmenter om du har vansligheter å plukke vekkde små og summere opp de store segmentene https://dnapainter.com/tools/imf
Dette er svært viktig å huske på om du har teste deg hos FTDNA de tar med alt over 1cM om man har ett segment større enn 9cM (eller ett segment på 7,69cM og totalt 20cM sammenlagt). Myheritage tar med segmenter alle over 6cM om man har ett over 8cM.
En vask av segmenter kunne fort gitt ett annet resultat og tatt vekk mange segmenter. det skal så lite som 30 cM for å komme inn under en mulig relasjon for 1CR1 !
På Gedmatch kan man gjøre noe snedig. Man kan sjekke om foreldrene dine er i slekt med hverandre! DNA tips #2 Er dine foreldre i Slekt? (Viser slektskap mellom foreldre som er tremenninger)
Konklusjon
Aldri start diskusjoner med familien basert på løse antagelser. Det kan være helt naturlige forklaringer på hvorfor statistikken ikke virker. En vanlig forklaring er at «Folk i Norge» er ofte mer i slekt med hverandre enn det de først tror. Folk tar ofte med for store verdier på delt DNA som burde vært vasket vekk og da får man ofte ett mindre antall på totalt delt DNA.
Normalen er man bommer på hvor felles aner må ligge med en generasjon. Den skal en generasjon lengre bak fordi delt DNA mendge er for stort.
Dersom man har (uoppdagede) halvsøken relasjoner så vil delt DNA mendge være ca halvparten av foreventet verdi (man mangler 50% i utgangpunktet). Når dette inntreffer bommer folk flest med delt DNA mendge viser. Relasjonen er en generasjon nærmere enn man skulle først anta.
Det er flere måter å se på denne problemstillingen. Rent matematisk er dette enkelt å angi, siden vi har 2 foreldre, de har 2 foreldre osv. Dette kan regnes ut etter formelen 2n, hvor n er antall generasjoner bakover.
Ulike former for anetrær kan være:
Ditt formelle anetre – Basert på slektforskning tradisjonelt
Faktisk genetisk anetre – de du faktisk har arvet dna ifra, som er mulig å spore med DNA tester av bare deg
Jurdisk anetre, hvem du har lovmessig rett til arv etter. Adopterte hører i ett slikt tre.
Sosiolektiske tre – hvor du føler tilhørighet, hvor ikke biologiske personer kan intreffe.
Når vi gransker slekta bakover på våre aner, så lager de fleste sitt juridiske anetre, eller sin sosiolektiske anetre. Slike anetrær vil følge overnevnte mønster med 2n aner for hver generasjon. Det vil alltids finnes folk som gjentas. Hvor mange unike aner har vi? Alle familier har dets som kalles anesammenfall før eller senere i sitt anetre. Når folk som er i familie får avkom blir det gjerne «dobbelt opp» med noen aner. Anetreet kollapser, antall unike aner reduseres.
Briters aner – med anesammenfall
Det ble gjort en studie av Ian J Heath i 2018 om hvor mange britiske aner briter har. Tallene for aner vil være litt lavere enn enn hva man normalt har for unike aner, siden de også i sin beregning ikke regnet med «innvandrere». Men tallene er interresante alikevell. Veldig forenklet sa dette studiet at det maksimalet antall aner var etter 25 generasjoner med ca 1,5 millioner aner, etter det kolapser anetrærne voldsomt igjen. Det interesante er at det er fra generasjon 4 og bakover at anetreet «normalt» skrumper inn (for en gjennomsnitts brite). Tallene lengre bakover er ikke så ulikt hva man finner på hvem som er våre genetiske aner.
Når ett barn «lages» blandes foreldrenes DNA på en måte som kan forklares med å sammenligne DNA strengen med ett perlekjede. Hvert kromsonpar deles normalt inn i 0, 1 eller 2 like biter. Perlekjedene (kromosonparet) deles på samme vilkårlige sted for hvert kromonosonpar. Lengde på hver bit er parvis lik. Deretter bytter biter av samme lenge plass med hverandre, slik at man blander fars og mors dna vilkårlig. Hos damer skjer det i snitt 41 ganger på 23 kromosoner som de putter i sine egg, og hos menn er det 26 ganger på 22 kromosoner de putter i en sædceller. Det 23 kromosonet som er Y-kromosonet går «uforandret» videre. Jeg tror det er derfor damer har litt mer oppdeling av DNA og dermed litt større sjanser for å ha flere genetiske aner.
Illustrasjon på hva som skjer når kromosoner blandes under meoise. Bare den ene av de to til høyre går til ett egg, eller sædcelle
Siden alle ikke arver eksakt like mye av alle sine aner vil det være noen aner man ikke arver noe ifra. Som igjen har sammenheng med hvor mye dna blir oppdelt hos foreldre. Rapporten jeg kikket på deler inn i kvinner og menn, men jeg har slått sammen tallene. Dette kan summeres opp slik:
Generasjon
Min
Max
Snitt
5 – 2xtipoldeforeldre
0
1
0
6 – 3xtipoldeforeldre
0
3
0
7 – 4xtipoldeforeldre
0
13
4
8 – 5xtipoldeforeldre
18
55
36
9 – 6xtipoldeforeldre
135
207
171
10 – 7xtipoldeforeldre
505
606
556
Tabell – Hvor mange aner du ikke har arvet dna ifra og du vil aldri finne etterkommer etter
Dersom flere i slekta har testet seg vil disse arve biter du ikke arvet fra sine forfedre som du ikke har arvet. Det kan derfor være en grunn til å samarbeide om dere skal på sikt kartlegge, eller forsøke å gjenskape hvilket dna diner aner har. Noe som igjen er viktig får å drive målrettet jakt på etterkommere av disse.
Aner du faktisk har arvet dna ifra
NB Antall genetiske aner etter 10 generasjon øker ca med 68 for hver generasjon og ikke eksponentielt slik som den forventende gjør.
Dette forklarer også litt hvorfor du ikke vil finne etterkommere av disse anene på din treffliste. Dersom dine aner bare har 1 barn som overlevde lenge nok til at det selv fikk barn, vil 50% av alt arvematerialet bli borte fra alle etterkommere av den grenen. Mer om dette med kommer i en senere artikkel. (Hvor mange x-menninger har du egentlig)
Mitt foreløpige genetiske tre
Jeg har forløpig ikke funnet mange etterkommer hos alle mine tipoldeforeldre som også har DNA testet seg. Jobber med saken. Har derfor ikke kunne bekrefte at jeg har DNA etter mange av min forfedre. På DNA Painter har det kommet en ny funksjon som kan vise hvilke aner jeg har klart å DNA kartlegge.
Mitt dna anetre
Ser jeg har en jobb å gjøre for å finne mine farmors- , og min morfars- aners etterkommer. Bare de kan hjelpe meg til å sannsynliggjøre at mitt papirspor (tegning under) er rett. Man kan forvente å finne avvik. Ca 2% av alle som er født har «feil» foreldre (far). Før eller senere finner jeg nok ett avvik.
Mitt foreløpige anetre – Slektsforsket
Mitt ane tre – «papirsporet»
Stort sett har jeg kartlagt alle mine aner i 6 ledd bakover. 6 personer mangler i denne generasjonen. Å treffe ett slikt hinder kalles ofte en slektsmur (eng: Brick wall). Mine skyldes dårlig informasjon om foreldre som har for vanlige navn til å enkelt finne i kilder jeg har kikket i og litt uklareheter i hvor de er fra. Jeg har også kartlagt enkelte av mine aner lengre tilbake enn 9 generasjoner som er maks som vises i DNA Painter anetreet mitt. Min mor har 3 aner som er i slekt med sine ektefeller. Så jeg har flere anesammenfall. Kanskje finner jeg noen på min farsside også, hvem vet.
Jeg har DNA til begge mine foreldre, ved å bruke teknikken i https://holte.nu/2019/06/29/liste-magi/ har jeg funnet hvem av mine treff som tilhører fars eller morssiden. 64% av alle mine treff tilhører farsiden, mens knappe 12% til hører morssiden. Resten anser jeg som falsketreff. En ville tro at siden min farsslekt dominerer i trefflistene at jeg har funnet ut av flere på hans side, men nei. Finner foreløpig ut mest ut av slekt på morssiden, pga dna slektskap.
Ofte når man jobber med DNA så jobber man med ulike former for lister. Enten fordi man samarbeider med slektninger og utveksler lister, eller fordi man administrerer DNA for flere og av den årsak har flere lister. Man kan bruke listene til å finne ut mer enn bare ved å se på sin egen lille liste isolert.
Nedenfor viser jeg deg Hvordan bruke excel til å jobbe for deg med å sortere ut forskjeller, eller likheter mellom 2 lister. (Jeg bruker Office 365 PC versjon). Fremgangsmåten er forenklet og veldig generell fordi ulike selskaper har ulik former på sine lister. (MyHeritage lister må bearbeides litt før de kan brukes* Listen jeg bruker her, er ekstrem enkel. (Denne bruksanvisning i pdf, med bilder + demofiler)
* MyHeritgage matchlister inneholder «ID for deg» – «ID for treffperson», Din ID må fjernes om du skal sammenligne lister fra ulike personer. Første linje ID hos MH kan se slike ut: D-52B0754F-8EFF-36AA-9B05-B56ACC6F359E-D-1E0A3A3A-85BC-45F6-A26F-D0A019615CDF, har markert ut hva som må bort.
Forutsetninger:
Excel
2 filer av samme oppbygging
Excel filer eller filer med tabellarisk struktur (komma, semikomma, tab separert, eller fast feltlengde). Filene må ha kolonner og rader
Gå til data fanen. Velg rett å åpne rett filtype (dette eksempelet har csv filer)
Velger «DNA_MOR.CSV», trykker «importer»
Trykker «Last inn»
Endrer navnet på arket til «Mor»
Gjentar punkt 2-5 for «DNA_BARN.CSV»
Like i begge lister (morsslekt)
Hent data, Kombiner spørringer, Slå sammen
Velg
Data kilder DNA_BARN, DNA_MOR
Kolonne som skal være lik i begge (Klikk på tittelfelt for å aktivere)
Sammenføy type:
indre == like i begge
Trykk ok. (Kan du ikke trykke ok, har du trolig glemt pkt 2. kolonne som skal være lik)
Lukk og last inn (Du får nå nytt ark med det som er likt i begge lister)
Gi arket nytt fornuftig navn (I dette eksempelet er ett naturlig valg å kalle det morsslekt)
Endre navn på spørring ifra Merge1 til Morsslekt (høyreklikk på navn i spørringer i høyre marg, velg endre navn)
Farsslekt
Dersom man ikke har en far hvor er dennes slektninger?
Svar: De vil hovedsaklig være de som moren ikke har, men barnet har
Vi tenger å vite hvem er i listen til barnet, men ikke er felles med mora.
Gjør som over, men velg
kilde: DNA_BARN (først), Morslekt
sammenføy type, «Anti – bare rader i første»
lukk og last inn
Navngi arket og spørringen «Farslekt»
AUTOMAGI
Du har nå koblet ditt regneark til 2 eksterne datakilder. Lagd 2 lister hvor du har delt inn slekta etter mor og far. Får du nye lister kall de det samme og overskriv de gamle listene. Sidene dataene ligger utenfor og er oppdatert, alt du trenger å gjøre i ditt regnerak er å gå til arkfane «Data» og trykk på ikon for Oppdater alt. (Mener bestemt at tastekombinasjonen Alt+F9 er hurtigtasten, for oppdatert alt)
Alle dine lister vil ha oppdatert seg i regnearket, helt automagisk.
En mulig utvidelse er å lage en masterliste for hver av dine dna personer. Om du døper om den nye lista til «person»_ny kan du ha en lignende spørring som ser om det er noen nye i listen og legge disse til i master listen. Hvordan du gjør dette er likt det du har gjort her, men du må velge Full ytre, og senere finne funksjonen fjern duplikater (menypunkt under Data)
What are the Odds? eller WATO som noen forkorter dette til, er ett verktøy på «DNA Painter» sittt nettsted som er verdt å undersøke. Spesielt om du ikke vet hvordan man skal plassere noen inn slekta og du vil leke med mulighetene.
Eksempelet som brukes er 80% oppdiktet. Det eneste som er reellt at Bjarne Betjent er født ca 1945, oppgitte cM verdier (andel delt DNA) og at han har en ukjent far. Dette er gjort for å skjule identiteten til nålevende, og det er uenighet om hvordan "Bjarne" passer inn i slekta.
Bjarne Betjent har fått nokså 2 nære treff på 564,2 og 444 cM med noen som han antar er på hans fars side, Bodil og Johan. Andre disse også DNA treff med er Inger, Lisa, Julie, Tove samt Vivian. Alle treffene var på Gedmatch. Men ingen av disse 2 treffene er synlig i slekt med hverandre.
Hvordan kommer man videre? Jo man må finne ut hvordan folkene er innbyrdes i slekt med hverandre å tegne slektstrær. Hvordan kan man det, jeg vet bare at de er i slekt med meg?
På Gedmatch kan man se sine treff, og man kan se sine treffers treff. (egentlig alle sine treff). Nøkkelen er å bruke GedmatchID, Gedmacth er en åpen dna database som lar (alle sine registrete brukere) se den informasjonen du har lagt inn i databasen, unntatt hvilken DNA kode du har*)
*) Matcher du noen på kromosonene fra plass 50420 til 51620 og du vet hva du har av dnakode i dette område, vet du hva den andre også har mellom disse punktene, og bare der. Du vet ett lite fragment av ett lite fragment av hva denne personen har. En autosomal test avslører 0,02% av ditt DNA om du deler hele "koden" du fikk kartlagt, (ca 700.000 av 3 milliarder bokstaver) så om du eksponerer 1200 av dine 3 milliarder bokstaver så ville jeg ikke bekymret meg over dette.
En nøkkel til å DNAforske slekt på er å bruke «shared cM project» på DNA Painter. Taster man delt DNA i cM verdi får man opp hvilke relasjoner som er mulige, med sannsynligheter. (Med MyHeritage får du dette direkte i 1-1 trefflisten). Ved å se på trefflisten til de ulike matchene på Gedmatch fant man følgende relasjoner:
Ved å kontakte noen i slekta til Bodil og Johan fikk man vite at ovenstående stemte, og at familiene hang sammen på følgende måte:
* angir hviken søsken som er forelder for neste generasjon
Utfylling av WATO
For å kunne bruke «What are the odds» må man starte med en kjent ane. I eksemplet ovenfor er dette ikke tilfelle. Dette er 2 slekter med en felles forbindelse. Dette betyr at man kan tegne 2 (4) forskjellige tavler. Hver boks i WATO kan være ett par, eller en person. Tegner derfor opp 2 tavler; Etterkommere av Truls, deretter Ingrid. (Å tegne opp nedenstående er ganske enkelt, forklarer ikke hvordan jeg kom dit. Utfordringen med å bruke verktøyet kommer i neste steg). Bare de du har en cM verdi på skal oppgis med dette. Det er disse’s delt DNA som brukes videre i teoriene.
Teorier – hvordan passer Bjarne Betjent inn?
WATO virker ikke med mindre man har flere teorier. Man kan ikke bare putte inn det man tror er rett og få ett svar. Hele poenget med dette verktøyet er å analysere hvilke teorier kan være rett. Når man har store andel delt DNA typisk foreldre/barn, søskenbarn, halvsøsken trenger man egentlig ikke dette verktøyet. Det holder med å bruke «shared cM prosject» i slike tilfeller. Prøver nevø/niese for å vise hva man velger (ikke fordi det er en god teori).
Hypotese kommer ut med score 0 (bilde under), som betyr usannsynlig. Døper om barn av Edna til hel/halv (fordi jeg skal vise hvordan legge til halvsøsken), samt se hvordan det slår ut.
Skal være halvsøsken til alle de andre søskene. Velger derfor alle
Tester alle avkom i hver generasjon av «halvsøskenet». Hypotese 3 får høyest tall, som betyr det er mest sannsynlig.
Rapporten under grafen som tegner opp er viktig å sjekke, den oppsummerer alle funnen på alle teoriene. Foreløpig sier den dette:
Hypotese 3 er 1178x mer sannsynlig. OBS! Dette betyr ikke at den som er mest sannsynlig, er den faktiske forbindelsen. Kan noe være mulig så kan det være mulig. LIvet er fult av tilfeldigheter! Vi har fortsatt mange andre alternativer som ikke er utforsket. Legger til alle mulige varianter jeg kan komme på for denne delen av slekta. Så få vi se hva som dukker opp:
De med «no» emoji, passer ikke pga alder
Lagde de alternativer jeg kom på, men flere av disse passer ikke inn om alder på far i forhold til fødsel av Bjarne Betjent. Satte emoji på de alternativer som ikke går opp, og fjerner før neste bilde.
WATO diagram familiegren 1: 4 ulike alternativer er like sannsynlige! Må derfor se på den andre famliegrenen
Familiegren 2
Viser bare oppsumeringen og ikke hvordan jeg kom dit i detalj. Tar hensyn til at Bjarne sin far kan ikke være født senere enn ca 1930, siden Bjarne er født ca 1945.
Om man tar ett steg tilbake og ser på opplysningene pånytt. Hva er det som utmerker seg med dette tilfelle? I jakten på en ukjent forelder, så har man 2 familiegrupper som ikke er i slekt med hverandre, men er forbundet via en tredje person. Det logiske er at det er personen som er nøkkelen. Reiulf, eller en av hans sønner må være faren til Bjarne Betjent. Alternativt en helbror av han og eller sønn av denne, eller helsøsters sønn. Men han har neppe en helsøsken fordi han er ett resultat av ett flyktig forhold, så det må være han. Slektskap til begge «klyngene» er ikke mulig på andre måter. Folk som leter etter ukjent far er som regel ikke så heldig å ha denne familietvisten. Slekt som er mulig pga 2 halv familier, som ikke er i slekt med hverandre men bare «deg» via din ukjent ane.
Kombinasjonene av begge WATO diagrammene understøtter denne teorien. Dette er mest plausible forklaringen om man ser på alle fakta samlet. Mener du noe annet ta gjerne kontakt!
Familieklynger hjelper deg til å forstå hvor andre hører hjemme i din slekt. Genetic Affairs har gitt MyHeritage tilgang til deres verktøy for å lage familieklynger. Her er noen tips for at du skal kunne mestre dette verktøyet du og.
Liten advarsel, selv om man deler dna med noen er dette ikke et endelig bevis på slektskap, men en meget sterk indikasjon. Slektsforskning må til. Mengden delt dna spiller inn, små mendger kan tilfeldigvis kommet fra ulike grener og dermed mistolkes, slik at man finner likt dna ved tilfeldigheter og ikke fordi man har felles opphav – IBC – Identified by Chance. Siden grenseverdiene er satt nokså høyt er det normalt å se relle slektninger i klyngerapporten.
Intro
Har du DNA hos MyHeritage og premium abonnement eller bedre kan du be om å få tilsendt en «Auto cluster» rapport. (Cluster = Klynge). Dette er en sammenligning av dine matcher som deler mellom 30 og 350 cM *) med hverandre. På «Genetic Affairs» kan kunder hos 23andMe, Ancestry og FamilyTreeDNA abonnere på sine matcher, og selv bestemme hvor ofte man skal få denne rapporten, samt utifra hvilke grenseverdier. Hos MyHeritage kan du bestille rapporten manuelt 1 gang pr døgn.
*) Usikker på om disse verdiene justeres automatisk basert på dine data, men antar dette.
Alle matcher sammenlignes mot hverandre. Forenklet betyr dette om Person A,B,C og D matcher deg så sjekkes A mot ABCD, så B mot alle osv. Deler 2 personer segmenter merkes krysningspunktet mellom de med en farge. Flere med samme farge betyr de tilhører en klynge av folk som innbyrdes deler DNA. Alle innad i en slik gruppe trenger ikke å ha arvet samme hele segment, men innbyrdes så deler de DNA på ett eller flere segment.
Samme farge = Samme familieklynge / familiegruppe
Hvordan tolke rapporten grafisk
(1) Hvem er Derek i slekt med?
Går man først horisontalt bortover og kikker opp ser man at han er i slekt med seg selv. Krysningspunktet er merket med (rød)farget boks.
Neste person er Stephanie. Hun ser ikke ut til å være en match. Her kan vi bli lurt. De kan dele mindre enn 30 cM seg i mellom. Isolert sett kan man derfor ikke si de er i slekt med hverandre utifra denne rapporten. (Det er sterke indisier for at de er i slekt, fordi de begge er si slekt med andre som er i samme røde grupppe A).
Fortsetter vi bortover er; Samantha, Gerald, Jan og Desiree også i samme familiegruppe.
Kikker vi lengst bort finner vi en grå boks. Derek ser ut til å være i slekt med Maritha, men slektskapet er grått. Forklarer dette bedre i detalj rett nedenfor.
(2) Grå utenforliggere (Spøkelsene)
Alle i en gruppe 1, er grå. Dette betyr at de slekt med flere grupper, De får derfor ikke en entydig farge utenfor sin egen nærmeste gruppe. De er «spøkelser» som viser at det er en forbindelse mellom de ulike klyngene/familiene. (spøkelser er «mitt» ord, i mangel av noe bedre å kalle det)
Ser vi på Bernt Ole er han i slekt med 3 stk grå (Jan, Frida, Paulette). Disse tilhører egentlig rød gruppe A, men han er også i familie med folk i grønn gruppe D (Seg selv, Kerry, Maritha).
Alle 7 i gruppe 1 ser ut til å være i klynge D, men også i slekt med noen i klynge A. Om du tenker etter er kanskje noen av dine søskenbarn i slekt med deg via din morsslekt, andre søsken barn er i slekt med deg via din farsside. Dette betyr ikke at disse grå er i slekt med deg både via far og mor, men att dine «cousins» kan være på forskjellige grener. men det kan være på samme side av en familie også fordi søskenbarn arver ulike biter av sine felles besteforeldre/oldeforeldre. Noen kan også være i slekt med deg lengre bak i anetreet og derfor være litt i slekt med begge grener.
(3) Grå spøkelser er hint
Bernt Ole og Kerry i slekt med Jan som igjen er slekt med alle i rød gruppe. (Se på jan horrisontalt). Vi så på Bernt Ole i forrige runde, Kerry er lik Bernt bortsett fra at Bernt macther Dale og det gjør ikke Kerry. Derimot matcher Kerry, Maritha og det gjør ikke Bernt Ole.
Videre undersøkelser på segmenter må gjøres. De grå forbinder 2 grupper hovedsaklig fordi de man må se på at de er slekt med en som er i gruppen. De hinter sterkt om slektskap mellom disse klyngene. Jo flere grå utenforliggere mellom 2 jo sterkere indisie. Totalt er der 7 grå i gruppe 1. Men det kan bli for mange også slik at man ikke ser åpenbare sammenhenger. Noe som er vanlig med steder hvor alle er i slekt med alle, eller folkegrupper gifter seg bare innen sin religion/kaste.
(4) Alle matcher hverandre
Alle i klynge C er innbyrdes i slekt med hverandre. Jeg ser dette fordi alle matcher hverandre – og vises som en perfekt forkant. Av dette kan man også anta at det er trolig er nært slektskap de i mellom. (Alle triangulerer på minst ett delt segment – se lengst ned på siden at dette stemmer)
Fra «Theorem om slektskap», vet jeg at alle disse har samme stamfar/mor. Suzette er mor til Kyle, Debbie og Alison. Dag Albert er min mors tremenning. (Suzette har jeg forøvrig korrespondert med endel uten å vite at det er tatt DNA test av hennes barn. Jeg har slektsforsket endel på hennes kobling til meg. Jeg avviste nemlig først hennes forfar som en del av min slekt basert på feilaktig oppført fødested hos henne og «alle» andre på MH (Stangeby, Hedmark), men personen viste seg å være en «Stangeby» fra Hof i Vestfold.
At alle ikke får en farget kloss betyr ikke at de ikke har samme ane men de har arvet ulike segemeter av DNA. De vil da ikke kunne sammenlignes. 99% av alle tremenninger deler dna, går man en generasjon bakover vil 90% av firmenninger kunne bevise slektskap gjennom dna. femmenninger deler i 50% ikke dna med hverandre. Dette er fordi man arver ikke de samme bitene av sine forfedre.
(5) Alle er i slekt med seg selv
Alle sjekkes mot alle også seg selv, det er derfor at bilde sentrerer rundt en akse.
(6) Symmentri
Som nevnt i (5) sjekkes alle mot alle, man får derfor en akse. Denne gir en symmentri. Spiller derfor ingen rolle om man ser på en personene i venstre marg, eller starter med personene i liste øverst.
4 stk i Gruppe 1 ser ut til å være tett i slekt med hverandre. Går man til høyre vil man se igjen dette innefor gruppe D (a)
3×4 personer går igjen i bolker (a,b,c) som du ser nederst til høyre i bildet – (Klynge D). Antar at alle inne for hver av disse minigruppene er tett i slekt med hverandre.
Person d kobler minigruppe a med minigruppe b. Her må jeg undersøke videre hvordan de er innbyrdes i slekt med hverandre. Men det er klare indikasjoner på sammenhenger. Antar at Dale er lengre ned i treet enn Bernt eller omvendt (her må jeg sjekket nærmere hvilken retning dette viser)
(7) Alle må ikke dele samme segment for å utgjøre en klynge
Klynge C danner en pen firkant og alle matcher hverandre. Her tenker jeg at alle sammen deler samme segment. (Ved sjekk på kromosonleser ser jeg at alle triagulerer på det ene av 3 segmenter)
Klynge A er større og løsere sammensatt. Her er ikke alle tilsynelatende i slekt med alle andre, men alle er i slekt med noen som er i slekt med dem. Her vil det være folk på ulike grener hvor noen har arvet segmenter som andre grener har mistet disse.. Fragmenter av DNA som er felles binder disse sammen
Klyngerapporten
Noen mener at den viktigste delen av rapporten er oppsummeringen nederst. Første del er veldig visuell og kan gi deg en forsåelse av sammenhenger. Det hångripelige er oppsummert i listen nederst. Hver klynge finner du igjen i listen. Man ser navnet på Person som matcher (som også finnes på den visuelle). cM er totalt delt dna oppgitt i centiMorgan, den lengste blokken oppgis under «longest cM», så får du vite antall delte dna-biter (segmenter), hvilken klynge, for til slutt å få oppgitt hvor mange personer som finnes i slektstreet
Klynge C
1) Navn på treff
Ved å klikke på navnet til treffet får du vedkommende opp i 1-1 DNA sammenligning. Herfra kan du gjøre mye (dette skriver jeg mye om nå)
2) Notat
Teksten under navnet i feltet «Notes» finnes bare om man på forhånd har skrevet noe i notatfeltet på DNA treffet. Det flere veier til dette notatfeltet, det mest synlige er under «Undersøk DNA», som jeg har markert med 2 i bildet rett over. Er notat feltet utfyllt er boksen farget sterkt lilla. Hvordan du fyller ut dette feltet er opp til deg selv.. Foreløpig gjør jeg det på en bestemt måte (se nedenfor):
Første linje: bokstavkode for stien til kjent ane. (M-Mor, F-Far). En bostav for hvert ledd. Så navnet på denne personen,
Andre linje: Navn på foreldre som gav gav dna’et til denne personen, samt hvilken relasjon jeg har til tester 4C = femmenning.
3) Slektstre
Finnes testpersonen i ett slektstre så angis dette i siste kolonne i «treff-listen». I eksempleet over vet jeg at jeg har en mor, og barn. Hadde jeg ikke vist dette, eller om jeg lurete på hvilke slektskap det kan være mellom noen i treet får man først ett lite hint ved å se på antall medlemmer i treet. På første bilde ser jeg at det står 812 på 3 stk (De befinner seg i samme treet) Ved å klikke på tallet kommer man inn i slektsstreet og kan se om dette stemmer eller ikke. ett annet tips er å sjekke ut 1-1 på den med mest delt DNA/eller lengste segment. Nedenfor ser jeg at Suzette er mor til 3 barn som alle triangulrer med meg. Bare Allison og Kyle er i klynge 3 (C)
4) Delte segment
Delte segemnt kan visualiseres via kromosonleseren- Man velger en eller flere personer i klyngen og ser om disse triangulerer på en eller flere segmenter. Jo flere man ser på jo mindre blir biten som er felles for alle. Eksempel nedenfor viser at alle matcher hverandre på ett segment, derfor har alle match mot hverandre i den gule klyngen C.
Listen sier at jeg deler 3 segmenter med noen, og 11 med Dag Albert. (tar ikke med alle hans segmeter). Som vist ovenfor har Suzette 3 barn. Alec er ikke med i klyngelisten. Dette er fordi det er en nedre grense for delt DNA på 30 cM og en øvre på 300 (derfor er heller ikke min foreldre eller søsken med i klyngelisten). Alec deler 27,9 med meg.
Oppsummering
Klynger er veien å gå for å finne flere som hører sammen i samme slekt, men kan ikke brukes alene. Å sortere folk i grupper av slektninger er noe av det mest nyttige man kan gjøre for å skjønne sin slekt, og arv av segmenter på kromosonene.
Det er viktig å dokumentere underveis om du finne ut av en forbindelse. Bruk notatfeltet aktivt.
Det skal bare en person til for å finne ut av hvor en gruppe mennesker hører hjemme. Det aller viktigste man gjør er å skille hvem som tilhører farssiden eller morsiden av familien, dna-messig. (Her forventer jeg at test-selskapene finner gode måter å sortere hver eneste «bokstav» på vårt DNA for hver kromoson i fremtiden. Men dette krever høy grad av samtykke mellom slekt. At vårt dna er usortert mht far/mor er trolig årsaken til de fleste misforståelser)
Med DNA Painter kan man visuelt tegne opp dine DNA treff. Disse kan senere hjelpe deg å bestemme hvor andre hører hjemme dersom disse ikke har ett slektstre å vise til.
Dette trenger du:
DNA treff som du vet hvor denne hører hjemme i ditt slektstre.
Liste over kromosomer som dere har felles (delte segmenter)
Konto hos DNA Painter (en profil er gratis) $30 for 6 mnd og $55 for 12 mnd.
Har man funnet ut av ett treff kan dette hjelpe deg videre med andre treff. Alle andre som passer i mellom*) vil enten være i slekt via samme anepar, eller lengre opp i ane rekka.
*) De fleste snubler her – Gitt at de matcher på samme segment (og ikke det samme område som motsatt foreldre har gitt deg).
Det finnes måter å finne ut av dette på, kalles triangulering. Om ABC matcher på samme segment, må de match hverandre innburdes også. A->B, A->C og B->C om ikke siste er tilfelle. Betyr dette: Siden du (A) har ett kromosonpar så kan B Match din morsside og C din farsside. Derfor vil ikke B og C matche hverandre. Hos ftDNA bruker man Matrix, MyHeritage har merker trangulerte på Kromosonleseren. Gedmatch har også verktøy for triangulering.
Overlappende segmenter kan bety at man har arvet disse fra felles forfedre. Alle andre som havner under dette delte segmentet kan derfor være i slekt med deg. Forutsatt at det er på samme segmentparet. (Som nevent overor har man alltid 2 ett kromoson fra fra og ett fra mor). år du ser på leverandørenes kromosonleserer må du være klar over at den bruker begge dine sider mot andre. Du kan ha segment treff som er overoptemistiske, hvor du har treff mot begge sider.
Pratisk eksempel
Først av alt, jeg har ikke DNA etter mine besteforeldre, men begge mine foreldre. Jeg kan enkelt fase miitt DNA i min mors bidrag og fars bidrag. (Enkelt eksempel på fasing). Utfordingen mange har er at de ikke har en forelder som er testet. Hvordan skal man da fase DNA’et. Dette et eksempel
Most Common Recent Ancestor
Siden jeg vet at dette treffet går via min mors mors linje kan jeg derfor fase de delte segmentene mellom min mor f. Grøndahl og herr Svendsen. Digresejon dette er det næremste treffet hun har utenom meg og hennes barnebarn. Denne personen er heller ikke på Gedmatch, eller ftDNA. Om jeg ikke hadde overført mine rådata til MyHeritage ville jeg trolig aldri funnet at han hadde tatt en DNA test.
Man laster ned delt segementer via kromosonleseren (øverst til høyre)
Fra før har en en tom profil opprettet for min mor. For å «male» dette treffet inn velger jeg å importere fila jeg lastet ned i bildet ovenfor.
Åpner nedlastet fil i notisblokk (eller excel), kopierer innhold
Åpne profil i DNA painter
Klikker på «Paint new match»
Lim inn innhold fra nedlastet fil
Klikk «Save match now»
Redigerer kjent ane. Bruker Prefiks MMF for Mor Mor’s Foreldre. Setter slektside (Maternal), og en lite notat hvor informasjonen kom fra
Jeg kunne ha valgt en annen fremgangsmåte. Import data direkte fra fil dette krever betalt medlemskap (noe som jeg har)
En annen gang skal jeg vise hvordan dette vil se ut med flere delte segementer og hva man kan lese ut av dette
Du må være logget inn for å legge inn en kommentar.