Rötterbloggen

Åsikter som uttrycks i Rötterbloggen är skribentens egna och motsvarar inte nödvändigtvis Rötters eller Sveriges Släktforskarförbunds. Har du synpunkter pä innehållet finns möjligheten att lämna en kommentar nedan. Vi påminner om att hålla en god ton.

DNA-funderingar

Jag var visserligen närvarande när Genealogiska Föreningen hade sina DNA-event 2011 på Historiska museet och 2013 i Nürnberg-huset i Stockholm. Vid det senare tillfället gjorde Peter Sjölund, Magnus Bäckmark och Karin Bojs presentationer. Det tog dock tid innan jag tog mitt första DNA-test. Det var ett Y37-test på FTDNA och resultatet kom i början av 2018.

I efterhand kan jag konstatera att det hela inte var särskilt väl genomtänkt från min sida och det av flera skäl. Främst för att jag lyckades förtränga hur dyrt det skulle bli med det antalet linjer jag hade i stamtavlan jag ville kontrollera. Sedan uppgraderade jag mitt eget test till Y67 och sedan till Y111 och därefter till Big Y. Jag deltar också i YFull. Med tanke på senare förvärvade kunskaper borde jag ha gått på Big Y direkt och sparat lite pengar. Då hade det dock blivit Big Y-500 och inte Big Y-700 så någon vinst fanns det i senfärdigheten.

Lite av besvikelsen med Y-testen är att jag inte tillhör en gren (»branch«), alltså att det finns andra med samma variant som jag och att det dessutom finns de som testats negativt för vår variant. Inte heller tillhör jag en »named variant« tillsammans med de med samma variant som jag men utan någon som testats negativt på vår variant. Istället sitter jag ensam ute på en så kallad »private variant«: ingen annan har testats positiv för samma variant som jag. Min bästa match och jag har dessutom närmaste gemensamma anfader 8 sekel tillbka.

Jag tog dock ganska snart FTDNA:s Family Finder, det autosomala testet, och året därpå test för mt-DNA. Det senare verkar trots allt ganska lovande. Min närmsta matchnings och mina anmödrar konvergerar i vart fall någorlunda geografiskt ungefär 1700 och det är ju under kyrkobokstid. Jag ser fram emot uppgradering av mt-trädet som annonserats till i vår och som Mats Ahlgren nämnde i sin Rötterblogg förra veckan, även om det är så att bästa matchen och jag skiljs åt med två mutationer.

Det autosomala testet har dock hittills varit det mest givande. För mig har testet varit mest värdefull i vara förenliga med de anlinjer som pappersforskningen etablerat. Det tydligaste exemplet är att jag matchar ett trettiotal personer som härstammar från farmors morfar och mormor (Bild 1). I en klusteranalys dyker de upp som mitt enda egentliga kluster som består av fler än fyra personer. Dessa anor har alltså inte bara många avkomlingar idag utan dessa avkomlingar har dessutom testat sig i väldigt hög utsträckning.

hansannakajsa 1

Bild 1. Farmors morfar och mormor Hans Vestermark (1823–1896) Anna Karin (»Nischamor«) Andersdotter (1837–1930) i Tängsta. Foto i privat ägo.

kluster

Bild 2. Klustret med mina matchningar med avkomlingar till farmors mormor och morfar. Källa: Författaren.

När det autosomala testet gjordes för snart sju år sedan var antalet matchningar drygt 2 000. Nu har det fördubblats till knappt 4 500. Det är alltså fler som testat sig. Vad jag förstår är antalet ganska typiskt för ett test hos FT, givet att man inte härstammar från en befolkningsgrupp som under lång tid tillämpat endogami. Jag bortser från det problemet i det följande.

Grunden för detta med matchningar är ju att jag och matchningen har identiska DNA-segment i tillräckligt hög omfattning. Det räcker dock inte eftersom DNA-segment rekombineras vid varje meios genom att mammans och pappans DNA blandas med varandra. . En persons ursprungliga DNA spjälkas upp i allt mindre delar efter allt fler generationer tillkommer. I genomsnitt halveras längden på segmenten i varje generation. Så det vi vill kunna säga är att jag och min matchning fått våra identiska DNA-segment från en gemensam ana utan att segmenten är resultatet av en rekombination. Ju fler generationer tillbaka anan är desto flera rekombinationer av anans DNA har då skett och de gemensamma segment som man kan ha med en matchning blir allt mindre och allt färre.

Nu kan man inte direkt observera de sanna segmenten utan vad som kommer ut av testet är resultatet av mätningar (behäftade men olika mätfel) och tillämpningar av olika kriterier och metoder för att översätta det till (vad testen kallar) segment. 

Vad man egentligen skulle vilja ha är ett test som läser en genvariant i varje enskild position på de enskilda kromosomerna i varje kromosompar. Om jag och jämförelsepersonen har samma genvariant är vi identiska i den positionen. Nu klarar inte testerna detta utan läser båda kromosomerna samtidigt så man får två genvarianter i varje position. Vi räknas då som identiska om en av genvarianterna överensstämmer. 

Det är alltså bara segment som inte rekombinerats som är sanna matchningar. De kan visserligen vara mycket korta och indikerar då en släktskap långt tillbaka i tiden. Det är omdiskuterat hur värdefulla de är för släktforskningsändamål. Identiska segment som uppstått genom rekombinationer är falska träffar. 

Problemet är inte obetydligt. Blain Bettinger, i en blogg för några år sedan, redovisade en jämförelse mellan sina matchningars segment med motsvarande hos hans mamma och pappa. Han måste ju ha fått segmenten från mamman eller pappan, men en tredjedel av hans matchningar fanns vare sig hos mamman eller pappan.

Hur ska vi skilja sanna och falska identiska segment från varandra? Svaret är att vi helt enkelt måste bortse från de minsta segmenten. Men var drar vi gränsen?

FTDNA införde för några år sedan en ändring genom vilken segment som är kortare än 6 cM filtrerades bort. När jag överförde mitt autosomala test till MyHeritage (MH) fick jag över 17 000 matchningar: MH har visserligen fler testade i sin databas men är också mycket mera »givmild« med de små segmenten.

Det finns en diskussion om var gränsen minsta storlek på segmenten bör dras (se exempelvis International Society of Genetic Genealogy Wiki). Minst 10 cM anförs ofta, troligen eftersom segmenten beräknas uppstått under de senaste 500 åren och därmed är teoretiskt möjliga att använda i pappersforskning.

Man kan visserligen använda FT:s webverktyg men eftersom jag gillar att leka med data och noggrannare se konsekvenserna av mina val så använde jag möjligheten att ladda ner alla matchningars gemensamma segment till min lokala dator. Själv använde jag för analysen programmet R, som är öppen källkod, men man kan göra samma sak i ett spread-sheet program. 

Jag hade då 4 489 matchningar som tillsammans hade 5 545 segment. De flesta matchningar bestod alltså bara av ett segment. Segmentens längd är extremt snedfördelad, där antalet segment över 25 cM är lätt räknade (Bild 3).

För att räknas som matchning hos FT krävs minst ett segment på 7 cM. Beroende på företagets uppskattning av graden av endogami kan gränsen dock i praktiken vara högre. Mindre segment (mellan 6 och 7 cM) kan fdock innas kvar om den totala mängden gemensam DNA är tillräckligt stor.

histogram

Bild 3. Histogram över segmentlängden. Källa: Författaren.

Jag filtrerade bort alla segment mellan 6 och 10 cM vilket ledde till att hälften av antalet segment försvann. Kvar blev 2 801 segment och 2 592 matchningar. Utav dessa var det dock bara 72 matchningar som bestod av mer än ett segment. Matchningen med minsta längd gemensam DNA hade 21 cM och hälften av de 72 matchningarna med mer än ett segment var mindre än totalt 32 cM.

Här kanske barnet kastades ut med badvattnet. En fjärdedel av de 2 953 en-segment matchningarna hade nämligen en total längd gemensamt med mig på mellan 14 och 40 cM och av dessa var det 63 som hade gemensamt DNA större än 21 cM: alltså det minsta gemensamma för de som hade fler än ett segment.

Av de ursprungligen 4 489 matchningarna skapade jag så en arbetslista med 72 + 63 = 135 matchningar att bearbeta i framtiden. För att komma med på listan var man alltså tvungen uppfylla följande kriterier givet att alla segment under 10 cM filtrerats bort:

  • minst två gemensamma segment (72 matchningar) eller
  • inte mindre totalt gemensamt DNA än de med minst två segment (63 matchningar).

De uppskattningar som jag sett angående andelen falska matchningar om man sorterat bort alla segment mindre än 10 cM indikerar att den andelen skulle vara mindre än en procent. Jag borde alltså inte ha med mer än någon enstaka falsk matchning på min lista, men en noggrann kontroll måste göras. Jag kan också ha sorterat bort en eller annan sann matchning. Det handlar då om matchningar bestående av bara ett segment med en längd på maximalt 20 cM. Med 135 personer på arbetslistan har jag dock att göra ett tag. Några av dessa matchningar är förvisso lågt hängande frukter och ett knappt 40-tal är redan identifierade men en hel del återstår.

Det är visserligen spännande att botanisera bland alla matchningarna men det mesta är alltså bara brus. Det är istället i toppen på matchningslistan som det intressanta finns. Och jag har en lista att gå igenom med väl definierade kriterier för vilka som ska finnas med.

×
Håll dig informerad

När du prenumererar på Rötterbloggen kommer vi att skicka dig ett e-post när ett nytt blogg-inlägg kommit så att du inte missar något.

Hur jag fann Maria
Chat - rätt eller fel
 

Kommentarer

Inga kommentarer än. Var den första att lämna en kommentar
Redan registrerad? Logga in här
Gäst
24 mars 2025

Captcha bild

Bloggare

Eva Johansson
539 inlägg
Mats Ahlgren
334 inlägg
Ted Rosvall
279 inlägg
Anton Rosendahl
265 inlägg
Helena Nordbäck
257 inlägg
Markus Gunshaga
122 inlägg
Michael Lundholm
32 inlägg
Gästbloggare
31 inlägg
Stefan Simander
2 inlägg

Annonser