Download - Caraterização de uma amostra de emigrantes ucranianos ...

FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select

i

Resumo e palavras-chave

Neste trabalho, uma amostra de indivíduos ucranianos residentes em Portugal

foi caraterizada para os marcadores incluídos no kit NGM Select, um dos kits comerciais

mais usado em análises de rotina forense. Os valores de heterozigotia, poder de

discriminação combinado (PDc) e poder de exclusão combinado (PEc), demonstram um

elevado nível de discriminação entre indivíduos de origem ucraniana que este kit

oferece, reforçando a seu poder informativo e importância em análises de rotina forense.

Comparações entre populações revelaram diferenciação genética significativa entre a

amostra ucraniana e populações de regiões não europeias. As análises comparativas,

efetuadas com diferente número de marcadores do kit e de populações, e baseadas em

duas medidas de diferenciação genética, indicaram ainda que em estudos

populacionais, combinando os marcadores do kit ou os sub-conjuntos foi possível

diferenciar bem populações de diferentes continentes. Na Europa, encontrou-se baixa

substrutura populacional, modestamente relacionada com a geografia. Os gradientes de

diversidade detetados podem ter resultado de algumas migrações que marcaram a

história da Europa, nomeadamente as que ocorreram no período neolítico aquando da

introdução da agricultura, e mais tarde, após a última época glaciar, quando se registou

importante repovoação do continente.

Palavras-chave:

Genética Forense, STRs, Dados Populacionais, Ucrânia, Comparações intra e

interpopulacionais


ii

Abstract and keywords

In this work, a sample of Ukrainians living in Portugal was characterized for the

autosomal markers included in the NGM Select kit, a kit primarily used in forensic

casework analysis. The estimated values of heterozygosity, combined power of

discrimination (PDc) and combined probability of paternity exclusion (PEc),

demonstrated the high level of discrimination between Ukrainians afforded by this kit,

thereby making it very informative and consequently an important asset in forensic

routine. Interpopulation comparisons showed significant genetic differentiation between

the sample of Ukrainians and populations from non-European regions. Interpopulational

comparisons with different number of populations and makers and based in two different

genetic distances pinpoint the prospective use of the NGM Select kit mainly in population

genetic studies addressing the genetic differentiation between continental populations.

Within Europe, low population structure, modestly related with geography, was detected

with this kit. Some of the genetic diversity gradients observed might be related with major

migrations within Europe, namely in Neolithic, when the introduction of agriculture in

Europe occurred, and later, after the last glaciar maxium (LGM) during the continent

repopulation.

Keywords:

Forensic Genetics, STRs, Populational Data, Ukraine, intrapopulation and

interpopulacional comparisons


iii

Índice

Resumo e palavras-chave ................................................................ i

Abstract and keywords ................................................................... ii

Lista de tabelas .............................................................................. v

Lista de figuras .............................................................................. vii

Lista de abreviaturas ..................................................................... ix

1. Introdução ................................................................................... 1

1.1. Marcadores genéticos .......................................................................... 1

1.1.1. STRs ..................................................................................................... 2

1.1.2. kit NGM Select ....................................................................................... 3

1.1.3. Utilização dos marcadores genéticos em estudos de ancestralidade .... 5

1.2. Genética da Europa ............................................................................. 5

1.3. Da Ucrânia até Portugal ........................................................................ 7

2. Objetivos .................................................................................... 9

3. Material e métodos .................................................................. 10

3.1. Amostragem populacional .................................................................. 10

3.2. Extração do ADN ............................................................................... 10

3.3. Amplificação do ADN ......................................................................... 11

3.4. Separação e genotipagem ................................................................. 11

3.5. Análise de dados ................................................................................ 12

3.5.1. Intrapopulacional .......................................................................... 12

3.5.2. Interpopulacional .......................................................................... 16

4. Resultados e discussão ........................................................... 21

4.1. Diversidade genética dos ucranianos ................................................ 21

4.2. Estudo interpopulacional ......................................................................... 30


iv

4.2.1. Intercontinental ..................................................................................... 30

4.2.1.1. Análise com a distância genética FST ............................................. 31

4.2.1.2. Análise com a distância genética (δμ)2 ........................................... 35

4.2.1.3. Testes de Mantel ........................................................................ 38

4.2.2. Fronteira Europa-Ásia/ fronteira Ucrânia ............................................... 38

4.2.2.1. Fronteira Europa-Ásia ......................................................................... 38

4.2.2.2. Fronteira Ucrânia ................................................................................. 41

4.2.3. Europa .................................................................................................. 44

4.2.4. Kit NGM Select ............................................................................. 54

4.3. Marcadores e distâncias genéticas ............................................................. 57

5. Conclusões ............................................................................... 64

6. Referências bibliográficas ......................................................... 65

Anexos ......................................................................................... 79


v

Lista de tabelas

Tabela 1. Parametização do termociclador para a reação de PCR com o kit AmpFℓSTR®

NGM SelectTM ........................................................................................................... 11

Tabela 2. Tabela com os parâmetros forenses e populacionais estudados .............. 26

Tabela 3. Variação nos valores da distância de FST (em percentagem) entre 7 regiões

definidas (médio oriente, Europa, Ásia (oeste), Ásia (centro-oriente), Norte de África,

África e Gronelândia) ................................................................................................ 32

Tabela 4. Variação nos valores da distância de (δμ)2 entre 7 regiões definidas (médio

oriente, Europa, Ásia (oeste), Ásia (centro-oriente), Norte de África, África e

Gronelândia) ............................................................................................................. 37

Tabela 5. Relação entre a latitude/longitude e as variáveis [,1] e [,2] para os gráficos de

MDS das distâncias genéticas entre as populações ................................................. 49

Tabela 6. Distâncias de FST médias e desvio padrão entre as zonas europeias definidas

no gráfico da Figura 14 ............................................................................................. 49

Tabela 7. Regressão linear para a variação na distância genética FST ou heterozigotia

em função da variação na longitude ......................................................................... 53

Tabela 8. Comparação de FST locus a locus entre a Ucrânia e outros países já descritos

na literatura ............................................................................................................... 55

Tabela 9. Valores de FST e respetivos valores de p para a comparação locus a locus

entre a Ucrânia e 3 regiões (norte, centro e sul) de Portugal .................................... 57

Tabela 10. Valores de R2 e p para os testes de Mantel avaliando a relação entre a

distância genética (FST ou (δμ)2) e geográfica para 10, 15 e 16 marcadores ............. 58

Tabela 11. Valores de R2 e p para os testes de Mantel avaliando a relação entre as

distâncias genéticas FST e (δμ)2, para 10, 15 e 16 marcadores genéticos ................. 58

Tabela 12. Valores de R2 e p para os testes de Mantel entre as distâncias genéticas FST

e (δμ)2, consoante o número de populações estudadas ............................................ 59

Tabela 13. Valores de R2 e p para os testes de Mantel avaliando a relação entre o

número de marcadores para os dados de FST e (δμ)2 ............................................... 59

Tabela 14. Regressão linear e o respetivo valor de R2 para a variação dos parâmetros

estudados em função de duas distâncias genéticas ................................................. 63

Tabela 15. Referências bibliográficas, número de indivíduos, loci estudados e regiões

geográficas dos dados utilizados para os diversos países presentes neste estudo .. 80


vi

Tabela 16. Matriz de distâncias genéticas para 46 populações (valores de FST acima da

diagonal e (δμ)2 abaixo) ............................................................................................ 84

Tabela 17. Valor de p locus a locus para a distância de FST (intracontinental) .......... 87

Tabela 18. Valor de p para a comparação de FST locus a locus entre a Ucrânia e os

outros países já descritos na literatura ...................................................................... 89

Tabela 19. Valores de heterozigotia e desvio padrão para cada um dos marcadores do

kit NGM Select para 16 populações .......................................................................... 91


vii

Lista de figuras

Figura 1. Variação no número de motivos repetitivos, CTA, de STR para diferentes

indivíduos ................................................................................................................... 3

Figura 2. Marcadores incluídos no kit AmpFℓSTR® NGM Select™ ............................ 4

Figura 3. Eletroferograma referente a 4 dos STRs testados obtido para um dos

indivíduos estudados ................................................................................................ 21

Figura 4. Número de alelos e de alelos raros presentes em cada um dos loci analisados

.................................................................................................................................. 23

Figura 5. Representação geográfica dos 46 países/zonas utilizados (a vermelho) na

comparação genética efetuada com os 10 marcadores descritos ............................. 30

Figura 6. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a

partir da comparação das populações representadas na Figura 5 para os 10 marcadores

anteriormente referidos .............................................................................................. 31

Figura 7. Valores de heterozigotia para os 10 marcadores referidos anteriormente, para

as 46 populações utilizadas na comparação ............................................................. 34

Figura 8. Gráfico de Multidimensional Scaling (MDS) para os valores de (δμ)2, obtidos

a partir da comparação das populações representadas na Figura 5 para os 10

marcadores anteriormente referidos ......................................................................... 36

Figura 9. Representação geográfica dos 18 países/zonas utilizados (a vermelho) na

comparação genética efetuada com os 10 marcadores descritos no ponto 4.2.1. ..... 39


partir da comparação das populações representadas na Figura 9 para os 10 marcadores

referidos no ponto 4.2.1. ........................................................................................... 39

Figura 11. Heatmap da matriz da distância genética de (δμ)2 para as populações

estudadas ................................................................................................................. 41

Figura 12. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráficos de PCA para

frequências alélicas e heterozigotia (a), b), c) e d) respetivamente) obtidos a partir da

comparação das populações europeias representadas na Figura 9 que são fronteiras à

Ucrânia, para os 10 marcadores referidos no ponto 4.2.1. ......................................... 42

Figura 13. Representação geográfica dos 31 países (a vermelho) Europeus utilizados

na comparação genética efetuada com os 15 marcadores descritos anteriormente . 44

Figura 14. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráfico de PCA para

frequências alélicas (a), b) e c) respetivamente) obtidos a partir da comparação das

populações europeias representadas na Figura 13 .................................................. 45


viii

Figura 15. Relação entre a latitude/longitude e os componentes principais (1,2 e 3) para

o gráfico de PCA das frequências alélicas das populações europeias ...................... 48

Figura 16. Relação entre a variação na heterozigotia/ distância genética para os 15

marcadores e a distância em graus de latitude ao “sul europeu” .............................. 51

Figura 17. Relação entre a variação na heterozigotia / distância genética para os 15

marcadores e a distância em graus de latitude ao Levante ....................................... 52


partir da comparação das populações descritas anteriormente para o kit NGM Select. O

gráfico a azul corresponde a um zoom in da área rodeada a azul ............................ 56

Figura 19. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos

a partir da comparação das populações descritas anteriormente para o kit NGM Select.

O gráfico a azul corresponde a um zoom in da área rodeada a azul ......................... 56

Figura 20. Distribuição das distâncias genéticas médias entre as 16 populações

referidas em 4.2.4. por locus ..................................................................................... 60

Figura 21. Valores de heterozigotia para as populações analisadas, por locus ........ 61

Figura 22. Valor de número de alelos médio para as populações analisadas em 4.2.4.

(exceto Gronelândia) e respetivo desvio padrão por locus ........................................ 62


ix

Lista de abreviaturas

ADN Ácido desoxirribonucleico

AIM Ancesty informative marker (marcador informativo de ancestralidade)

cMDS Classical Multidimensional scaling

CODIS Combined DNA Index System

EHW Equilíbrio de Hardy-Weinberg

ESS European Standard Set STR

FST Índice de fixação

He Heterozigotia esperada

HGDP-CEPH Human Genome Diversity Cell Line Panel

Ho Heterozigotia observada

HT Heterozigotia esperada da população (total)

HS Heterozigotia esperada da subpopulação

IP Índice de paternidade

LGM Last glaciar maximum (última época glaciar)

LR Razão de verossimilhança (likelihood ratio)

MDS Multidimensional Scaling (escalamento multidimensional)

PCA Principal component analysis (análise de componentes principais)

PCR Reação em cadeia da polimerase (polimerase chain reaction)

PD Poder de discriminação

PDc Poder de discriminação combinado

PE Probabilidade de exclusão

PEc Probabilidade de exclusão combinada

PI Probabilidade de identidade/ matching probability

PIB Produto interno bruto

PIC Polymorphic information content

SMM Setpwise mutation model

SGBF-N Serviços de genética e biologia forenses, delegação do Norte

SNP Single Nucleotide polymorphism

STR Short Tandem Repeat

STRBase Short Tandem Repeat DNA Internet DataBase

URSS União das Repúblicas Socialistas Soviéticas

VNTR Variable number tandem repeat

W Probabilidade de paternidade

(δμ)2 Delta mu squared


1

1. Introdução

A genética é um ramo da biologia que se debruça sobre o estudo dos genes e

dos mecanismos de transmissão da informação genética de geração em geração. Os

avanços nesta disciplina têm revolucionado muitas áreas do conhecimento, e resultaram

em aplicações extremamente importantes. Diversas áreas têm beneficiado dos

desenvolvimentos registados na genética, nomeadamente, a área forense, a ecologia,

o estudo da evolução das espécies, a medicina, a engenharia molecular, entre outras. A genética populacional é um dos ramos que tem dado dos contributos mais

extraordinários em termos de métodos e enquadramento teórico para diferentes áreas

da Biologia [1]. O seu foco é o estudo da variação genética entre e dentro das

populações através da análise da variação nas frequências génicas ao longo do espaço

e do tempo. Esta variação é ditada por diversos fenómenos, como recombinação,

mutação, e outros associados a processos evolutivos como: a seleção natural, a deriva

génica, a mutação e o fluxo génico [2].

A genética forense recebeu um grande impulso a partir de 1984, quando Alec

Jeffreys se apercebeu do potencial em aplicar o estudo dos marcadores de tipo VNTR

(variable number tandem repeat) à área forense. Graças aos avanços anteriormente

alcançados nas técnicas da biologia molecular, nomeadamente com a descoberta do

processo de PCR (reação de amplificação da polimerase), em 1983. Esta descoberta

constituiu uma revolução na genética molecular que permitiu analisar detalhadamente

o genoma. Aos VNTRs, cedo se juntou o estudo de outro tipo de marcadores, como os

SNP (single nucleotide polymorfism) e STR (short tandem repeat), que são atualmente

os mais utilizados na área forense [3]. Com o auxílio destes marcadores é possível

caraterizar geneticamente os indivíduos pertencentes a uma população e diferenciá-los

dos demais. Esses marcadores podem estar localizados no genoma nuclear, nos

autossomas, ou nos cromossomas sexuais (X e Y), ou no genoma mitocondrial, e

podem ser de diversos tipos, como se descreverá a seguir.

1.1. Marcadores genéticos

No homem, o ADN nuclear está repartido por 23 pares de cromossomas, dos

quais 22 são de autossomas e um é constituído pelos cromossomas sexuais (X e Y). A

informação dos autossomas é passada à descendência por ambos os progenitores.

Quanto ao cromossoma X, enquanto que os indivíduos do sexo feminino recebem X de

ambos os progenitores, herdando 50% da informação contida nos cromossomas da

mãe, e 100% da contida no único cromossoma X que o pai possui, os indivíduos do


2

sexo masculino recebem apenas o X da mãe, herdando, assim 50% da informação que

a mãe contém no par de cromossomas X e a totalidade da informação que o pai contem

no cromossoma Y. Este último cromossoma transmite-se somente aos indivíduos

masculinos e por via paterna.

No entanto, existe também um ADN que se organiza numa forma circular: é o

que se encontra nas mitocôndrias das células. Este ADN é designado de ADN

mitocondrial, e quanto às propriedades de transmissão carateriza-se por ser passado à

descendência exclusivamente por via materna.

De entre o leque de marcadores existentes para análise genética forense podem-

se salientar os short tandem repeats (STRs), os single nucleotide polymorphisms

(SNPs) e os insertion delection polymorphisms (INDELs).

Os SNPs são caracterizados por uma alteração num único nucleótido, ou seja,

por variação de base em determinado nucleótido, como por exemplo a substituição de

uma citosina (C) por uma timina (T). São extremamente frequentes, em média 1 em

cada 300 par de bases, sendo por isso de extrema utilidade para a área forense.

Os INDELs, como o próprio nome indica, correspondem a inserções ou deleções

de nucleótidos na cadeia de ADN, podendo o tamanho da porção adicionada/retirada

ser bastante variável (1-10 000 bp). Muitos destes INDELs estão localizados em zonas

do genoma responsáveis por diversas caraterísticas humanas e doenças, e por este

motivo o seu estudo é de extrema importância [4, 5].

1.1.1. STRs

Cada molécula de ADN é constituída por regiões codificantes de proteínas ou

RNAs e regiões não codificantes. Em genética forense, utilizam-se habitualmente

marcadores de ADN localizados em zonas não codificantes (intrões, ou regiões

intergénicas). Cada marcador localiza-se numa região específica de um cromossoma,

designada de locus, e pode pertencer a diferentes categorias estruturais. Entre elas

incluem-se os short tandem repeats (STR), em que os diferentes alelos são definidos

por variações no número de repetições de uma pequena sequência (motivo da

repetição), habitualmente com tamanho compreendido entre 2-6 bp.

Cada alelo corresponde, assim, a diferentes tamanhos de uma sequência de ADN,

sendo que o tamanho depende do número de vezes que um conjunto de nucleótidos se

repete. Por exemplo, no caso de um STR, com o motivo repetitivo CTA, o alelo 5

corresponder à presença de 5 repetições dessa sequência (CTA CTA CTA CTA CTA),

o alelo 6 a seis (Figura 1) e assim sucessivamente.


3

Figura 1. Variação no número de motivos repetitivos, CTA, de STR para diferentes indivíduos

Em termos das caraterísticas do motivo de repetição, os STR podem ser de três

tipos: simples, compostos e complexos. Os simples consistem em repetições que são

idênticas no seu tamanho e sequência. Os complexos podem apresentar um motivo

repetitivo com uma variação na sequência e os compostos podem apresentar variações

tanto no tamanho como na sequência.

Os STR são extremamente abundantes, constituindo cerca de 3% do genoma

humano, destacando-se também pelo elevado nível de polimorfismo. Por estes motivos,

têm sido considerados marcadores de eleição para fins identificativos, em especial os

simples e tetranucleotídicos (isto é, com motivo de repetição de 4 bp), que

compreendem a maioria dos STR usados na casuística forense.

Os STR podem estar localizados tanto em autossomas como nos cromossomas X

e Y. Através do estudo destes marcadores num indivíduo, é possível caraterizá-lo para

um conjunto de loci e comparar o seu perfil com o dos demais indivíduos da população.

Naturalmente que quanto mais informativos forem os loci estudados maior será o poder

de discriminação entre indivíduos de uma população. Para além dos aspetos referidos,

os STRs apresentam ainda outras propriedades desejáveis em genética forense,

nomeadamente, facilidade de amplificação por reação em cadeia da polimerase (PCR)

e de deteção dos produtos de amplificados, possibilidade de análise de vários STR em

simultâneo com sistemas multiplex, existência de diversos kits comerciais, entre outras

[6].

1.1.2. Kit NGM Select

Os kits de amplificação consistem num conjunto de marcadores que são analisados

em conjunto. A utilização destes kits frequentemente contribui para obter um elevado

poder de discriminação entre indivíduos pertencentes a uma determinada população.

Entre os numerosos kits de STRs que diferentes companhias comerciais oferecem,

inclui-se o AmpFℓSTR® NGM Select™, uma versão atualizada do kit AmpFℓSTR®

NGM™, que contém os 16 STR discriminados na Figura 2.


4

Figura 2. Marcadores incluídos no kit AmpFℓSTR® NGM Select™

12 desses 16 STRs correspondem a marcadores que fazem parte do European

Standard STR set (ESS), conforme foi estabelecidos pelo Conselho da União Europeia

2009/C296/01 a 30 de novembro de 2009 [7, 8].

O set ESS consiste no conjunto de STR definidos como obrigatórios nas análises

de rotina forense dos laboratórios europeus. Esta medida foi implementada no sentido

de tornar mais precisa a comparação entre análises de laboratórios distintos, e diminuir

a probabilidade de encontrar perfis repetidos nas diferentes bases de dados dos países

europeus. Inicialmente era constituído por 7 loci: TH01, vWA, FGA, D21S11, D3S1358,

D8S1179 e D18S51, mas em 2009 foi aprovada a inclusão de 5 novos loci, com

amplicões de menor tamanho (70-180 pares de base (bp)), designados de mini-STRs,

sendo eles: D10S1248, D22S1045, D2S441, D12S391 e D1S1656. Esta alteração


5

surgiu pelo fraco desempenho dos marcadores de STR utilizados na rotina laboratorial

forense, quando comparados com os mini-STR ou os SNP. Sendo assim, os principais

objetivos que determinaram a inclusão dos novos ESS foram: aumentar o poder de

discriminação, aumentar a sensibilidade das análises em amostras de ADN degradadas,

e melhorar a robustez/qualidade dos resultados [9].

O kit AmpFℓSTR® NGM Select™ também inclui o locus SE33, um locus

extremamente polimórfico, que é reconhecido como uma importante mais valia em

analises genéticas. A performance geral do kit NGM Select é equivalente à do kit NGM,

no entanto, a inclusão do locus SE33 aumenta significativamente o poder de

discriminação, tornando-o no kit com maior poder discriminativo de todos os kits

AmpFℓSTR® [10]. Para a maioria dos loci contidos neste kit, abundam na literatura

científica dados sobre frequências alélicas em diversas populações. No entanto, até à

data a população Ucraniana encontra-se francamente sub-representada [11, 12], sendo

que maior parte dos estudos se foca na antiga União Soviética, e não nos estados

emergentes após a dissolução da URSS.

1.1.3. Utilização dos marcadores genéticos em estudos de ancestralidade

Existe a potencialidade de utilização dos marcadores anteriormente

mencionados em estudos de ancestralidade com o objetivo de inferir a origem

geográfica de determinado indivíduo. Para o efeito, tem-se recorrido a marcadores

designados de AIMs (ancestry informative markers) [13, 14], cujo denominador comum

é apresentarem grandes diferenças nas frequências alélicas entre diversas populações

de forma a potenciar a diferenciação entre indivíduos de diferentes populações.

De entre os marcadores apresentados, os SNP têm sido dos AIMs mais

utilizados pelo facto de terem baixas taxas de mutação e de não sofrerem enviesamento

devido à existência de um elevado número de alelos [15]; existindo também inúmeras

bases de dados de SNP e diversos conjuntos/painéis de marcadores construídos com

o propósito da discriminação geográfica [16-23]. Por estes motivos, a maior parte de

estudos iniciais de ancestralidade usaram AIMs tipo SNP, embora nos últimos anos

terem ganho grande protagonismo AIMs de tipo INDEL. Tem sido mais difícil selecionar

AIMs entre STRs, mas também existem alguns kits de STR disponíveis [24, 25].

1.2. Genética da Europa

Embora não exista consenso sobre os acontecimentos que mais contribuíram

para o legado genético europeu, sabe-se, no entanto, que entre os principais se incluem


6

desde logo a colonização inicial há cerca de 35 000-40 000 anos por caçadores-

recolectores modernos que vindos do Levante acabariam por substituir os neandertais,

um grupo Homo que há muito habitava a Europa. Apesar do breve período de

coexistência entre os 2 grupos, alguma mistura entre eles ocorreu, como indica a

presença residual de ancestralidade Neandertal no genoma dos europeus atuais [26-

28]. Posteriormente, há indicações de uma importante reconfiguração populacional

associada à dispersão da agricultura por todo o continente, depois de ter surgido pela

primeira vez há cerca de 10 000 anos no próximo-oriente.

Sobre o processo de dispersão da agricultura na Europa, ainda se debate entre

os diferentes modelos de difusão cultural e de difusão démica, segundo os quais se

atribui um papel menor ou maior, respetivamente, à migração de agricultores a partir do

próximo-oriente [27, 29-31]. Apesar do modelo da difusão démica ser o mais aceite,

admitindo-se, portanto, fluxo migratório considerável de agricultores, o impacto genético

desta migração continua pouco claro, embora os estudos mais recentes baseados em

um elevado número de marcadores genéticos aponte para um componente neolítico

superior ao paleolítico na composição genética dos europeus [27], sugerindo assim, que

os recolectores foram “substituídos” em grande parte, pelos agricultores provenientes

de leste.

Tem sido também documentado, no padrão de diversidade genética europeu,

um gradiente populacional de sentido sul norte, que se associa a movimentações

populacionais decorrentes no período arqueológico definido como a última época glaciar

(latest glaciar maximum, LGM), registada há cerca de 18 000 anos. Por essa altura, as

zonas mais a norte e centro da europa ficaram cobertas de gelo, levando a maior parte

da população aí residente a abandonar a região deslocando-se para zonas com

condições climáticas menos agrestes. Há indícios de que os únicos locais onde a

presença humana persistiu tenha sido nas zonas mais quentes situadas a sul, e

atualmente designadas de refúgios glaciares. Com o fim da época glaciar e o recuo do

gelo houve uma repovoação das zonas centro e norte. Esta fase de re-expansão

populacional que se prolongou pelo início do mesolítico influenciou significativamente a

distribuição genética europeia [25, 32, 33].

Já em período pós-neolítico, nomeadamente durante a idade do Bronze, uma

migração com origem no leste da eurásia do Norte, correspondente à atual Rússia

asiática, também contribuiu significativamente para o legado genético europeu,

admitindo-se até que pode ter sido responsável pela introdução das línguas indo-

europeias na europa [34, 35].


7

Migrações mais recentes continuaram a afetar o genoma europeu, sobretudo a

escalas geográficas mais restritas. Em suma, as descontinuidades genéticas

observadas na Europa desde o paleolítico até períodos pós-neolíticos devem-se

essencialmente a processos demográficos como migrações, crescimento e/ou declínio

populacional e mistura [36]. A seleção natural também afetou a diversidade em porções

específicas do genoma europeu, mas pouco influenciou o padrão geral que foi

maioritariamente ditado pelos fatores de ordem demográfica já mencionados.

Quanto às populações europeias contemporâneas, que globalmente se

caraterizam por considerável homogeneidade genética, tem-se verificado existir

marcada correlação entre distância genética e geográfica. Outros fatores, como a

língua, a etnia e a cultura, que se sabem poder afetar a distribuição genética,

desempenham um papel bem menor comparativamente à influência da geografia na

distribuição genética dos europeus atuais [36].

1.3. Da Ucrânia até Portugal

A Ucrânia é um país da antiga união soviética que se localiza no leste europeu,

sendo um dos países pertencestes à Eurásia e que faz fronteira com o continente

asiático. Excluindo a Rússia Europeia, a Ucrânia é o maior país do continente europeu

e que está localizado numa região geograficamente estratégica. Tem uma área de 603

700 km2, sendo que a distância longitudinal entre as extremidades do país é 1 316 km

e a latitudinal é 839 km. Faz fronteira com diversos países europeus, sendo eles:

Moldávia, Roménia, Hungria, Eslováquia, Polónia, Bielorrússia, Rússia e também com

o mar negro [37].

O país é composto por 24 províncias e uma região autónoma (a Crimeia) e

contém cerca de 44 209 733 habitantes, sendo que 77,8% são etnicamente Ucranianos,

17,3% Russos, 0,6% Bielorrussos, 0,5% Moldavos, 0,5% tártaros da Crimeia, 0,4%

Búlgaros, 0,3% Húngaros, 0,3% Romenos, 0,3% Polacos, 0,2% de origem judaica, entre

outros. A língua oficial é o ucraniano, no entanto, o russo está também muito presente.

Outras línguas são também faladas, correspondendo maioritariamente às línguas de

origem das minorias étnicas existentes no país. A religião predominante é o cristianismo

[38].

A Ucrânia faz parte do conjunto de países onde existem populações eslavas,

designação em que é comum integrar populações nas quais se falam línguas eslavas,

um grupo de línguas que pertence a um dos maiores ramos linguístico da família das


8

línguas indo-europeias. Na europa, existem populações eslavas na região central e em

toda a faixa que vai do Nordeste até ao Sudoeste do continente. A partir do estudo de

marcadores de linhagem, nomeadamente do cromossoma Y, foi possível detetar uma

certa separação entre populações eslavas e populações europeias não-eslavas, apesar

da diferenciação ser pouco percetível com base em marcadores autossómicos [39]. A

análise do cromossoma Y revelou ainda que as populações eslavas se separam em

dois grupos principais (eslavos do sul e outros eslavos), que tiveram origem há cerca de

15 000 anos na bacia do rio Dnieper, região localizada na atual Ucrânia [40].

A Ucrânia foi posteriormente palco de diversas migrações, o que moldou a sua

herança genética. Atualmente, não se encontra diferenciação significativa entre

indivíduos das diversas regiões da Ucrânia com o recurso a marcadores STR do

cromossoma Y [41].

A formação do estado ucraniano só se observou após a queda da união

soviética, em 1991. Este período foi marcado por um processo de recessão de que

resultou a diminuição drástica do produto interno bruto ucraniano. A instabilidade

financeira causada levou a que muitos ucranianos procurassem como solução a

migração para outros países, incluindo Portugal. Por este motivo, na década anterior o

número de imigrantes ucranianos a residir em Portugal aumentou cerca de 213%. O

número de imigrantes registados no censo de 2011 foi de 33 790 indivíduos,

correspondendo ao terceiro maior grupo de imigrantes a residir em Portugal,

constituindo cerca de 9% do total de imigrantes [42].

Pelo facto de os ucranianos terem, de entre os migrantes, uma representação

significativa na população portuguesa, existe uma necessidade da sua caraterização

genética. A possível existência de substruturação populacional pode ser um problema

e condicionar as análises de rotina forense. Além disso, o difícil acesso a estudos

populacionais sobre a Ucrânia para marcadores de STR autossómicos pela comunidade

científica, é outro dos motivos para a realização deste estudo populacional. Muito

recentemente foi publicado um estudo com diversos marcadores (15) de STR para a

população ucraniana [43], no entanto, parte dos marcadores aqui analisados ainda não

se encontram tipados para a população ucraniana, nomeadamente os mini-STR do ESS

(European Standard Set) e o locus SE33 que se encontrava somente caracterizado para

uma mistura de indivíduos ucranianos e russos.


9

2. Objetivos

• Caraterizar geneticamente um grupo de indivíduos ucranianos residentes em

Portugal com o kit NGM Select

• Estudar a possível existência de subestruturação populacional entre os

indivíduos de origem ucraniana e os portugueses

• Averiguar a capacidade de um kit de rotina forense para discriminar

geneticamente grupos de indivíduos, nomeadamente tendo em conta diversas

escalas geográficas, desde o nível intercontinental ao nível inter-país

• Averiguar a capacidade do kit para discriminar países fronteiros de zonas

intercontinentais, nomeadamente na Eurásia

• Averiguar o poder do mesmo kit para compreender alguns dos processos

migratórios, nomeadamente dentro da Europa, e perceber como o padrão de

distribuição genética se relaciona com a geografia e história das populações

• Avaliar a coerência das diferenciações genéticas interpopulacionais produzidas

por duas medidas de distâncias genéticas, FST e (δμ)2

• Avaliar a capacidade dos marcadores de rotina forense para serem utilizados em

estudos de ancestralidade


10

3. Material e métodos

3.1. Amostragem populacional e material biológico

As amostras utilizadas neste estudo foram previamente colhidas a voluntários de

nacionalidade ucraniana a residir em Portugal. De entre um total de 83 amostras

disponíveis foram excluídas 11, por serem de indivíduos pertencentes a duos pai-filho(a)

ou trios mãe-filhos, ficando-se, assim com uma amostra populacional que consistia em

72 indivíduos, 31 homens e 41 mulheres, não relacionados, de origem ucraniana a

residir em Portugal.

Todos os voluntários foram esclarecidos verbalmente e por escrito acerca dos

objetivos do estudo e metodologia de colheita, e assinam um termo de consentimento

informado (anexo 1). Simultaneamente à colheita do material biológico foram

registrados numa ficha de identificação anonimizada alguns dados pessoais como a

idade, o sexo, a nacionalidade e a naturalidade.

O material biológico usado foi um esfregado da cavidade bucal, colhido com uma

zaragatoa por indivíduo. As zaragatoas foram secas ao ar e armazenadas à temperatura

ambiente até ao momento da extração de ADN.

3.2. Extração do ADN (ácido desoxirribonucleico)

O ADN foi extraído a partir de esfregaços de células bucais pelo método de

extração de Chelex [44]. Esta técnica inclui os seguintes passos:

a. Cortar um pedaço (cerca de 1/3) da parte da zaragatoa que entra em contato

com a superfície bucal;

b. Adicionar 970 µl de água ultrapura;

c. Incubar cerca de 20 min à temperatura ambiente (T.A.)

d. Adicionar 130 µl da resina Chelex 100 (200-400 mesh, solução a 5%) e agitar os

tubos;

e. Incubar a 100 ºC durante 10 minutos;

f. Centrifugar durante 5 min à velocidade máxima (12 000 a 14 000 rpm)

g. Conservar o sobrenadante no frigorífico (-4 ºC) para os passos posteriores.

As amostras extraídas foram rotuladas e anonimizadas, utilizando um código interno

correspondente a cada indivíduo.


11

3.3. Amplificação do ADN

A amplificação foi feita por PCR (polimerase chain reaction), usando o kit de

amplificação AmpFℓSTR® NGM SelectTM (Applied Biosystem, Foster City, CA) seguindo

o protocolo do fabricante, mas reduzindo o volume total de todos os reagentes a metade,

no termociclador GeneAmp 9700 (Applied Biosystem, Foster City, CA). Para cada

amostra, preparou-se um volume final de 12,5 µl por reação de PCR contendo os

seguintes reagentes: Master Mix (5 µl) e Primer Set (2,5 µl) do kit AmpFℓSTR® NGM

SelectTM, água desionizada (4 µl) e amostra contendo o ADN extraído (1 µl).

Em todos os ensaios de PCR foi incluído um controlo negativo (contendo a

mistura de amplificação sem o ADN a amplificar e perfazendo o volume final com água

desionizada) de forma a controlar possíveis contaminações, e um controlo positivo

(constituído por Master Mix (5 µl), Primer Set (2,5 µl) e um ADN denominado de 007,

incluído no kit comercial, que serve como controlo positivo (5 µl)) para avaliar a eficiência

da amplificação e genotipagem usando o ladder alélico presente no kit. As amostras

foram previamente quantificadas, e naquelas (cerca de 10) que continham uma

quantidade excessiva de ADN, procedeu-se ao ajuste da sua concentração por diluição

com água, em proporção máxima de 1:10, o que permitiu obter sempre perfis de boa

qualidade. O kit de amplificação utilizado foi o AmpFℓSTR® NGM Select™ anteriormente

descrito.

Após a preparação da mistura de PCR e adicionando respetivamente, cada uma

das amostras, efetuou-se a amplificação no termociclador GeneAmp PCR 9700

previamente programado segundo os parâmetros apresentados na Tabela 1:

Tabela 1. Parametrização do termociclador para a reação de PCR para o kit AmpFℓSTR® NGM SelectTM

Passo de

incubação

inicial

Ciclos (29 ou 30) Extensão

final “Espera” final

Desnaturação Annealing/extensão

95 ºC

11 minutos

94 ºC

20 segundos

59 ºC

3 minutos

60 ºC

10 minutos

4 º C

---

3.4. Separação e genotipagem

Os fragmentos de ADN obtidos após amplificação foram separados por

eletroforese capilar num analisador/sequenciador genético ABI 3500 Genetic Analyser

(Applied Biosystem, Foster City, CA) de acordo com as recomendações do fabricante.


12

As amostras foram preparadas de acordo com o seguinte protocolo:

a. Adicionar 10 µl de formamida Hi-Di™ desionizada e 0,5 µl de GeneScan™ 600

LIZ™ Size Standard (para cada amostra) num tubo de polipropileno com o

tamanho adequado;

b. Agitar (Vortex) o tubo;

c. Em cada poço da MicroAmp® Optical 96-Well Reaction Plate adicionar 10,5 µL

da mistura preparada no ponto a. e 1 µL dos produtos de PCR correspondentes

a cada amostra ou 1 µL de ladder alélico (para cada conjunto de 16 amostras);

d. Selar a placa e desnaturar selecionando o programa adequado (3 min a 95 ºC

seguido de arrefecimento até 4 ºC);

e. Montar a placa para a eletroforese e colocar no autosampler;

f. Proceder à eletroforese de acordo com as condições de corrida programadas

estabelecidas nas instruções do fabricante.

O controlo negativo e o positivo, previamente sujeitos a PCR, foram também

adicionados à placa para garantir a qualidade dos resultados. A genotipagem foi

realizada recorrendo ao software GeneMapper ID-X v1.4 (Applied Biosystems) através

da comparação do tamanho dos fragmentos amplificados com o tamanho dos

fragmentos contidos no ladder alélico de referência.

3.5. Análise de dados

3.5.1. Nível intrapopulacional

Para avaliar se os marcadores genéticos cumpriram os requisitos necessários

para serem utilizados em estudos forenses/populacionais e obter estimativas sobre a

sua eficiência, testou-se o equilíbrio de Hardy-Weinberg (EHW) e calcularam-se os

parâmetros estatísticos mais comuns em Genética Forense, como se descrimina

seguidamente.

• Frequências alélicas

As frequências alélicas para cada locus foram estimadas pelo método de

contagem direta implementado no software Arlequin ver3.5 [45], utilizando a seguinte

fórmula:

Pi = ni/2n


13

sendo ni o número de vezes que o alelo i foi observado na amostra populacional e n o

número de indivíduos analisados.

• Heterozigotia

A heterozigotia é uma das medidas mais informativas e amplamente utilizada na

estimativa da diversidade genética: quanto maior o seu valor maior será a diversidade

genética de uma população para um locus. Relativamente a uma dada amostra

populacional, podem obter-se dois valores de heterozigotia, a heterozigotia observada

(Ho), que representa a frequência de indivíduos heterozigóticos na amostra, e a

heterozigotia esperada (He) que consiste na frequência esperada de indivíduos

heterozigóticos assumindo equilíbrio de Hardy-Weinberg na população [46].

Para cada locus, a estimativa da heterozigotia esperada foi obtida com o

software Arlequin v3.5, que recorre à fórmula:

ℎ =n

n − 1 (1 − ∑ 𝑝𝑘

𝑖=1 i2)

sendo n o número de cromossomas analisados, k o número de alelos e pi a frequência

do alelo i.

A estimativa da heterozigotia observada foi feita através da razão entre o número

de indivíduos heterozigóticos observados naquele locus e o número total de indivíduos

analisados [6]. A heterozigotia média numa população, ou seja, ponderando os vários

marcadores analisados, é dada pela média das heterozigotias por locus.

• Equilíbrio de Hardy-Weinberg (EHW)

Segundo o princípio fundamental da Genética Populacional, determinada

população manterá constante a sua composição genética ao longo do tempo (equilíbrio

de Hardy-Weinberg), assumindo cruzamentos ao acaso, e ausência de efeitos de

migração, mutação e seleção. Igualmente assume que a população é infinita, o que na

prática é impossível. Presume-se, no entanto, que em populações suficientemente

grandes os efeitos da deriva génica não representem fator importante de alteração das

frequências alélicas [3], pelo que também podem estar em EHW, desde que os restantes

pressupostos se verifiquem.

Assim, para uma população em equilíbrio, as frequências genotípicas dependem

apenas das frequências alélicas de acordo com princípio de Hardy-Weinberg que se

pode generalizar da seguinte forma:


14

(p1 + … + pi)2 = (p12 + … + pi

2 + 2p1pi + …)

considerando os alelos A1, …, Ai aos quais estão associados as frequências alélicas p1,

…, pi.

Pode, então, usar-se a fórmula para calcular as frequências de genótipos

homozigóticos:

f(AiAi) = pi2

e heterozigóticos:

f(AiAj) = 2pipj

sendo pi, …, pj as frequências dos alelos i, …, j para determinado locus [6, 47].

Para avaliar se uma população está em equilíbrio de Hardy-Weinberg (EHW),

aplica-se habitualmente o teste exato de EHW, que permite verificar se há ou não desvio

estatisticamente significativo entre as distribuições genotípicas observadas e as

esperadas em equilíbrio. Este teste é efetuado para cada locus e o valor de p permite

avaliar a significância dos desvios detetados, assumindo normalmente como limite de

significância estatística p = 0,05, sendo que valores de p inferiores a 0,05 permitem

rejeitar a hipótese de a população estar em EHW, verificando-se o oposto para valores

superiores a 0,05 [48].

• Probabilidade de identidade/ matching probability (PI)

Estimativa da probabilidade de dois indivíduos (não relacionados), selecionados

ao acaso de uma mesma população, terem o mesmo genótipo. Sendo uma

probabilidade, tem um valor que varia entre 0 e 1. PI é um parâmetro de eficiência

forense que se calcula com o propósito de avaliar o poder de discriminação entre duas

amostras de um set de marcadores.

É dada, para cada locus, pela equação [3]:

PI = 2(∑ 𝑝i2)2 − ∑ 𝑝i

4

sendo pi o valor da frequência do alelo i em cada locus.

O PI global é calculado através da multiplicação dos diversos PI´s,

correspondentes a cada locus, assumindo não haver linkage ou linkage disequilibrium

entre os mesmos.


15

• Poder de discriminação (PD)

Corresponde à probabilidade de dois indivíduos não relacionados, selecionados

ao acaso de uma mesma população, terem genótipos diferentes. Varia entre 0 e 1 e

pode ser obtido, para cada locus, através da expressão [6]:

PD = 1 - PI

sendo PI a matching probability para cada locus. O poder de discriminação para vários

loci (por exemplo um kit forense) é calculado através da fórmula [3]:

PDc = 1 − ∏ (𝑛𝑖=1 1 − PDi)

sendo que PDi corresponde ao poder de discriminação para cada locus e recordando

que ∏ corresponde ao sinal de multiplicação.

• Probabilidade de exclusão (PE)

Corresponde à fração de indivíduos que, para um dado locus, tem um perfil

genético diferente de um indivíduo escolhido ao acaso na população. É uma medida

importante da eficiência forense em estudos de paternidade. O valor para determinado

locus corresponde ao poder de exclusão do mesmo. A fórmula utilizada para o cálculo

do poder de exclusão para cada locus é [49]:

PE = h2(1 − 2hH2)

sendo h a heterozigotia e H a homozigotia observadas para esse locus. O poder de

exclusão combinado (PEc) é calculado através da fórmula [6]:

PEc = 1 − ∏ (𝐿𝑙=1 1 − PEl)

sendo PEl correspondente ao poder de exclusão para cada locus.

• Polymorphic information content (PIC)

É uma medida de diversidade que inicialmente foi utilizada para avaliar o poder

informativo de um marcador em estudos de ligação [50]. O valor de PIC corresponde à

probabilidade de um alelo de determinado locus ser transmitido à descendência através

de um progenitor heterozigótico, tendo conhecimento do genótipo do segundo

progenitor [51].

Pode ser calculado através da seguinte expressão [49]:


16

PIC = 1 – (∑ 𝑝𝑛𝑖=1 i

2) – ∑ ∑ 2𝑛𝑗=𝑖+1

𝑛𝑖=1 pi

2pj2

sendo pi a frequência do alelo i, n o número de alelos e pj a frequência do alelo j para

determinado marcador.

• Índice de paternidade (IP)

O índice de paternidade (IP) é uma razão de verossimilhança que indica se um

alelo partilhado por um par alegado pai/filho para determinado locus é ou não a favor da

hipótese de o alegado pai ser o verdadeiro pai, face à hipótese alternativa de o

verdadeiro pai ser um outro individuo ao acaso da população que possua o mesmo alelo.

Assim, uma razão inferior a 1 contraria a hipótese de paternidade, enquanto um valor

superior a apoia [52]. Este índice pode ser generalizado para determinado locus (typical

paternity index), de forma a obter e avaliar o índice de paternidade “geral” para esse

locus em vez do índice de paternidade para um caso de paternidade específico [53].

A fórmula utilizada para o cálculo deste índice generalizado é a seguinte [6]:

IP = 1/2h

sendo h correspondente ao valor da homozigotia para determinado locus. O índice de

paternidade combinado é determinado multiplicando os IP’s individuais de todos os loci

estudados.

3.5.2. Nível interpopulacional

Para o estudo interpopulacional foram utilizados dados de frequências

publicadas em artigos científicos e/ou depositadas em algumas bases de dados (ver

referências no anexo 2). Para alguns países foram compilados dados provenientes de

estudos diferentes, que se consideraram em conjunto de modo a poder efetuar

comparações com 15 (kit NGM) e 16 (kit NGM Select) marcadores. Havendo mais que

um conjunto de dados publicados para a mesma população, optou-se pela fonte

baseada no maior número de indivíduos analisados.

Nas análises comparativas, planeou-se uma abordagem em que se

consideraram diversos níveis geográficos começando pelo continental, mais

especificamente intercontinental, passando pelo que incluía a zona da Eurásia e

fronteira com a Ucrânia, e posteriormente focando restritivamente a Europa.


17

No nível intercontinental, foram abrangidos 45 países, pertencentes a 4 grandes

zonas geográficas (Europa, Ásia, África, “Médio Oriente”) e a Gronelândia. Neste caso,

foi necessário reduzir a comparação a 10 dos 16 marcadores do kit NGM Select que se

encontravam tipados nas 46 amostras populacionais, nomeadamente: vWA, D16S539,

D2S1338, D8S1179, D21S11, D18S51, D19S433, TH01, FGA e D3S1358.

No nível geográfico da Eurásia, tirou-se recurso dos mesmos 10 marcadores e

18 populações localizadas na região. Como foram eliminados alguns países,

produziram-se novas matrizes genéticas, assim como gráficos de MDS.

Quanto à Europa, uma vez que existem guidelines com os marcadores que

devem ser analisados em contexto forense, foi possível estender a comparação a todos

os marcadores do kit NGM Select com a exceção do SE33, ou seja a 15 STRs, para os

quais se encontrou dados disponíveis em 31 populações europeias.

Finalmente, e de forma a integrar na análise comparativa a totalidade dos 16

marcadores do kit NGM Select, recrutaram-se dados de frequências que tinham sido

publicados na integra em artigos científicos, evitando usar mistura de frequências

recolhidas de fontes diferentes. Assim, a população ucraniana pode ser contrastada com

15 amostras populacionais (especificadas no anexo 2) já tipadas na íntegra para este

kit. Estes foram comparados com os dados obtidos para a população ucraniana.

Para avaliar o nível de divergência genética entre as populações foram

calculadas duas medidas de distância genética, nomeadamente FST e (δμ)2, que se

descrevem de seguida.

• FST – Índice de Fixação

Pode ser definido como a correlação existente entre alelos escolhidos ao acaso

dentro da mesma subpopulação em relação à população inteira, ou como a proporção

de diversidade genética causada por diferenças de frequências alélicas entre

populações [54, 55]. Como o FST mede a redução na heterozigotia de uma subpopulação

relativamente à população total avalia consequentemente o grau de diferenciação

genética entre subpopulações.

É dado pela seguinte fórmula:

FST = (HT - HS) / HT

onde HT é a heterozigotia total no conjunto de subpopulações e HS a média das

heterozigotias esperadas nas subpopulações [56].


18

A diferenciação genética entre populações está diretamente relacionada com os

processos evolutivos, de que são exemplo migrações, mutações, deriva génica e

seleção [57]. O FST está também diretamente relacionado com a variância nas

frequências alélicas entre populações e inversamente com o grau de semelhança entre

indivíduos dentro da mesma população.

• (δμ)2 – delta mu squared

Distância genética desenvolvida especificamente para marcadores de tipo STR

(short tandem repeat) [58]. A principal diferença relativamente a outras medidas de

distância genética reside no modelo mutacional assumido. Em alternativa ao infinite

alleles model em que se baseia a maioria das distancias genéticas, (δμ)2 considera o

stepwise mutation model (SSM) por ser um processo de mutação que melhor se aplica

aos STRs, já que o aparecimento de novos alelos ocorre pelo ganho ou perda de um

motivo repetitivo [59]. É calculada através da seguinte expressão:

(δμ)2 = ∑ (𝑟𝑗 μXj - μYj)

2 / r,

onde μXj (= ∑ 𝑖𝑥𝑖 ij) e μyj (= ∑ 𝑖𝑦𝑖 ij) é o número de repetições médio do alelo i no locus j

para as populações X e Y e xij e yij são as frequências do alelo com i repetições no

locus j para as populações X e Y [60].

Tanto o FST como o (δμ)2 foram calculados com base nas frequências genéticas

aqui obtidas para os ucranianos e as previamente publicadas para outras populações,

uma vez que as publicações originais raramente continham dados genótipicos. Tal

limitou a escolha do programa para obter as distâncias, pois são raros os softwares

disponíveis que as calculam usando como input frequências alélicas, principalmente no

caso da distância (δμ)2, em que os softwares utilizam normalmente dados genótipicos.

Por isso, as distâncias foram obtidas com o auxílio do software Poptrew [61], que, no

entanto, não fornece os valores de p associados. A heterozigotia e número de alelos,

por população e marcador, foram também calculados com este software. Para

complementar esta análise, também foram calculados valores de FST locus a locus, no

software Arlequin v3.5 [45], que computa as distâncias e os respetivos valores de p,

assumindo um intervalo de confiança de 95 % (p < 0,05).

A análise Multidimensional Scaling (MDS) foi efetuada no software R [62]. As

coordenadas produzidas foram posteriormente usadas para construir gráficos no Excel.

Os gráficos resultantes de Principal Component Analysis (PCA) foram obtidos com o

software SPSS Statistics v24 [63].


19

As coordenadas geográficas de GPS (latitude e longitude) foram retiradas da

internet para cada população, e depois usadas para obter matrizes de distâncias

geográficas entre populações recorrendo ao software GenAlEx v.6.5 [64]. Este software

foi também utilizado para efetuar os testes de Mantel com o intuito de comparar matrizes

de distâncias geográficas com matrizes de distâncias genéticas para as mesmas

populações.

De seguida, descrevem-se em traços largos princípios das técnicas MDS e PCA,

bem como dos testes de Mantel.

• Multidimensional Scaling (MDS)

Corresponde a um conjunto de técnicas que permitem representar

geometricamente os objetos que neste trabalho correspondem a amostras

populacionais presentes num conjunto de dados, fornecendo uma visualização espacial

da distância entre esses objetos. São técnicas que recorrem a métodos não-lineares de

redução dimensional. Cada ponto presente num gráfico, obtido por MDS, corresponde

a um dos objetos do conjunto de dados. Os objetos são agrupados de acordo com a

distância existente entre os diferentes pares, sendo que objetos mais próximos são

representados por pontos geometricamente mais próximos de modo a preservar as

distâncias entre objetos.

Os dados devem representar a semelhança/diferença entre os objetos. Quando

estão em causa comparações entre populações, os dados correspondem a matrizes de

distâncias genéticas e os objetos a populações. A cada objeto são atribuídas

coordenadas geográficas para cada uma das dimensões estudadas [65] [66]. Neste

estudo será utilizado um tipo de MDS designado de classical Multidimensional Scaling

(cMDS) que recorre a dados provenientes de uma só matriz de semelhança,

representando-os depois num gráfico que se optou sempre por ter apenas duas

dimensões por permitir visualizar melhor as distâncias entre populações.

• PCA (análise de componentes principais)

É também uma das técnicas de redução dimensional que tem como principal

objetivo reduzir o número de dimensões existente num conjunto de dados mantendo a

maior parte da sua variabilidade. Isto é feito através da combinação linear de variáveis,

que estão correlacionadas, em variáveis não relacionadas designadas de componentes

principais. Estes são caracterizados sequencialmente para que o primeiro componente

compreenda a maior parte da variação total do conjunto de dados. O número de


20

componentes varia consoante os dados, mas é em regra menor que o número de

dimensões iniciais [19, 67]. Os componentes principais podem depois ser representados

visualmente integrando diferentes números de componentes. Neste trabalho, utilizaram-

se os 2 primeiros componentes principais que foram representados num gráfico 2D. A

vantagem do PCA relativamente a MDS reside em não utilizar matrizes de distâncias

genéticas e, por conseguinte, não ser influenciado pela formulação das distâncias

dependendo exclusivamente da relação matemática entre as variáveis em jogo, que nos

nossos dados são frequências alélicas.

• Teste de Mantel

É um teste que avalia a correlação entre dados contidos em duas matrizes da

mesma ordem. As matrizes resumem as diferenças entre pares de amostras agrupando-

as num só conjunto de dados. Pelo facto de se utilizarem matrizes, os dados a comparar

podem ser de diversos tipos confrontando assim diferentes variáveis [68]. Foi

inicialmente desenhado com o propósito de ser utilizado em ecologia [69], no entanto, é

atualmente usado em muitas áreas, incluindo na genética populacional para avaliar a

relação entre a distância genética com a geográfica entre populações [70], ou seja, para

perceber se há uma relação entre a distribuição geográfica dos indivíduos e a sua

semelhança/diferença genética. Neste trabalho, será utilizado para este mesmo

propósito, mas também para relacionar diversas matrizes genéticas entre si.


21

4. Resultados e discussão

4.1. Diversidade nos ucranianos residentes em Portugal

Na maior parte das amostras foi possível obter perfis de boa qualidade, ou seja,

relativamente limpos, e com um pico ou dois por marcador, consoante se tratasse de

produtos de amplificação de homozigóticos ou heterozigóticos, respetivamente, para um

dado locus. Em alguns perfis registou-se a presença de stutters, sendo sempre

facilmente identificados, uma vez que não representavam mais do que 5-10% da altura

dos “verdadeiros” picos. A Figura 3 representa um eletroferograma referente a 4 dos 16

STRs testados.

Para chegar a resultados como o que se ilustra na Figura 3, foi necessário

proceder ao ajuste da quantidade de ADN para efetuar o multiplex PCR nas amostras

em que a quantificação prévia revelou excesso de ADN. Nestes casos, e sem proceder

a diluição pré-PCR, obtinham-se picos demasiado intensos e desdobrados, ainda que

não comprometessem a identificação dos alelos a que correspondiam. Apesar disso, a

quantidade de amostra foi sempre ajustada de forma a se conseguir perfis de melhor

qualidade.

Figura 3. Eletroferograma referente a 4 dos STRs testados obtido para um dos indivíduos estudados

Num dos indivíduos analisados, detetou-se um padrão de mistura, que se

replicou após diversas amplificações sem nunca se conseguir isolar um perfil único.

Muito provavelmente tal resultou de um problema de contaminação da amostra durante

a respetiva colheita ou armazenamento, pelo que esta amostra foi descartada do estudo.


22

Sendo assim, o conjunto amostral passou a ser constituído por 72 ucranianos, não

relacionados, a residir em Portugal.

Foram detetados alelos off-ladder em diversos indivíduos, ou seja, alelos cujos

produtos de amplificação apresentavam tamanhos não coincidentes com os alelos de

referência contidos nos ladders alélicos dos diferentes loci [6]. Um desses alelos, até se

encontrava fora do intervalo de tamanhos previsto no ladder específico para esse

marcador, tratando-se do alelo 15 no locus FGA, cuja “escada” alélica de referência

continha desde o alelo 17 ao 51.2. O resultado foi o mesmo após re-amplificação da

amostra do indivíduo em questão, o que confirmou a presença de um perfil alélico para

FGA contendo o alelo 15. Através da consulta da Short Tandem Repeat DNA Internet

DataBase (http://www.cstl.nist.gov/strbase/) verificou-se que esse alelo já tinha sido

identificado, encontrando-se em 1 heterozigótico no total de 4514 indivíduos contidos

nessa base de dados (consultada em 12 de janeiro de 2017) [71].

Pelo facto de o indivíduo portador deste alelo ser um dos que se suspeitava estar

relacionado com um outro indivíduo também inicialmente estudado, foi possível

proceder-se à comparação do perfil com o da alegada filha (não incluída neste estudo),

verificando-se que nesta também estava presente o mesmo alelo, ou seja o alelo

FGA*15.

A presença de alelos raros numa população pode ser de extrema importância

pois torna os perfis genotípicos que os possuem mais facilmente distinguíveis dos

demais, permitindo obter valores de razões de verossimilhança (LR) superiores, tanto

para investigações de identidade como de paternidade. No caso especifico da

averiguação de paternidade acima mencionado, os valores de LR para os 16 STRs

tipados variaram entre 0,9 e 4,5, mas, para o locus FGA, devido ao alelo raro 15, o valor

de LR obtido foi 36. Sendo um valor bastante elevado, contribuiu para o aumento

substancial do valor do LR global, que assumindo a ausência de linkage calcula-se pela

multiplicação dos valores obtidos para os diferentes loci. Neste caso, sem o FGA o LR

era 481 217, e incluindo esse locus o LR era 17 334 897, valores que indicam ser meio

milhão ou 17 milhões, respetivamente, de vezes mais provável a obtenção dos

resultados segundo a hipótese de o alegado pai ser o pai biológico, do que segundo a

hipótese de o pai ser um homem ao acaso da mesma população. Fica, assim, clara a

grande diferença e segurança que se obtém ao incluir um marcador que possuía um

alelo tão raro.

http://www.cstl.nist.gov/strbase/


23

Os outros alelos off-ladder detetados, foram o alelo 18 nos loci D19S433 e

D1S1656, e os alelos 23 e 34 no locus SE33, estando todos descritos na literatura e/ou

referenciados nas bases de dados (com frequência na ordem dos 0,1%), e

inclusivamente já tendo sido identificados com o kit NGM Select [71], ao contrário do

alelo anteriormente referido, FGA*15.

Foram encontrados diversos alelos não consensuais ou microvariantes, ou seja,

alelos com um número de repetições não completo, cujo número por locus variou entre

1 e 15, tendo sido detetado 1 alelo deste tipo para os loci TH01 e D2S441, 3 para o

locus D12S391, 4 para os loci D21S11 e D1S1656, 5 para o locus D19S433 e 15 para

o locus SE33. Os restantes loci, não apesentavam alelos microvariantes na amostra

populacional estudada. Observaram-se também dois alelos microvariantes off-ladder,

ambos no locus D12S391, nomeadamente os alelos 17.3 e 18.3, já descritos na

literatura [72].

O número de alelos por locus está representado na figura 4, tendo-se registado

uma variação entre 5 e 28. As frequências alélicas para os diversos loci encontram-se

representadas na tabela 2. Alelos com frequência abaixo de 0,01, ou seja, aqueles com

a presença relativamente esporádica na população, são convencionalmente designados

de alelos raros [73]. Como já foi referido anteriormente, os alelos raros podem ser de

extrema importância pois tornam os perfis daqueles que os possuem mais fáceis de ser

distinguidos dos demais, levando a valores de razões de verossimilhança (LR), quer

02468

1012141618202224262830

Número de alelos Número de alelos raros

Figura 4. Número de alelos e de alelos raros presentes em cada um dos loci analisados


24

para identidades ou paternidades, superiores aos produzidos por alelos mais

frequentes. Vários alelos foram detetados em heterozigotia num único indivíduo do total

de 72 analisados, implicado, pois, um valor de frequência de 0,00694. O número de

alelos nesta condição, para cada locus, encontra-se também descrito na Figura 4.

Os valores de heterozigotia esperada e observada para cada locus estão

representados na Tabela 2, assim como os respetivos desvios padrões. De um modo

geral, os valores de heterozigotia esperada e observada diferem pouco entre si. A

discrepância mais acentuada observou-se no locus D18S51, onde o valor de

heterozigotia observado era 10% inferior ao esperado. No entanto, nem esta divergência

se revelou ser estatisticamente significativa, a avaliar pelos resultados obtidos nos

testes de EHW cujos valores de p associados se encontram também representados na

Tabela 2. Verificou-se que em 15 dos 16 loci testados os valores de p eram superiores

a 0,05, indicando que as distribuições genotípicas se encontravam dentro dos valores

esperados, o que permite aceitar a hipótese nula do teste, ou seja, a que assume EHW

para determinado locus. A exceção observada foi precisamente no locus D18S51,

anteriormente referido pela discrepância entre heterozigotia observada e esperada,

relativamente ao qual o p associado ao teste de EHW foi de 0,04210. No entanto,

quando se aplicou a correção de Bonferroni, usada normalmente com o objetivo de

controlar a quantidade de erros (falsos-positivos) cometidos, reduzindo o nível de

significância crítico de acordo com o número de testes realizados [74], o valor pD18S51 =

0,04210 deixou de ser estatisticamente significativo, uma vez que era superior ao limite

de confiança estatística reassumido, que passou a ser 0,00313 (0,05/16 iterações).

O facto de não haver desvios ao equilíbrio após a correção de Bonferroni,

permite concluir que os alelos foram herdados aleatoriamente e que fenómenos de

migração, subestruturação, seleção natural e mutação não influenciavam a amostra

populacional em estudo, permitindo assim assumir EHW nas análises estatísticas

posteriores. Por outro lado, a ausência de desvios ao EHW, não faz levantar suspeitas

sobre a existência de alelos nulos, o que poderia constituir um fator de enviesamento

dos resultados obtidos na genotipagem [6, 47].

Ainda relativamente aos níveis de heterozigotia observada por locus, o valor

máximo foi de 94,4 % para o locus SE33 e o mínimo de 70,8 % para o locus D10S1248,

correspondendo assim, respetivamente, aos loci com maior e menor variabilidade

genética de entre os 16 STRs estudados. Na Tabela 2 também se apresenta a

heterozigotia média e os desvios padrão estimados para a amostra de emigrantes

ucranianos a residir em Portugal. O valor de heterozigotia média encontra-se dentro da


25

gama de valores já reportados para outras populações europeias caraterizadas para o

mesmo kit, que ronda entre os 81 e 83 % [75].

O Polymorphic information content (PIC) variou desde 0,65153, no locus

D16S539, até 0,93817 no SE33. De acordo com os valores de PIC, de um modo geral

todos os loci são altamente polimórficos (PIC > 0,70), sendo o locus D16S539 aquele

com valor de PIC mais baixo, mas ainda na ordem dos 0,65. Por definição, os valores

de PIC são ligeiramente inferiores aos valores de heterozigotia esperada, mas

naturalmente que apresentam a mesma tendência de variação inter-loci que a registada

na heterozigotia esperada.

Também se pode constatar que o número de alelos por locus se relaciona

razoavelmente bem com o valor de PIC e heterozigotia e consequentemente com o grau

de polimorfismo, a diversidade genética e o poder informativo do locus. Em geral, os loci

com um maior número de alelos apresentam maiores valores nos parâmetros referidos.

No conjunto de marcadores que se analisou, SE33 era o locus com maior número de

alelos, sendo também o que possuía maiores valores de heterozigotia e PIC, assim

como de todos os outros parâmetros calculados.

No entanto, o locus com menor número de alelos, neste caso TH01, com 5 alelos,

apresentava valores de PIC e de heterozigotia observados elevados e superiores a

outros loci com maior número de alelos, como por exemplo o D10S1248 e o D16S539,

que apesar de terem um número de terem 7 alelos eram ambos menos polimórficos e

consequentemente menos informativos que o TH01. Isto revela que tanto o PIC como

He são fortemente determinados pela distribuição de frequências alélicas em cada

locus, e não apenas pelo número de variantes por locus.

Outros parâmetros estatísticos com grande interesse para o âmbito forense,

nomeadamente a matching probability, o poder de discriminação, a probabilidade de

exclusão e o índice de paternidade estão também representados na Tabela 2. Estes

parâmetros, quer referentes a cada marcador individualmente, quer à globalidade dos

marcadores contidos no kit, fornecem indicações sobre a sua utilidade em investigações

forenses.


26

Tabela 2. Tabela com os parâmetros forenses e populacionais estudados

Alelo Loci

D10S1248 vWA D16S539 D2S1338 D8S1179 D21S11 D18S51 D22S1045 D19S433 TH01 FGA D2S441 D3S1358 D1S1656 D12S391 SE33

6 - - - - - - - - - 0,21528 - - - - - -

7 - - - - - - - - - 0,12500 - - - - - -

8 - - 0,01389 - 0,00694 - - - - 0,13889 - - - - - -

9 - - 0,12500 - 0,01389 - - - - 0,21528 - - - - - -

9.3 - - - - - - - - - 0,30556 - - - - - -

10 - - 0,03472 - 0,07639 - 0,00694 - - - - 0,25694 - - - -

11 - - 0,27778 - 0,07639 - 0,00694 0,19444 - - - 0,26389 - 0,06250 - -

11.3 - - - - - - - - - - - 0,09722 - - - -

12 0,02778 - 0,34028 - 0,15278 - 0,05556 0,02083 0,05556 - - 0,02778 - 0,15278 - 0,00694

12.2 - - - - - - - - 0,00694 - - - - - - -

13 0,18750 - 0,18056 - 0,38194 - 0,16667 0,00694 0,26389 - - 0,05556 - 0,08333 - 0,02778

13.2 - - - - - - - - 0,05556 - - - - - - -

14 0,36111 0,11111 0,02778 - 0,17361 - 0,13889 0,04861 0,29167 - - 0,27083 0,13194 0,10417 0,00694 0,02083

14.2 - - - - - - - - 0,02778 - - - - - - -

15 0,26389 0,12500 - 0,00694 0,09028 - 0,15972 0,31250 0,15972 - 0,00694 0,02083 0,23611 0,10417 0,01389 0,04167

15.2 - - - - - - - - 0,02778 - - - - - - -

15.3 - - - - - - - - - - - - - 0,02778 - -

16 0,15278 0,14583 - 0,04167 0,02083 - 0,23611 0,30556 0,04861 - - 0,00694 0,23611 0,15972 0,04167 0,09028

16.2 - - - - - - - - 0,04167 - - - - - - -

16.3 - - - - - - - - - - - - - 0,05556 - -

17 0,00694 0,25694 - 0,28472 0,00694 - 0,09722 0,06944 0,00694 - - - 0,20139 0,01389 0,11806 0,03472

17.2 - - - - - - - - 0,00694 - - - - - - -

17.3 - - - - - - - - - - - - - 0,15972 0,00694 -

18 - 0,25694 - 0,06944 - - 0,04861 0,04167 0,00694 - 0,02083 - 0,18056 0,01389 0,27083 0,07639

18.3 - - - - - - - - - - - - - 0,06250 0,01389 -

19 - 0,09028 - 0,08333 - - 0,05556 - - - 0,08333 - 0,01389 - 0,09722 0,06250

19.3 - - - - - - - - - - - - - - 0,02083 -

20 - 0,01389 - 0,20833 - - 0,01389 - - - 0,18056 - - - 0,12500 0,09722

20.2 - - - - - - - - - - - - - - - 0,02083

21 - - - 0,03472 - - 0,00694 - - - 0,19444 - - - 0,09028 0,03472

21.2 - - - - - - - - - - - - - - - 0,02083

22 - - - 0,02778 - - 0,00694 - - - 0,18750 - - - 0,09722 0,01389

22.2 - - - - - - - - - - - - - - - 0,02083

23 - - - 0,10417 - - - - - - 0,10417 - - - 0,07639 0,00694

23.2 - - - - - - - - - - - - - - - 0,02083

24 - - - 0,08333 - - - - - - 0,12500 - - - 0,01389 -

24.2 - - - - - - - - - - - - - - - 0,00694


27

25 - - - 0,04167 - - - - - - 0,06250 - - - 0,00694 -

25.2 - - - - - - - - - - - - - - - 0,02083

26 - - - 0,01389 - - - - - - 0,03472 - - - - -

26.2 - - - - - - - - - - - - - - - 0,07639

27 - - - - - 0,02083 - - - - - - - - - -

27.2 - - - - - - - - - - - - - - - 0,09722

28 - - - - - 0,18750 - - - - - - - - - -

28.2 - - - - - - - - - - - - - - - 0,03472

29 - - - - - 0,17361 - - - - - - - - - -

29.2 - - - - - - - - - - - - - - - 0,06250

30 - - - - - 0,22222 - - - - - - - - - -

30.2 - - - - - 0,06944 - - - - - - - - - 0,04861

31 - - - - - 0,04167 - - - - - - - - - -

31.2 - - - - - 0,09028 - - - - - - - - - 0,01389

32 - - - - - 0,02778 - - - - - - - - - -

32.2 - - - - - 0,08333 - - - - - - - - - 0,00694

33.2 - - - - - 0,08333 - - - - - - - - - 0,02083

34 - - - - - - - - - - - - - - - 0,00694

34.2 - - - - - - - - - - - - - - - 0,00694

Ho 0,70833 0,81944 0,75000 0,83333 0,83333 0,88889 0,75000 0,83333 0,86111 0,81944 0,84722 0,83333 0,84722 0,91667 0,86111 0,94444

He 0,74582 0,81605 0,76195 0,84615 0,78555 0,86150 0,85927 0,76709 0,81342 0,78448 0,86140 0,78263 0,80332 0,89112 0,86733 0,94784

P 0,60766 0,62188 0,95300 0,22110 0,71997 0,75687 0,04210* 0,38836 0,27809 0,62214 0,45746 0,25520 0,99579 0,80110 0,46041 0,10571

PI 0,11090 0,06228 0,09776 0,04232 0,07385 0,03698 0,03803 0,09379 0,06114 0,08403 0,03765 0,08459 0,07259 0,02431 0,03237 0,00654

PD 0,88910 0,93772 0,90224 0,95768 0,92615 0,96302 0,96197 0,90621 0,93886 0,91597 0,96235 0,91541 0,92741 0,97569 0,96763 0,99346

PE 0,44126 0,63560 0,50977 0,66229 0,66229 0,77278 0,50977 0,66229 0,71688 0,63560 0,68939 0,66229 0,68939 0,82959 0,71688 0,88677

PIC 0,69701 0,75589 0,65153 0,82347 0,75461 0,83941 0,83679 0,72473 0,78359 0,74383 0,83867 0,74225 0,76606 0,87386 0,84817 0,93817

IP 1,71427 2,76916 2,00000 2,99994 2,99944 3,50005 2,00000 2,99994 3,59997 2,76916 3,27268 2,99994 3,27268 6,00024 3,59997 8,99928

PDc = 0,99999999999999999999829836 PEc = 0,99999999213598 Ho média = 0,83420 +/₋ 0,06011 He média = 0,82468 +/₋ 0,05465

Ho: heterozigotia observada. He: heterozigotia esperada. P: valor de p do teste exato do equilíbrio de Hardy-Weinberg. PI: matching

probability. PD: poder de discriminação. PE: probabilidade de exclusão. PIC: polymorphic information content. IP: índice de paternidade.

PDc: poder de discriminação combinado. PEc: probabilidade de exclusão combinado. * aplicando a correção de Bonferroni (p = 0,00313)

o valor deixa de ter significância estatística

Naturalmente que os valores de matching probability (PI) estão diretamente

relacionados com os valores do poder de discriminação, uma vez que se obtêm um do

outro através da subtração à unidade. Focando-nos no poder de discriminação, todos

os marcadores apresentavam valores elevados variando desde 0,88910 no locus

D10S1248 a 0,99346 no locus SE33. À semelhança do obtido com outros parâmetros,

baixos valores de PI caraterizavam os loci D10S1248 e D16S539 enquanto elevados


28

caraterizavam os loci D1S1656 e SE33. O poder de discriminação combinado para o

conjunto de marcadores analisado foi de 0,999999999999999999998, valor que sendo

manifestamente muito elevado confere ao conjunto de marcadores uma excelente

capacidade de discriminação entre indivíduos.

Relativamente à probabilidade de exclusão, os valores variam desde 0,44126

para o locus D10S1248 até 0,88677 para o SE33, sendo em regra mais baixos para loci

menos informativos (D10S1248 e D16S539) e mais elevados para os mais informativos

(SE33 e D1S1656), e concordantes com os valores do poder de discriminação. A

probabilidade de exclusão combinada para o conjunto de marcadores analisados é de

0, 999999992.

Os valores do índice de paternidade (IP) calculados para cada locus variam

entre 1,7 e 9, sendo o menor correspondente ao locus D10S1248 e o maior ao SE33,

também se verificando uma relação com o poder informativo obtido para os loci com

outros parâmetros e anteriormente observado para o poder de exclusão. Estes valores

pelo facto de estarem associados a um locus e não a um caso de paternidade específico

permitem inferir com que peso esse locus contribuirá para o índice de paternidade

combinado num caso específico. Sendo assim, tendo em conta os valores obtidos,

podemos concluir que os 2 loci mais polimórficos e com maior número de alelos raros

são D1S1656 e SE33, uma vez que lhes estão associados os maiores valores de IP e

de PE, enquanto os loci D10S1248 e D16S539 são os menos informativos por lhes

estarem associados valores mais baixos destes parâmetros. Outro marcador com baixo

poder informativo para paternidades é o D18S51.

O valor do índice de paternidade combinado associado aos loci contidos no kit

NGM Select é de 1,1 × 108, correspondendo a um valor de “probabilidade de

paternidade” (W = IP/(IP + 1)) de 0,999999991. Este valor associado ao valor de

0,999999992 para a probabilidade de exclusão, permite concluir que este kit tem

elevada capacidade para dar resposta a casos que envolvam averiguações de

paternidade.

Diversas características são necessárias para que um marcador possa ser

integrado na prática forense, nomeadamente ser de fácil deteção com a tecnologia

atualmente disponível (eletroforese capilar, por rotina), permitir estratégias de

amplificação que originem produtos de PCR de tamanho reduzido e com baixo teor em

artefactos ou stutters, não estar em linkage com outros marcadores que sejam

simultaneamente testados, e ainda possuir um elevado poder de discriminação e níveis


29

de heterozigotia superiores a 70% [7]. Podemos afirmar que todos os marcadores

presentes no kit NGM Select cumprem os requisitos anteriormente mencionados, e que

o kit no seu conjunto constitui uma ferramenta poderosa para discriminar os indivíduos

de origem ucraniana, que foram alvo deste estudo.

Resumindo as caraterísticas individuais dos marcadores contidos no kit, o locus

D10S1248 revela ser o menos informativo uma vez que os valores de heterozigotia, a

probabilidade de exclusão, o poder de discriminação, e o índice de paternidade são mais

reduzidos para este marcador, comparativamente com os outros. O único indicador que

não é o mais baixo para este locus é o PIC. O locus D16S539 ó o que apresenta o

menor valor de PIC, sendo este marcador também um dos menos informativos por

apresentar valores reduzidos para todos os parâmetros. Esta observação está de

acordo com os dados publicados para populações caucasianas e hispânicas analisadas

com este kit, onde os loci D22S1045, D10S1248 e D16S539 são em geral os menos

informativos [76].

Quanto aos loci mais informativos, sobressaem o D1S1556, pelos valores muito

elevados para todos os parâmetros que o posicionam em segundo lugar em termos

informativos, mas sobretudo o SE33, sem dúvida o locus mais informativo com valores

de PE, PD, PIC, IP e heterozigotia claramente superiores aos registados nos restantes

marcadores contidos no kit NGM Select. Como já se referiu este kit tem um marcador

a mais relativamente à versão original, o kit NGM que era constituído por todos os

European Standard Set STR (ESS), incluindo o marcador amelogenina, estabelecidos

pelo Conselho da União Europeia 2009/C296/01 a 30 de novembro de 2009 [7].

Compreende-se bem que o novo marcador introduzido na versão atualizada,

NGM Select, tenha sido o SE33. Estudos anteriores envolvendo populações hispânicas,

caucasianas e afro-americanas [76] já tinham realçado que a inclusão do SE33 num kit

“forense” era uma mais valia, conclusão que sai reforçada neste estudo efetuado com

uma amostra de indivíduos ucranianos.

De facto, em comparação com o kit NGM, o NGM Select, para esta mesma

amostra populacional, proporciona um PDcombinado 160 vezes superior, uma PEcombinado e

um IP 9 vezes superior e também um aumento de cerca de 0,8 % na heterozigotia média

observada. Em termos de aplicações forenses o NGM Select é, pois, mais vantajoso

que a versão anterior.


30

4.2. Estudo interpopulacional

Para efetuar comparações entre populações envolvendo áreas geográficas mais

ou menos abrangentes, foi necessário diminuir o número de marcadores comparados

sobretudo para populações asiáticas e fronteiras à Ucrânia, uma vez que não estavam

tipadas para todos os marcadores presentes no kit NGM Select. Sendo assim, durante

a descrição dos resultados, nos pontos seguintes, o número de marcadores e de

populações comparadas vai variando conforme foi discriminado na seção Material e

Métodos.

4.2.1. Intercontinental

Figura 5. Representação geográfica dos 46 países/zonas utilizados (a vermelho) na comparação genética efetuada com

os 10 marcadores descritos

CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. RE: Rússia Europeia. AZ: Azerbaijão. IQ: Iraque. TQ:

Turquia. AZ: África do Sul (população AmaXhosa). AO: Angola. MA: Marrocos. GL: Gronelândia. IS: Islândia. SE: Suécia.

NO: Noruega. FI: Finlândia. EE: Estónia. LV: Letónia. LT: Lituânia. BY: Bielorrússia. UA: Ucrânia. PL: Polônia. DK:

Dinamarca. DE: Alemanha. BE: Bélgica. NL: Holanda. FR: França. CH: Suíça. IT: Itália. AT: Áustria. CZ: Republica Checa.

SK: Eslováquia. HU: Hungria. RO: Roménia. MD: Moldávia. SI: Eslovénia. HR: Croácia. BA: Bósnia e Herzegovina. RS:

Sérvia. ME: Montenegro. AL: Albânia. MK: Macedónia. GR: Grécia. IE: Irlanda. GB: Reino Unido. ES: Espanha. PT:

Portugal.


31

Para avaliar a capacidade de distinção genética entre populações provenientes

de diferentes continentes foram produzidas duas matrizes de distâncias genéticas, uma

com FST e outra com (δμ)2, apresentadas no anexo 3 obtidas com base em frequências

genéticas. De modo a englobar amostras populacionais de diversos países da Europa,

Ásia e África assim como da Gronelândia, foi necessário reduzir o número de

marcadores para 10, sendo eles: vWA, D16S539, D2S1338, D8S1179, D21S11,

D18S51, D19S433, TH01, FGA e D3S1358.

Na Figura 5 estão assinalados os países, a que pertenciam as amostras,

utilizados nesta comparação.

4.2.1.1. Análise com a distância genética FST

A matriz de FSTs foi submetida à analise de MDS da qual resultou o gráfico que

se mostras na Figura 6, onde se pode observar que as duas populações subsarianas

(Angola e África do Sul) e as 3 da Ásia centro-leste (Cazaquistão, China e Sibéria) se

diferenciaram bem das populações Europeias, indicando, assim, que o conjunto de 10

marcadores usados na análise permite distinguir, razoavelmente, populações

geograficamente bastante separados, nomeadamente as que se localizam em

diferentes continentes, mas excluindo as de regiões fronteiriças.

Figura 6. Gráfico de Multidimensional scaling (MDS) para os valores de FST, obtidos a partir da comparação das

populações representadas na Figura 5 para os 10 marcadores anteriormente referidos Europa médio oriente

Ásia África Gronelândia (continente americano)

Esse gráfico revela ainda que populações de países do médio-oriente (Iraque,

Turquia), do oeste asiático (Azerbaijão) e até do Norte de África (Marrocos) ocupam

UcrâniaRoméniaPolóniaLituânia Albânia

EslovêniaEslovaquiaHungria Macedónia

Bósnia e HerzegovinaGréciaAustriaRepublica Checa

Alemanha

Finlândia

HolandaBélgica Suiça

ItáliaPortugal

EspanhaDinamarcaLetónia

EstóniaSérbiaMontenegro

Croácia

Noruega

França

Reino UnidoIrlanda

MoldáviaBielorussia

Suécia

IslândiaRussia (europeia)

Gronelândia

Casaquistão

Arzebeijão

Sibéria

China

Africa Sul (bantu)

Marrocos

Angola

IraqueTurquia

-0,03

-0,02

-0,01

0

0,01

0,02

0,03

-1,20E-02 -2,00E-03 8,00E-03 1,80E-02 2,80E-02 3,80E-02


32

posições intermédias no gradiente de diversidade que abrange as populações

euroasiáticas, ainda que globalmente se agrupem mais próximo das populações

Europeias que das central-asiáticas. Destaca-se ainda a Gronelândia pela enorme

diferenciação relativamente a qualquer outra população.

Na Tabela 3 compilam-se os valores de FST retirados da matriz completa de FST,

depois de terem sido agrupados consoante envolviam populações das seguintes

regiões: médio oriente, África subsariana, Europa, Ásia centro-oriental, oeste da Ásia

(Azerbaijão), norte de África (Marrocos) e Gronelândia.

Tabela 3. Variação nos valores da distância de FST (em percentagem) entre 7 regiões definidas (médio oriente, Europa,

Ásia (oeste), Ásia (centro-oriental), Norte de África, África subsariana e Gronelândia)

médio

oriente Europa Ásia (oeste)

Ásia

(centro-

oriental)

Norte África África Gronelândia

médio oriente 0,1 0,4-0,9 0,1-0,2 1,1-2 0,7-0,8 2,6-3,1 4,6

Europa 0,4-0,9 0-0,8 0,3-1,1 1,9-3,8 0,5-1,6 3-4,8 5,2-6,1

Ásia (oeste) 0,1-0,2 0,3-1,1 - 0,8-2 0,9 2,8-3,2 5,2

Ásia (centro-

oriental) 1,1-2 1,9-3,8 0,8-2 0,3-1 1,5-2,6 3,1-4,3 4,2-5,6

Norte África 0,7-0,8 0,5-1,6 0,9 1,5-2,6 - 2,5-3 5,1

África

subsariana 2,6-3,1 3-4,8 2,8-3,2 3,1-4,3 2,5-3 0,6 4,6-5,5

Gronelândia 4,6 5,2-6,1 4,2 4,2-5,6 5,1 4,6-5,5 -

Analisando a Tabela 3 constata-se que as distâncias entre populações das

mesmas zonas geográficas (valores a azul na linha diagonal) são todas inferiores a 1%

e estatisticamente não significativos (anexo 4 e seção 4.2.3), sendo que o maior valor

se observou entre populações da Ásia (centro-oriental), e os menores entre populações

da Europa ou do médio-oriente (ressalvando que no médio-oriente só se compararam

dois países, Iraque e Turquia). Em geral, os intervalos de FST dentro de cada região são

mais baixos que os observados entre regiões diferentes.

Atendendo aos intervalos de FST entre regiões, pode inferir-se que o médio

oriente está mais relacionado geneticamente com o oeste asiático, europa e Norte de

África (por esta ordem) do que com a Ásia centro-oriental, África subsariana e

Gronelândia. Que o oeste asiático tem mais afinidades com o médio oriente, Europa e

norte de África do que com o resto do continente asiático. E que o mesmo acontece com


33

o Norte de África, no sentido de diferir em geral menos de populações do médio-oriente,

Europa e oeste asiático do que das populações da África subsariana.

Não se observaram diferenças estatisticamente significativas entre as regiões:

Norte de África, oeste asiático, Europa e médio oriente (anexo 4). Esta observação era

expectável, uma vez que, mesmo recorrendo a um elevado número de marcadores de

STR, não se consegue diferenciar bem as zonas anteriormente mencionadas [77].

Quanto aos valores de distância entre regiões geograficamente mais afastadas,

Ásia centro-oriental, África subsariana, Europa e Gronelândia, assinalados a vermelho

na tabela, os maiores encontram-se entre a Gronelândia e qualquer uma das outras

regiões (4,2-6,1%), e os seguintes são os que separam a África subsariana das

restantes regiões (3,1-4,8%). Em comparação, o intervalo de distâncias entre

populações da Europa e da Ásia centro-oriental é bem mais baixo (1,9-3,8%).

A marcada diferenciação da Gronelândia é em parte devida ao isolamento da

região e dos seus habitantes, o que contribuiu para uma diminuição da diversidade

genética na população desta grande ilha. Analisando em diferentes populações os

valores de heterozigotia para cada marcador e a respetiva heterozigotia média, é

evidente a reduzida diversidade dos gronelandeses. Na Figura 7, onde se representam

os valores de heterozigotia, por marcador, para os 46 países, consegue-se visualizar

claramente os picos de decréscimo de heterozigotia na Gronelândia em relação aos

restantes países, o que também se regista nos valores de heterozigotia média dado que

na Gronelândia estes eram de 77% e nos outros países variavam entre 80-83%.

Certamente que a diferença de diversidade contribui para inflacionar os valores de FST

entre a Gronelândia e os restantes países.

Excluindo a Gronelândia, os FSTs entre África subsariana, Ásia e Europa variaram

entre 1,9 e 4,8%, sendo valores em média baixos e inferiores aos reportados em estudos

baseados em painéis com maior número de marcadores (9-12%) [78]. Usando como

referência o trabalho de Rosenberg et al. 2002, em que foram analisados 377 STRs

não-forenses, os valores de FST rondaram 4,3-5,7% [13], ou seja, superiores aos

observados neste estudo. Mas já no estudo realizado por Silva et al, 2012 baseado

apenas em 10 ou 13 STRs forenses (mais especificamente do CODIS) [79] e em grupos

populacionais definidos segundo o mesmo critério de Rosenberg et al. 2002, os valores

obtidos eram mais baixos (2,3-2,7%) e claramente mais próximos dos nossos.


34

Figura 7. Valores de heterozigotia para os 10 marcadores referidos anteriormente, para as 46 populações utilizadas na

comparação

Silva et al., 2012 também calcularam distâncias tendo em conta 434 loci

tetraméricos não-forenses e as populações do HGDP-CEPH (Human Genome Diversity

Cell Line Panel), chegando a valores que subiram até 5,3%, sendo todos superiores aos

obtidos com marcadores forenses. Esta observação permitiu concluir que as menores

diferenciações capturadas pelos marcadores forenses refletem no fundo o facto de estes

marcadores serem selecionados em função da eficiência na identificação individual, ou

seja, muito mais pelo nível de diversidade em geral do que pela capacidade em detetar

subestruturação entre os grandes grupos populacionais humanos. Dai que no conjunto

se caracterizem por menor variância interpopulacional que a média registada para

STRs, tendendo, pois, a produzir distâncias genéticas inferiores às que decorrem da

análise de marcadores neutros não-forenses. Os resultados obtidos neste trabalho

reforçam bem esta ideia.

Existem, no entanto, investigações forenses em que é importante referir a

ancestralidade genética de uma amostra, o que implica recorrer a marcadores com

elevada capacidade para discriminar grandes grupos populacionais humanos. Por isso,

têm sido desenvolvidos esforços para otimizar baterias de marcadores contendo um

número relativamente reduzido de loci (como convém na rotina forense) mas,

selecionados especificamente pela capacidade em detetar acentuada divergência entre

0,52

0,57

0,62

0,67

0,72

0,77

0,82

0,87U

crân

ia

Ro

mén

ia

Po

lón

ia

Litu

ânia

Alb

ânia

Esl

ovê

nia

Iraq

ue

Turq

uia

Eslo

vaq

uia

Hu

ngr

ia

Mac

edó

nia

Bo

snia

e H

erze

gow

ina

Gré

cia

Au

stri

a

Rep

ub

lica

Ch

eca

Ale

man

ha

Fin

lân

dia

Ho

lan

da

Bél

gica

Suiç

a

Itál

ia

Po

rtu

gal

Esp

anh

a

Din

amar

ca

Gro

nel

ând

ia

Cas

aqu

istã

o

Letó

nia

Estó

nia

Sérb

ia

Mo

nte

neg

ro

Cro

ácia

No

rueg

a

Fran

ça

Rei

no

Un

ido

Irla

nd

a

Mo

ldáv

ia

Bie

loru

ssia

Suéc

ia

Islâ

nd

ia

Arz

ebei

jão

Ru

ssia

Sib

éria

Ch

ina

Afr

icaS

ul

Mar

roco

s

An

gola


35

indivíduos de diferentes zonas geográficas (continentes). Esse tipo de marcadores são

habitualmente designados de ancestry informative markers (AIMs), existindo já vários

kits de AIMs, quer de tipo STR, SNP ou INDEL, que permitem obter suficiente distinção

com números razoáveis de marcadores [24, 80].

Comparando os nossos resultados de diferenciação intercontinental com os

baseados em AIMs, não é de estranhar que o padrão de relacionamento entre grandes

grupos populacionais seja menos vincado que o obtido com AIMs. Mas também não se

estranha que o nível de diferenciação detetado seja muito semelhante ao encontrado

em trabalhos recentes baseados em outros conjuntos de STRs usados em identificação

forense, nomeadamente 15 do kit Identifiler ou 20 incluindo os do Identifiler mais os 5

novos ESS, trabalhos esses em que também foi avaliada a capacidade desses

marcadores permitirem inferir corretamente a ancestralidade, tendo registado erros de

atribuição de ancestralidade entre 10 e 15 % [81, 82].

Dentro da Europa, o padrão de subestruturação populacional obtido com este

conjunto de 10 marcadores é muito pouco claro, e ao contrário do que tem sido

frequentemente descrito [25, 32, 33], não é evidente a sua associação com a geografia,

o que se explica novamente pelo, reduzido número de marcadores e critérios que

presidiram à sua seleção. Mais a frente, na secção 4.2.3. o nível europeu será discutido

em maior pormenor.

4.2.1.2. Análise com a distância genética (δμ)2

Também se efetuou MDS com a matriz de distância (δμ)2, e a respetiva

representação gráfica aparece na Figura 8. Tal como no gráfico de FSTS, neste observa-

se na mesma o distanciamento claro das duas populações subsarianas, bem como o

posicionamento das populações da Ásia centro-oriental num cluster perto daquele que

inclui as populações Europeias.

Existem, porém, algumas discrepâncias no relacionamento entre populações

que se infere quando se usam distâncias (δμ)2, que têm em conta o stepwise mutation

model (SMM), ou distâncias FST, que assumem o infinite alleles model. Uma das mais

acentuadas é relativamente à Gronelândia que com base em (δμ)2 surge, totalmente

integrada num grande cluster que engloba populações do continente Europeu, onde

também se integram as amostras do Iraque, Turquia e Azerbaijão, que não se observava

com os dados de FST. Outra discrepância que sobressai respeita a população de

Marrocos que aparece bem diferenciada no gráfico baseado em (δμ)2.


36

Figura 8. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos a partir da comparação das

populações representadas na Figura 5 para os 10 marcadores anteriormente referidos Europa médio oriente

Ásia África Gronelândia (continente americano)

Apesar destas desconformidades, quando se testou a relação entre as matrizes

de (δμ)2 e FST, o valor da regressão linear obtido foi 0,7194, com p=0,01, o que mostra

haver forte correlação entre as duas distâncias, apesar de em ambos os casos serem

inferiores às descritas com base em maior número de marcadores [83].

As diferenças no padrão de relacionamento interpopulacional obtido com as

duas medidas de distância genética, podem explicar-se atendendo às distintas

propriedades e limitações de (δμ)2 e FST. Como o nível de diferenciação em populações

subestruturadas depende muito de acontecimentos de mutação e migração, o FST pode

levar a subestimativas dessa diferenciação por não entrar em linha de conta com o

modelo de mutação mais adequado aos STRs [84]. Apesar desse modelo ser assumido

em (δμ)2, esta medida é, no entanto, muito sensível à taxa de mutação de cada STR,

que como está bem documentado pode variar muito de locus para locus. Já foi

demonstrado que alguns STRs são capazes de produzir distâncias invulgarmente

elevadas, sendo capazes de dominar o valor médio de (δμ)2, muito provavelmente

devido às elevadas taxas de mutação que os caracterizam [58]. A título ilustrativo pode

referir-se o trabalho de Goldstein et al., 1995, que com base no estudo de 30 marcadores

em diferentes populações humanas, encontraram diferenciações interpopulacionais

substancialmente diferentes quando recorreram a (δμ)2 comparativamente às obtidas

com outras distâncias, muito devido à grande variação dos (δμ)2 [58].

Tal como se fez com os valores de FST, na Tabela 4 apresentam-se os intervalos

de variação de (δμ)2 observados nas mesmas regiões consideradas na Tabela 3.

UcrâniaRoménia

Polónia

Lituânia

AlbâniaEslovênia

EslovaquiaHungriaMacedónia

Bósnia e HerzegovinaGrécia

AustriaRepublica ChecaAlemanha

Finlândia

HolandaBélgicaSuiça

Itália PortugalEspanha

Dinamarca

LetóniaEstónia

SérbiaMontenegroCroácia

Noruega

FrançaReino UnidoIrlanda

MoldáviaBielorussia

SuéciaIslândiaRussia (europeia)Gronelândia

Arzebeijão

Casaquistão

Sibéria

China

Africa Sul (bantu)

Marrocos

AngolaIraque

Turquia

-0,36

-0,26

-0,16

-0,06

0,04

0,14

0,24

-0,2 -0,1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7


37

Tabela 4. Variação nos valores da distância de (δμ)2 entre 7 regiões definidas (médio oriente, Europa, Ásia (oeste),

Ásia (centro-oriental), Norte de África, África e Gronelândia)

médio oriente Europa Ásia (oeste) Ásia (centro-

oriental) Norte África África Gronelândia

médio oriente 0,053 0,055-0,175 0,032-0,039 0,050 - 0,167 0,227-0,328 0,405-0,705 0,125-0,188

Europa 0,055-0,175 0,004-0,251 0,028-0,205 0,105-0,497 0,100-0,47 0,469-0,911 0,225-0,484

Ásia (oeste) 0,032-0,039 0,028-0,205 - 0,093-0,229 0,210 0,528-0,716 0,188

Ásia (centro-

oriental) 0,050-0,167 0,105-0,497 0,093-0,229 0,039-0,045 0,452-0,643 0,391-0,612 0,179-0,310

Norte África 0,227-0,328 0,100-0,470 0,210 0,452-0,643 - 0,570-0,842 0,394

África 0,405-0,705 0,469-0,911 0,528-0,716 0,391-0,612 0,570-0,842 0,131 0,561-0,809

Gronelândia 0,125-0,188 0,225-0,484 0,188 0,179-0,310 0,394 0,561-0,809 -

Analisando a Tabela 4 consegue-se perceber que, ao contrário do observado

com FST, não existe uma linha muito clara a separar diferenciações intra e

intercontinental, uma vez que alguns dos valores de diferença intracontinentais (linha

diagonal) são superiores aos intercontinentais, como se observa, por exemplo, nas

distâncias da Holanda e Lituânia relativamente aos países Europeus superiores às que

apresentam relativamente ao Cazaquistão.

Ao contrário do observado com FST a diferença entre médio oriente e o Norte de

África é elevada, embora menor do que em relação ao restante continente africano. O

oeste asiático parece estar mais relacionado com o médio oriente do que com as

restantes zonas geográficas, não se observando a proximidade à Europa que se obtinha

com os FST. A diferença entre o norte de África e as restantes zonas mostra um padrão

semelhante ao observado com os dados de FST, apesar do afastamento ser maior.

Os intervalos de variação de (δμ)2 referentes às comparações intercontinentais

(Ásia centro-oriental, África subsariana, Europa), assinalados a vermelho na Tabela 4,

revelam que as maiores diferenciações se encontram entre populações de África

subsariana e populações europeias ou da Ásia centro-oriental, enquanto que que as

menores envolvem pares em que uma população é a Ásia centro-oriental e a outra da

Europa.

Estes valores de diferenciação intercontinental são em média inferiores aos

valores de (δμ)2 obtidos num outro estudo que utilizou um painel de 213 marcadores

(0,481-2,436) [84]. O elevado número de marcadores, em relação aos aqui estudados,

pode em parte explicar a diferença observada, mas a causa principal reside

provavelmente no facto de neste trabalho se terem usado apenas marcadores forenses,


38

contribuindo para um certo enviesamento dos resultados, na medida em que estes

marcadores são tipicamente escolhidos para diferenciar indivíduos da mesma

população não sendo os mais adequados para captar a divergência entre indivíduos de

populações distintas, e dai possuírem valores de (δμ)2 inferiores aos obtidos com painéis

de STR selecionados com outros critérios [79].

Numa apreciação global dos resultados obtidos com FST e (δμ)2 na análise

comparativa a nível intercontinental, o panorama de relacionamento populacional

produzido por FSTs parece enquadrar-se melhor com o que se sabe sobre a história

desses grandes grupos populacionais. Apesar de (δμ)2 ter sido desenvolvida entrando

em conta com o modelo de mutação especifico para STRs, nem sempre se comporta

melhor que o convencional FST, especialmente quando se avaliam diferenciações

populacionais que ocorreram em escalas temporais bastantes distintas [84].

4.2.1.3. Testes de Mantel

Aplicou-se o teste de Mantel para avaliar se no conjunto de populações

consideradas havia relação entre as distâncias genéticas obtidas com FST e (δμ)2 e

distâncias geográficas. Os valores de R2 obtidos foram de 0,5956 e 0,562, ambos

associados a p=0,01, para os dados de FST e (δμ)2, respetivamente. Estas correlações

significativas vão ao encontro do descrito na literatura, evidenciando uma clara relação

entre distâncias geográficas e genéticas, mesmo quando se utiliza um reduzido número

de marcadores [83]. Os valores de R2 agora obtidos, apesar de serem ambos

relativamente elevados, mostram que a correlação entre diferenciação medida por FST

e distância geográfica é ligeiramente mais forte, o que também está de acordo com o

que está reportado [83].

4.2.2. Fronteira Europa-Ásia/ fronteira Ucrânia

4.2.2.1. Fronteira Europa-Ásia

De forma a estudar a capacidade dos marcadores contidos no kit NGM SelectTM

para discriminar populações de países localizados na fronteira entre a Europa-

Ásia/fronteira Ucrânia, e perceber se através destes marcadores é possível distinguir a

Ucrânia dos seus países vizinhos, repetiram-se as análises apresentados no ponto

anterior com os mesmos 10 marcadores mencionados, mas restringindo os países aos

que se encontram representados na Figura 9.


39

Figura 9. Representação geográfica dos 18 países/zonas utilizados (a vermelho) na comparação genética efetuada com

os 10 marcadores descritos no ponto 4.2.1.

CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. RE: Rússia Europeia. AZ: Azerbaijão. SE: Suécia. FI: Finlândia. EE:

Estónia. LV: Letónia. LT: Lituânia. BY: Bielorrússia. UA: Ucrânia. PL: Polônia. SK: Eslováquia. HU: Hungria. RO:

Roménia. MD: Moldávia. MK: Macedónia.

O gráfico de MDS, baseado em FST, encontra-se na Figura 10.

Figura 10. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a partir da comparação das

populações representadas na Figura 9 para os 10 marcadores referidos no ponto 4.2.1. Europa Ásia

Ucrânia

RoméniaPolónia

Lituânia

Eslovaquia

HungriaMacedónia

Finlândia

Letónia

Estónia

Moldávia

Bielorrússia

Suécia

Rússia

Cazaquistão

Azerbeijão

Sibéria ("Sul")

China-0,0045

-0,0025

-0,0005

0,0015

0,0035

0,0055

-0,0115 -0,0065 -0,0015 0,0035 0,0085 0,0135 0,0185 0,0235 0,0285


40

Como é possível observar através da análise da Figura 10, com os dados de

FST, consegue-se uma clara separação entre populações dos países asiáticos e dos

europeus, sendo, no entanto, visível a relativa proximidade entre sudoeste asiáticos (do

Azerbaijão) e sudeste Europeus (da Roménia). Aliás, as 3 populações asiáticas,

mostram um grau de diferenciação do cluster europeu, que está razoavelmente de

acordo com o respetivo afastamento geográfico.

Os valores de distância de FST entre populações são os mesmos já descritos no

ponto 4.2.1., mas destaca-se agora que as distâncias genéticas entre os países

Europeus variaram entre 0 e 0,8%, enquanto que a distância dos países Europeus em

relação à Ucrânia variou entre 0 e 0,6%. Por outro lado, a distância entre o Azerbaijão

e a Ucrânia foi de 0,7% e a distância entre os países do leste asiático (o Cazaquistão,

a China ou a Sibéria) e a Ucrânia variou entre 1,5, 2,4 e 3,3%, respetivamente. Estes

dados indicam que, independentemente da proximidade geográfica, a Ucrânia

apresenta maior proximidade genética com os países europeus, do que com qualquer

um dos países asiáticos.

A análise de FST locus a locus, revelou um menor número de loci com distâncias

significativas entre a Roménia (Europa) e o Azerbaijão (4 loci significativos, para um

nível de significância de 0,05), do que entre o Azerbaijão e os restantes países da Ásia

(seção 4.2.1.), refletindo o que já tinha sido comentado na seção 4.2.1. sobre a

constatação de que populações de países asiáticos localizados na fronteira com a

Europa apresentarem mais afinidades com populações da Europa do que com as outras

populações localizadas no continente asiático.

Com os valores da diferenciação genética produzidos por (δμ)2, obteve-se um

padrão de relacionamento interpopulacional globalmente semelhante ao observado

através dos dados de FST. Analisando o heatmap (Figura 11) da matriz da distância

genética de (δμ)2 é possível observar a separação dos países asiáticos dos restantes

países europeus e a maior proximidade do Azerbaijão (sudoeste da Ásia) com a

Roménia (Europa) do que com as outras populações asiáticas.

Nesta zona de fronteira entre a Europa e a Ásia, as distâncias genéticas também

se correlacionam bem com a distribuição geográfica dos países. Os valores de R2

obtidos com o teste de Mantel foram 0,9089 e 0,6374 para as distâncias de FST e (δμ)2,

respetivamente, sendo ambos estatisticamente significativos (p = 0,01). Comparando

estes valores com os obtidos anteriormente para o nível geográfico mais global (R2 de

0,5956 e 0,562 e p de 0,01 para FST e (δμ)2, respetivamente), verifica-se que a


41

correlação é até mais forte nesta zona da Eurásia, o que significa que a distribuição da

diversidade genética é muito influenciada pelas barreiras geográficas.

CN SS KZ AZ MO RO MK UA BY RE PL HU SK LV EE SE FI LT

CN

SS

KZ

AZ

MO

RO

MK

UA

BY

RE

PL

HU

SK

LV

EE

SE

FI

LT

Figura 11. Heatmap da matriz da distância genética de (δμ)2 para as populações estudadas.

CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. AZ. Azerbaijão. MD: Moldávia. RO: Roménia. MK:

Macedónia. UA: Ucrânia. BY: Bielorrússia. RE: Rússia Europeia. PL: Polônia. HU: Hungria. SK: Eslováquia. LV: Letónia.

EE: Estónia. SE: Suécia. FI: Finlândia. LT: Lituânia.

4.2.2.2. Fronteira Ucrânia

Para restringir a análise aos países fronteiros à Ucrânia, foram produzidos novos

gráficos de MDS e PCA tendo apenas em conta os países relevantes.

Na Figura 12 apresentam-se dois gráficos de MDS produzidos a partir das

distâncias genéticas, FST e (δμ)2, e de dois gráficos de PCA construídos, respetivamente,

a partir das frequências alélicas e da heterozigotia para os 10 marcadores. Como se

pode constatar, apesar de algumas diferenças que decorrem dos próprios métodos e

das variáveis utilizadas, os gráficos são bastante coerentes entre si, destacando-se em

especial as semelhanças entre os gráficos c) e d), ambos resultantes de PCA, e o gráfico

a) que se refere ao MDS efetuado com base em distâncias FST.


42

Figura 12. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráficos de PCA para frequências alélicas e heterozigotia

(a), b), c) e d) respetivamente) obtidos a partir da comparação das populações europeias representadas na Figura 9 que

são fronteiras à Ucrânia, para os 10 marcadores referidos no ponto 4.2.1. este da Europa sudeste da Europa

centro da Europa Norte da Europa

UcrâniaBielorrússia

Rússia

RoméniaMacedónia

Moldávia

Polónia

Lituânia

EslovaquiaHungria

LetóniaEstónia

Finlândia

Suécia

a) MDS FST


Rússia

RoméniaMacedónia

Moldávia

Polónia

Lituânia

EslovaquiaHungria

Letónia

Estónia

Finlândia

Suécia

b) MDS (δμ)2


Rússia

Roménia

MacedóniaMoldávia

Polónia

Lituânia

EslovaquiaHungria

Letónia

Estónia

Finlândia

Suécia

15 %

da v

aria

ção e

xplic

ada

12% da variação explicada

c) PCA frequências alélicas


Rússia

Roménia

Macedónia

Moldávia

Polónia

Lituânia

Eslovaquia

Hungria

Letónia

Estónia

Finlândia

Suécia

39%

da v

aria

ção e

xplic

ada

25% da variação explicada

d) PCA heterozigotia


43

Nos gráficos a) e c) é possível observar um gradiente de diversidade desde os

países do sudeste, passando pelos do centro/este, até aos do norte da Europa,

distinguindo-se bem os grupos de populações destas três zonas. Esta observação indica

mais uma vez que a geografia é um fator importante de subestruturação populacional

no território ocupado pela Ucrânia e os países fronteiriços.

Realça-se, por exemplo, que os países bálticos do norte da europa,

nomeadamente a Lituânia, Letónia e Estónia, tendem a posicionar-se nos gráficos a) e

c) próximos dos países escandinavos, Finlândia e Suécia, dando consistência a um

grupo constituído por populações da europa setentrional. Já as populações da Europa

centro/oriental ocupam em geral posições mais centrais nos gráficos, refletindo, assim,

uma certa diferenciação que permite sustentar um grupo formado por populações da

europa de leste.

Tendo em conta os valores de heterozigotia obteve-se o gráfico d), onde os

padrões acima referidos se distinguem, mas com menos clareza, essencialmente devido

à posição da Estónia, que neste gráfico aparece deslocada do grupo da Europa

setentrional.

No gráfico b), resultante da aplicação de MDS à matriz de distâncias (δμ)2, o

padrão de suestruturação populacional é bastante mais irregular que nos restantes 3

gráficos. Observa-se alguma separação entre o norte e o centro/este, mas é estranha a

posição da Ucrânia e da Lituânia que para além de aparecem muito deslocadas dos

restantes países, não revelam as afinidades populacionais que transparecem nos

restantes gráficos. De um modo geral, esta medida parece ter menor capacidade para

captar padrões de diferenciação interpopulacional.

Com este conjunto de marcadores, é possível perceber visualmente alguma

separação geográfica entre as zonas geograficamente definidas dentro da europa e

alguma correlação com a localização geográfica dos países, apesar de haver algumas

incoerências. No entanto, como as distâncias entre os países comparados não são

estatisticamente significativas, não será de esperar observar a mesma visualização

gráfica com outro tipo de softwares de cluster, como por exemplo o STRUCTURE no

qual não é possível perceber a distância gráfica entre os diferentes países estudados.

Este último software não seria útil para este efeito, nem mesmo com um recurso

a um número mais elevado de marcadores. É possível também observar um gradiente

de sul (e sudeste) para norte. A relação entre os diferentes países da Europa será mais


44

aprofundada de seguida, usando um maior número de países e de marcadores nas

referidas comparações.

4.2.3. Europa

De forma a aprofundar a análise da distribuição genética europeia, foram

escolhidas populações do continente Europeu que estivessem caracterizadas para a

maioria dos marcadores contidos no kit NGM Select. A comparação incidiu sobre 15 dos

16 marcadores presentes neste kit, tendo sido excluído o marcador SE33 para o qual

havia poucos dados disponíveis. Esses 15 marcadores coincidem com os do painel do

kit NGM (ou seja, a versão anterior do kit NGM Select), que são os seguintes: D3S1358,

vWA, D16S539, D2S1338, D8S1179, D21S11, D18S51, D19S433, TH01, FGA,

D10S1248, D22S1045, D2S441, D1S1656 e D12S391.

Os 31 países considerados estão representados na Figura 13.

Figura 13. Representação geográfica dos 31 países Europeus (a vermelho) utilizados na comparação genética efetuada

com os 15 marcadores descritos anteriormente

NO: Noruega. FI: Finlândia. EE: Estónia. LV: Letónia. LT: Lituânia. UA: Ucrânia. PL: Polônia. DK: Dinamarca.

DE: Alemanha. BE: Bélgica. NL: Holanda. FR: França. CH: Suíça. IT: Itália. AT: Áustria. CZ: Republica Checa. SK:

Eslováquia. HU: Hungria. RO: Roménia. SI: Eslovénia. HR: Croácia. BA: Bósnia e Herzegovina. RS: Sérvia. ME:

Montenegro. AL: Albânia. MK: Macedónia. GR: Grécia. IE: Irlanda. GB: Reino Unido. ES: Espanha. PT: Portugal.


45

Figura 14. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráfico de PCA para frequências alélicas (a), b) e c)

respetivamente) obtidos a partir da comparação das populações europeias representadas na Figura 13 este da

Europa sudeste da Europa centro da Europa norte da Europa oeste da Europa sul da Europa

Ucrânia

Roménia

Albânia

Macedónia

Bosnia e Herzegovina

Grécia

Montenegro

Sérbia

Polónia

Lituânia

EslovêniaEslovaquiaHungria

Áustria Repub…

AlemanhaSuiça

Croácia

Letónia

Estónia

Finlândia

NoruegaDinamarca

Holanda

Bélgica

França

Reino Unido

Irlanda

Espanha

Portugal

Itália

a) MDS FST

Ucrânia

Roménia

Albânia

MacedóniaBosnia e Herzegovina

Grécia

MontenegroSérbia

Polónia

Lituânia

Eslovênia

Eslovaquia

HungriaÁustria

Republica Checa

Alemanha

Suiça

Croácia

LetóniaEstónia

Finlândia

NoruegaDinamarca

Holanda

BélgicaFrança

Reino Unido

Irlanda

Espanha

Portugal

Itália

b) MDS (δμ)2

Ucrânia

Roménia

Albânia

Macedónia

Bosnia e Herzegovina

Grécia

Montenegro

Sérbia

Polónia

Lituânia

Eslovênia

EslovaquiaHungria

Áustria

Republica Checa

AlemanhaSuiça

Croácia

LetóniaEstónia

Finlândia

NoruegaDinamarca

HolandaBélgica

França

Reino Unido

Irlanda

Espanha Portugal

Itália 9,3

% d

a va

riaç

ão e

xplic

ada

8,2 % da variação explicada

c) PCA frequências alélicas


46

Na Figura 14 apresentam-se os gráficos obtidos depois de aplicar o MDS a

matrizes de FST e (δμ)2 e o gráfico de PCA baseado em frequências alélicas. Os gráficos

estão representados.

No gráfico 14 a), o eixo dos Y retém um gradiente de diferenciação com

orientação Norte-Sul, dado que os países do Sul (assinalados por pontos vermelhos e

laranja) dominam a parte inferior do gráfico, enquanto que os restantes países (pontos

verde, azul e lilás) tendem a posicionar-se na parte superior. No eixo dos X também se

observa um gradiente de diferenciação, mas com orientação Este-Oeste, de tal modo

que nas partes esquerda e direita do gráfico predominam países do Oeste e do Este da

Europa, respetivamente. Consegue-se, portanto, separar com aproximação razoável os

países em 4 (quatro) zonas geográficas distintas: sul, oeste/norte, centro/este e sudeste,

cada uma ocupando predominantemente um dos quatro quadrantes do gráfico,

dividindo o gráfico em quatro quadrantes.

No entanto, chama-se a atenção, que este padrão de subestruturação

populacional foi inferido a partir de valores de diferenciação genética que não eram

estatisticamente significativos, ou seja, todos os valores de FST estavam associados a

p>5%.

Por outro lado, a relação entre localização geográfica e clusters de populações

não é de todo absoluta. Alguns clusters contêm populações de regiões que não

correspondem àquela a que estão globalmente associados. Por exemplo, a Bósnia e

Herzegovina, está integrada no grupo dos países de centro/este (verde e azul escuro)

e não no grupo dos países do sudeste da Europa onde foi integrada de acordo com o

critério geográfico, que na realidade também é bastante arbitrário. Neste caso, essa

arbitrariedade é manifesta, pois a Bósnia e Herzegovina é um dos países que está na

fronteira da região que se definiu como sudeste.

Também a Alemanha, a Áustria e a Suíça estão geneticamente agrupados com

os países de oeste/norte (azul claro e roxo), o que não se estranha visto que os 3 países

estão mais próximos do oeste europeu, não só do ponto de vista geográfico, mas

também cultural e histórico, do que com os países leste europeu. A Noruega e a

Dinamarca revelam grande afinidade com os países de oeste (azul claro), o que não

acontece com a Finlândia, que apesar da sua posição de outsider, está mais perto dos

países considerados de centro como a Lituânia, Letónia e Estónia (verde), que por sua

vez se encontram ligeiramente afastados dos restantes países de centro, bem de acordo

com a sua localização geográfica.


47

A Finlândia sobressai por aparecer muito diferenciada de todos os outros países

incluindo do norte da Europa, mas esta observação vai ao encontro do descrito sobre

os finlandeses no contexto de diversidade europeu [32].

No global, a relação que se encontrou entre a distribuição geográfica e a

distribuição da diversidade genética é até algo surpreendente atendendo ao reduzido

número de marcadores considerado e ao facto de todos fazerem parte de um kit de

rotina forense. Estudos efetuados com um maior número de marcadores, incluindo

STRs, SNPs ou ambos, conduziram a resultados mais satisfatórios, e têm mostrado que

é possível inferir com bastante precisão a origem geográfica na Europa de uma

população e até de indivíduos com base nas suas caraterísticas genéticas [20, 33, 85].

Neste trabalho, baseado em 15 STRs forenses, confirmou-se que a geografia é

um dos principais fatores que contribuem para a distribuição da diversidade genética na

Europa. Ao mesmo tempo, a não deteção de diferenças estatisticamente significativas

entre as populações europeias pode representar uma mais valia em contexto forense,

na medida em que na ausência de uma base de dados especifica de uma certa

população talvez tivesse sentido recorrer a uma base de dados mais abrangente

representativa da sub-região geográfica em que essa população se localizasse.

A Figura 14 b) representa o gráfico de MDS baseado em distâncias (δμ)2, onde

também é possível observar o gradiente de diversidade entre populações do sul e do

norte. De um modo geral os resultados são concordantes com os obtidos com FST

(Figura 14 a)), embora se perca resolução na discriminação de populações do oeste e

do este e se alterem as posições relativas de algumas populações, nomeadamente a

Ucrânia, a Holanda, a Finlândia e a Lituânia.

Para obter uma representação não enviesada por distâncias genéticas foi

produzido o gráfico de PCA com base nas frequências alélicas que se apresenta na

Figura 14 c). O padrão de relacionamento interpopulacional aproxima-se novamente

bastante mais do obtido com MDS baseado em FST (Figura 14 a)) do que com o MDS

efetuado com (δμ)2 (Figura 14 b)).

O gráfico de PCA foi construído usando dois componentes principais da análise

efetuada, um dos quais aparenta estar relacionado com a latitude e o outro com a

longitude. No sentido de confirmar esta perceção, foi feita a análise da relação entre

essas variáveis e as coordenadas dos 3 primeiros componentes principais que

contribuem mais para a variância entre populações. Na Figura 15 mostram-se os

resultados obtidos, que permitem concluir que o componente 1, o que contribui mais


48

para a variância total, está significativamente relacionado com a latitude, ao contrário

dos outros componentes, que o componente 2 está significativamente relacionado com

a longitude, e que o componente 3 não está correlacionado nem com latitude nem

longitude. As correlações significativas estavam ambas associadas a valores de R2

muito elevados, e á semelhança do observado em outros estudos, a latitude tem maior

peso que a longitude na variação genética europeia [25, 32, 86], como, aliás o gráfico

de PCA retrata.

Figura 15. Relação entre a latitude/longitude e os componentes principais (1,2 e 3) para o gráfico de PCA das frequências

alélicas das populações europeias

Fazendo a mesma análise com as coordenadas dos gráficos de MDS (Tabela 5)

também se verificou que a latitude estava mais fortemente relacionada com a variável

[,1] do que com a [,2] independentemente da distância genética utilizada, embora a

correlação seja menos forte quando se considera a distância de (δμ)2, como está bem

patenteado nos gráficos a) e b) da Figura 14.

Todos estes resultados indicam que o principal eixo de variação genético

europeu parece ser principalmente influenciado pela distribuição dos países em função

da sua latitude.

y = -0,1396x + 6,7964R² = 0,7468

p = 3,7585E-10

-2,2

-0,2

1,8

37 47 57

PC1 vs latitudey = 0,0295x - 1,4358

R² = 0,0333p= 0,3256

-2,2

-0,2

1,8

37 57

PC2 vs latitudey = -0,0204x + 0,9933

R² = 0,016p = 0,4984

-1,4

-0,4

0,6

1,6

35 45 55

PC3 vs latitude

y = -0,0155x + 0,2233R² = 0,0246p = 0,3990

-2,2

-0,2

1,8

-11

PC1 vs longitudey = -0,0776x + 1,1178

R² = 0,6178p = 1,61E-07

-2,2

-0,2

1,8

-11

PC2 vs longitude

y = 0,006x - 0,0868R² = 0,0037p = 0,74433

-4

-2

0

2

-11 9 29

PC3 vs longitude


49

Tabela 5. Relação entre a latitude/longitude e as variáveis [,1] e [,2] para os gráficos de MDS das distâncias genéticas

entre as populações europeias estudadas

Latitude Longitude

Equação R2 p Equação R2 p

FST

[,1] Y = 0,0002x -0,0121 0,6893 7,6E-9 y = -2E-05x + 0,0002 0,0069 0,6578

[,2] Y = 3E-05x - 0,0014 0,0171 0,4829 y = 0,0001x - 0,0016 0,6226 1,3E-7

(δμ)2

[,1] y = -0,0037x + 0,1778 0,439 4,9E-5 y = -0,0011x + 0,0154 0,101 0,0814

[,2] y = 0,0017x - 0,0805 0,1625 0,0245 y = -0,0013x + 0,0183 0,2569 0,0036

Na Tabela 6 apresentam-se as médias das distâncias FST entre populações

pertencentes às diferentes zonas geográficas definidas (abaixo da diagonal) e a gama

de variação das distâncias (acima da diagonal).

Tabela 6. Distâncias de FST médias e desvio padrão entre as zonas europeias definidas no gráfico da Figura 14.

Norte Oeste Centro Este Sul Sudeste

Norte … 0,0006-0,0051 0,0015-0,0056 0,0021-0,0052 0,0030-0,0073 0,0034-0,0079

Oeste 0,0029 … 0,0005-0,0037 0,0013-0,0050 0,0011-0,0036 0,0025-0,0055

Centro 0,0035 0,0021 … 0,0009-0,0025 0,0014-0,0049 0,0014-0,0049

Este 0,0037 0,0032 0,0017 … 0,0031-0,0042 0,0018-0,0039

Sul 0,0051 0,0023 0,0031 0,0037 … 0,0021-0,0052

sudeste 0,0057 0,004 0,0029 0,0029 0,0036 …

Norte Oeste Centro Este Sul Sudeste

0,0024

(0,0006-0,0043)

0,0008

(0-0,0019)

0,0016

(0,0004-0,0027) 0

0,0018

(0,0005-0,0030)

0,0019

(0,0007-0,0031)

Globalmente, as distâncias médias são muito baixas, sempre inferiores a 1% e

variando entre 0,17 e 0,57%, o que se enquadra dentro dos valores descritos na

literatura [32]. Ainda assim, as diferenciações mais acentuadas encontram-se entre

populações do Norte e as do Sul ou sudeste, enquanto que as diferenciações menores

se registam entre populações do centro e as do este ou oeste. Dentro de cada grupo

geográfico as distâncias médias são muito baixas, mesmo no grupo do Norte onde se


50

observa a média intra-grupo mais elevada, muito devida à marcada diferenciação da

Finlândia.

Compreende-se que a geografia seja um fator importante de subestruturação

populacional na Europa, pois representa uma barreira ao fluxo genético entre

populações que se estabeleceu com as diversas vagas de migração que se observaram

ao longo dos tempos. Entre as grandes movimentações populacionais que mais

afetaram a distribuição genética europeia, pode-se enumerar, a que resultou na

substituição dos neandertais pelos humanos modernos, que vindos do Médio Oriente

entraram na Europa ainda durante o período paleolítico há cerca de 40 000 anos, a

repopulação da Europa após a última época glaciar a partir dos refúgios localizados a

sul já durante o período mesolítico (18 000 anos), uma migração com origem no Levante

que após o inicio do neolítico (10 000 anos), resultou na introdução e dispersão da

agricultura por todo o continente [27, 87, 88], e já na idade do Bronze.

Para explorar melhor o gradiente de diversidade entre o sul e o norte da Europa,

foi estudada a relação entre distância em graus de latitude relativamente ao “sul

europeu” e heterozigotia média ou distância genética de FST para os 15 marcadores. A

análise foi efetuada considerando a diferença de latitude entre dois pontos (populações),

a diferença de heterozigotias ou distância genética entre os mesmos dois pontos, e

usando como ponto de referência o país com o valor de latitude mais baixa, que neste

caso era a Grécia, relativamente à qual se calculou a diferença de latitude. Da análise

da regressão linear efetuada resultaram os gráficos da Figura 16.

Entre a distância ao “sul europeu” e a diferença na heterozigotia média (Figura

16 a)) observou-se uma correlação negativa significativa (R2=0,3884; p=0,0002), o que

significa que há um decréscimo na heterozigotia média à medida que as populações se

distanciam do sul em direção ao norte. Entre a distância genética e distância ao “sul

europeu” (Figura 16 b)) também se detetou correlação significativa e até mais forte

(R2=0,4196; p=0,00008), mas com declive positivo, o que significa que a distância

genética aumenta segundo o eixo de orientação vertical.

Estes resultados, mostram um gradiente de sul para norte que é consistente com

o descrito na literatura [32], e que tem sido associado aos acontecimentos migratórios

após a última época glaciar [87].


51

Figura 16. Relação entre a variação na heterozigotia/ distância genética para os 15 marcadores e a distância em graus

de latitude ao “sul europeu” este da Europa sudeste da Europa centro da Europa norte da Europa

oeste da Europa sul da Europa

Com o intuito de avaliar o gradiente de diversidade em função de um eixo

sudeste-noroeste, efetuou-se análise semelhante à anterior, mas considerando como

novo eixo de referência a linha que atravessa a Turquia (sudeste) e a Islândia

(noroeste). Foram calculadas novas coordenadas em função desse eixo, a partir do qual

se obtiveram os valores de latitude diretamente, e os de longitude através da

perpendicular ao eixo. Considerou-se como referência a Grécia, por ser o país que se

localiza mais a sudeste.

ucraniaRoménia

Polónia

Lituânia

Albânia

Eslovênia

Eslovaquia

HungriaMacedónia

Bósnia e Herzegovina

Grécia

Áustria Republica Checa

Alemanha

Finlândia

Holanda

Bélgica

SuiçaItália

Portugal

Espanha

Dinamarca

Letónia Estónia

SérbiaMontenegro

Croácia

Noruega

França

Reino Unido

Irlanda

y = -0,0004x + 0,0031R² = 0,3884p = 0,0002

-0,015

-0,01

-0,005

0

0,005

0,01

0 5 10 15 20 25

a)

Ucrânia

Roménia

Polónia

Lituânia

Albânia

Eslovênia EslovaquiaHungria

Macedónia


Grécia

Austria

República Checa

Alemanha

Finlândia

Holanda

BélgicaSuiça

Itália

Portugal

Espanha

Dinamarca

Letónia

Estónia

SérbiaMontenegro

Croácia

Noruega

França

Reino Unido

Irlanda

y = 0,0002x + 0,0014R² = 0,4196p = 0,00008

0

0,001

0,002

0,003

0,004

0,005

0,006

0,007

0,008

0,009

0,01

0 5 10 15 20 25

b)


52

Figura 17. Relação entre a variação na heterozigotia/ distância genética para os 15 marcadores e a distância em graus

de latitude ao Levante este da Europa sudeste da Europa centro da Europa norte da Europa oeste

da Europa sul da Europa

Na Figura 17 a) estão apresentados os resultados da análise de correlação entre

heterozigotia média e distância à Grécia, em que se obteve um valor relativamente baixo

de R2 embora estatisticamente significativo (R2=0,18; p=0,0181), de declive negativo, o

que indica que a heterozigotia tende a diminuir um pouco consoante o aumento da

distância ao “sudeste”. O valor de R2 foi substancialmente superior quando na análise

se usaram distâncias FST (Figura 17 b)), sendo da mesma ordem de grandeza do que

se obteve na correlação com o eixo norte-sul (R2 =0,4165, p=0,00009), e estando

igualmente associado a uma reta de declive positivo.

ucraniaRoménia

Polónia

Lituânia

Albânia

Eslovênia

Eslovaquia

HungriaMacedónia


Grécia

Áustria

República Checa

Alemanha

Finlândia

Holanda

Bélgica

Suiça

Itália

Portugal

Espanha

Dinamarca

Letónia

Estónia

SérbiaMontenegro

Croácia

Noruega

França

Reino Unido

Irlanda

y = -0,0002x + 0,0023R² = 0,1778p = 0,0181

-0,0115

-0,0095

-0,0075

-0,0055

-0,0035

-0,0015

0,0005

0,0025

0,0045

0,0065

0 5 10 15 20 25 30

a)

Ucrânia

Roménia

Polónia

Lituânia

Albânia

EslovêniaEslovaquia

Hungria

MacedóniaBósnia e Herzegovina

Grécia

Áustria

República Checa

Alemanha

Finlândia

Holanda

BélgicaSuiça

Itália

Portugal

Espanha

Dinamarca

Letónia

Estónia

SérbiaMontenegro

Croácia

Noruega

FrançaReino Unido

Irlanda

y = 0,0002x + 0,0009R² = 0,4165p = 0,00009

0

0,001

0,002

0,003

0,004

0,005

0,006

0,007

0,008

0,009

0,01

0 5 10 15 20 25 30

b)


53

A presença na Europa de um gradiente de diversidade com orientação sudeste-

noroeste tem sido consistentemente detetado em diversos estudos baseados em

estratégias de análise variadas e grande densidade e tipo de marcadores genéticos [20,

27, 88-91] a maioria dos autores tem interpretado este gradiente como sendo a

assinatura genética deixada pela migração dos agricultores neolíticos que a partir do

Levante entraram na Europa, onde rapidamente a agricultura se difundiria por todo o

lado [30, 31, 88].

Finalmente, para avaliar o gradiente de diversidade entre o oeste e o este da

Europa, que poderia sinalizar a migração durante a Idade do Bronze a partir das estepes

asiáticas, foi estudada a relação entre distância em graus de longitude relativamente ao

“este” e heterozigotia média ou distância genética de FST para os 15 marcadores. A

análise foi conduzida procedendo ao mesmo método utilizado nas duas analises

anteriores, usando neste caso a diferença entre graus de longitude, e considerando

como ponto de referência o país com o valor de longitude mais alto, que neste caso era

a Ucrânia. Obtiveram-se os resultados expostos da Tabela 7.

Tabela 7. Regressão linear para a variação na distância genética FST ou heterozigotia em função da variação na

longitude

FST Heterozigotia

Longitude

Y = -3E-05x + 0,0025

R2 = 0,0337, p = 0,3318

Y = -4E-04x - 0,0007

R2 = 0,2155, p = 0,0098

Ao contrário do observado para os gradientes anteriores, não há relação entre a

distância genética e a distância ao este europeu. Quando se tem em conta os valores

de heterozigotia, a correlação é significativa (p = 0,0098), mas, no entanto, bem menor

que os valores observados nas análises anteriores.

Apesar destes resultados se basearem num escasso número de populações, em

conjunto parece indicar que os gradientes de diversidade europeia mais marcados são

o de orientação sudeste-noroeste, que é coerente com a expansão neolítica dos

agricultores, e o de orientação sul-norte possivelmente resultante da migração pós-

glaciar na Europa. Com a estratégia rudimentar e marcadores que se utilizaram, é pouco

percetível o gradiente este-oeste que previsivelmente poderia resultar das migrações

ocorridas durante a Idade do Bronze (3000 – 1000 a.C.), apesar de um componente

europeu com ancestralidade nas “estepes” ter sido claramente identificado com base na

análise simultânea de ADN antigo e moderno [35].


54

4.2.4. Kit NGM Select

De forma a tirar o máximo partido da caracterização genética da população

ucraniana quanto aos marcadores do kit NGM Select, foi ainda feito um estudo

comparativo com as 15 populações apresentadas na Tabela 8 para as quais havia

dados obtidos com o mesmo kit previamente publicados. Nessa tabela também se

apresentam os valores de FST de cada uma dessas outras populações relativamente à

Ucrânia, e os respetivos valores de p no anexo 5.

Nenhum dos países Europeus diferia significativamente da Ucrânia, bem como

o Iraque e Turquia. A Eslovênia é o país europeu com maior proximidade genética com

a Ucrânia, já que no conjunto dos 16 marcadores, só em dois apresentava valores de

FST positivos muitíssimo baixos. As distâncias da Ucrânia relativamente à Turquia e ao

Iraque eram, em média, superiores às registadas com os outros países Europeus, à

exceção da Holanda que apresentava valores semelhantes. Os outros países não

europeus, apresentaram valores de FST superiores e, na sua maioria significativos (p <

0,003 após a correção de Bonferroni), e os valores mais elevados envolviam a

Gronelândia e a África do Sul (população AmaXhosa). Estes resultados atestam a

capacidade satisfatória que este kit possui para discriminação intercontinental, embora

seja pouco eficaz para discriminar populações da Europa ou de regiões nas fronteiras

dos continentes.

Também se calcularam distâncias FST e (δμ)2 entre pares de populações (anexo

3), que foram depois utilizadas para obter os gráficos MDS que se encontram nas

Figuras 18 e 19.

O panorama geral que se obtém com base nos 16 STRs do kit, coincide

essencialmente com o que já se deduziu com o sub-conjunto de 10 desses STRs.

Centrando, porém, a atenção na amostra de ucranianos, a caraterização com o kit NGM

Select permite diferencia-la bem de populações não europeias. Dentro da Europa, onde

é muito baixo o nível de heterogeneidade populacional, a Ucrânia aparece muito bem

integrada no coletivo de populações. Entre elas, não se deteta agora relação entre

padrão de afinidades genéticas e geográfica (resultados não mostrados), provavelmente

pelo facto desta análise ter sido feita com um número de populações europeias muito

reduzido, perdendo-se assim a densidade populacional necessária para captar a

relação que se conseguiu encontrar com mais populações ainda com menos

marcadores.


55

Tabela 8. Comparação de FST locus a locus entre a Ucrânia e outros países já descritos na literatura

Ucrânia

vs

Lituânia

[75]

Albânia

[75]

Eslovêni

a [75]

Iraque

[75]

Turquia

[75]

Bósnia e

Herzegovi

na [92]

Alemanh

a [92]

Holanda

[93]

Espanh

a [94]

Dinamarc

a [95]

Gronel

ândia

[95]

Cazaquist

ão [96]

África do

Sul a [97]

China b[98]

Somália

[95]

SE33 0,00056 0,00334 -0,00082 0,00147 0,00014 0,00380 0,00027 0,00076 0,00307 -0,00094 0,03344 0,00961 0,00482 0,00679 0,00829

vWA -0,00943 -0,00466 -0,00017 -0,00738 -0,00313 -0,00611 -0,00245 0,03223 0,00742 -0,00425 0,00745 -0,00139 0,01682 0,01666 0,02376

D16S539 -0,00670 -0,00425 -0,00729 0,00373 0,00182 -0,00581 -0,00430 -0,00053 -0,00650 -0,00640 0,03249 0,01876 0,05003 0,02495 -0,00105

D2S1338 0,00740 -0,00000 -0,00147 0,00922 0,00537 -0,00430 -0,00027 0,00374 -0,00457 0,00199 0,08728 0,02528 0,05350 0,03787 0,04141

D8S1179 -0,00196 0,00299 -0,00346 0,00691 0,00189 -0,00446 -0,00377 -0,00419 0,00150 -0,00620 0,04797 0,00096 0,04255 0,02011 0,06793

D21S11 -0,00371 0,00493 -0,00459 -0,00324 -0,00839 -0,00619 -0,00195 -0,00015 0,00169 -0,00263 0,02208 0,01495 0,02483 0,02012 0,01601

D18S51 -0,00048 0,00401 0,00054 0,00372 -0,00338 -0,00258 0,00742 0,00880 0,00664 0,00448 0,01529 0,00827 0,01309 0,00061 0,02916

D19S433 -0,00821 -0,00202 0,00028 -0,00086 -0,00743 0,00471 -0,00326 -0,00041 -0,00416 -0,00182 0,02145 0,00233 0,00946 0,01379 0,00842

TH01 -0,00470 -0,00098 -0,00388 0,00384 0,00251 -0,00500 -0,00581 0,00151 -0,00327 -0,00297 0,23517 0,01831 0,11228 0,12323 0,07796

FGA -0,00538 -0,00209 -0,00561 0,00521 0,00563 -0,00469 -0,00580 -0,00333 -0,00512 -0,00764 0,03590 0,01847 0,00732 0,01457 0,02191

D3S1358 -0,00603 -0,00665 -0,00801 0,00098 0,00136 -0,00741 -0,00697 -0,00663 -0,00800 -0,00691 0,10140 0,01014 0,02624 0,01893 0,00963

D10S124

8 -0,00917 -0,00407 -0,00552 -0,01019 0,01158 -0,00378 0,00121 0,00871 0,00698 0,00364 0,01236 0,01420 0,02023 0,03666 0,00728

D22S104

5 -0,00797 -0,00585 -0,00709 0,00302 -0,00911 -0,00625 -0,00093 -0,00147 0,00837 -0,00244 0,03017 0,00422 0,01973 0,00415 0,01610

D2S441 -0,00784 0,00300 -0,00170 0,01226 0,00117 -0,00489 0,00311 0,00345 -0,00039 0,00479 0,06507 0,01863 0,03781 0,01921 0,02747

D1S1656 -0,00395 -0,00347 -0,00494 -0,00115 -0,00047 -0,00250 -0,00251 -0,00255 -0,00349 -0,00384 0,02350 0,01617 0,03281 0,04033 0,02721

D12S391 0,00143 -0,00219 -0,00657 -0,00416 -0,00283 -0,00401 -0,00093 -0,00028 -0,00168 -0,00343 0,03664 0,00416 0,00363 0,00446 0,01512

Os valores a azul representam valores de FST estatisticamente significativos para uma significância de 0,003 (p<0,003) após a correção de Bonferroni. Nota: os valores de p para estas comparações encontram-se no anexo 5.

a - indivíduos da população AmaXhosa da África do Sul falantes do bantu; b - população Han da província Fujian da China


56

Figura 18. Gráfico de Multidimensional scaling (MDS) para os valores de FST, obtidos a partir da comparação das

populações descritas anteriormente para o kit NGM Select. O gráfico a azul corresponde a um zoom in da área rodeada

a azul. Europa África Gronelândia (continente americano) Ásia Médio Oriente

Figura 19. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos a partir da comparação das

populações descritas anteriormente para o kit NGM Select. O gráfico a azul corresponde a um zoom in da área rodeada

a azul. Europa África Gronelândia (continente americano) Ásia Médio Oriente

Finalmente, e uma vez que o alvo de estudo era a amostra de ucranianos

residentes em Portugal, foi feita uma comparação mais fina com três regiões (Norte,

IraqueTurquia

Gronelândia

Casaquistão

China

Somália

África do Sul

-0,016

-0,011

-0,006

-0,001

0,004

0,009

0,014

0,019

0,024

0,029

-0,01 0 0,01 0,02 0,03 0,04

Ucrânia

Lituânia

Albânia

Eslovênia Bosnia e Herzegovina

Alemanha

Holanda

Espanha

Dinamarca

IraqueTurquia

Gronelândia

Cazaquistão

China

Somália

África do Sul

-0,1

-0,05

0

0,05

0,1

0,15

0,2

0,25

-0,65-0,150,350,851,35

Ucrânia

Lituânia

Albânia

Eslovênia Bósnia e HerzegovinaAlemanha

Holanda

Espanha

Dinamarca

-0,012

-0,01

-0,008

-0,006

-0,004

-0,002

-0,01 -0,008 -0,006 -0,004 -0,002

Ucrânia

Lituânia

Eslovênia


Alemanha

Holanda

Espanha

Dinamarca

-0,1

-0,09

-0,08

-0,07

-0,06

-0,05

-0,04

-0,03

-0,43-0,33-0,23-0,13-0,030,07


57

Centro e Sul) do país, considerando todos os marcadores do kit NGM Select, menos o

SE33, por não haver dados para todas as regiões. Os valores de FST e respetivos valores

de p para as três regiões encontram-se na Tabela 9.

Tabela 9. Valores de FST e respetivos valores de p para a comparação locus a locus entre a Ucrânia e 3 regiões (norte,

centro e sul) de Portugal

Ucrânia vs Norte Portugal [99] Centro Portugal [100] Sul Portugal [101]

FST p FST P FST p

SE33 … … … … … …

vWA -0,00137 0,48649 -0,00155 0,50450 -0,00156 0,54054

D16S539 -0,00435 0,63063 -0,00706 0,87387 -0,00224 0,58559

D2S1338 -0,00454 0,84685 -0,00573 0,84685 -0,00268 0,75676

D8S1179 0,00188 0,36937 -0,00007 0,43243 0,00515 0,14414

D21S11 -0,00009 0,41441 -0,00269 0,58559 -0,0019 0,63063

D18S51 0,00267 0,25225 0,00357 0,17117 0,00100 0,32432

D19S433 -0,00399 0,70270 -0,00614 0,78378 -0,00381 0,77477

TH01 -0,00665 0,89189 -0,00751 0,89189 -0,00408 0,72973

FGA -0,00798 0,99099 -0,00838 0,97297 -0,00537 0,95495

D3S1358 -0,00474 0,71171 -0,00560 0,69369 -0,00687 0,92793

D10S1248 0,00395 0,28829 0,00359 0,20721 0,00288 0,29730

D22S1045 0,00685 0,09009 0,00067 0,27027 -0,00047 0,42342

D2S441 0,00094 0,32432 0,00640 0,18919 0,00673 0,12613

D1S1656 -0,00304 0,67568 -0,00289 0,72973 -0,00127 0,56757

D12S391 0,00134 0,40541 -0,00654 0,93694 -0,00365 0,82883

Como era de esperar atendendo aos resultados já discutidos, os níveis de

divergência genética eram muito baixos, todos sem significância estatística, e o valor

mais elevado foi apenas de 0,7% com o Norte de Portugal no locus D22S1045.

4.3. Marcadores e distâncias genéticas

Para completar este estudo analisou-se a influência do número de marcadores

utilizados nos 2 tipos de distâncias utilizadas e consequentemente na capacidade de

detetar suestruturação populacional.

Começou-se por considerar apenas as 16 populações com dados publicados

para o kit NGM Select já listadas na Tabela 8, e com elas obteve-se matrizes de


58

distâncias FST e (δμ)2 mobilizando dados dos 16 STRs do kit mas também de 2

subconjuntos com 10 e 15 marcadores (já anteriormente identificados).

Estas matrizes foram então confrontadas com uma matriz de distâncias

geográfica entre populações, através da aplicação de testes de Mantel de que

resultaram os valores de R2 e p associados, que se mostram na Tabela 10.

Tabela 10. Valores de R2 e p para os testes de Mantel avaliando a relação entre a distância genética (FST ou (δμ)2) e

geográfica para 10, 15 e 16 marcadores

10 15 16

R2 p R2 p R2 p

(δμ)2 x distância geográfica 0,6065 0,01 0,6556 0,01 0,6864 0,01

FST x distância geográfica 0,8832 0,01 0,8898 0,01 0,8951 0,01

Como era de prever pelos resultados apresentados em secções anteriores, a

correlação entre distâncias genéticas e geográfica é mais forte quando a distância é

medida em FST do que em (δμ)2, mas independentemente da medida a correlação

aumenta com o número de marcadores.

De seguida, aplicaram-se testes de Mantel aos pares de matrizes obtidas com

FST ou (δμ)2 com base em 10, 15 e 16 marcadores, que conduziram aos valores

representados na Tabela 11.

Tabela 11. Valores de R2 e p para os testes de Mantel avaliando a relação entre as distâncias genéticas FST e (δμ)2,

para 10, 15 e 16 marcadores genéticos

10 15 (kit NGM) 16 (kit NGM Select)

R2 p R2 p R2 p

(δμ)2 x FST 0,4323 0,04 0,6106 0,02 0,4110 0,03

Verifica-se que a correlação entre matrizes de distâncias aumenta claramente

com o aumento de 10 para 15 marcadores, como é fácil compreender, mas, porém, com

16 marcadores a correlação entre as distâncias (δμ)2 e FST diminui muito, sendo até

inferior à que se observa com 10 marcadores. Para este resultado contribuiu certamente

o marcador SE33, que estava incluído no conjunto com 16 STR mas não nos conjuntos

com 10 ou 15 STRs. Mais à frente regressaremos a este marcador.


59

Na Tabela 12 encontra-se um quadro resumo dos valores obtidos para a

correlação entre as duas distâncias genéticas, em função do número de populações

analisadas, para cada marcador.

Tabela 12. Valores de R2 para os testes de Mantel entre as distâncias genéticas FST e (δμ)2, consoante o número de

populações estudadas

10 marcadores 15 marcadores (kit NGM) 16 marcadores (kit NGM Select)

16 populações 0,4323 0,6106 0,4110

27 populações - - 0,6560

35 populações - 0,8958 -

46 populações 0,7194 - -

Observando a tabela é possível concluir que, o número de populações parece

influenciar a relação observada entre as distâncias genéticas comparadas, uma vez que

os valores de R2 para o maior número de populações, para determinado número de

marcadores, parecem ser sempre superiores. Sendo assim, não só o número e tipo de

marcadores influência a relação entre as distâncias genéticas, mas também o número

e tipo de populações estudadas.

Por fim, fixando a distância (FST ou (δμ)2) compararam-se pares de matrizes

obtidas com 10 e 15 STRs, 10 e 16 STRs, e 15 e 16 STRs. Os valores de correlação

estão representados na tabela 13.

Tabela 13. Valores de R2 e p para os testes de Mantel avaliando a relação entre o número de marcadores para os

dados de FST e (δμ)2

10 x 15 10 x 16 15 x 16

R2 p R2 p R2 p

(δμ)2 0,9335 0,01 0,7914 0,01 0,8172 0,01

FST 0,9860 0,01 0,9817 0,01 0,9981 0,01

É possível observar que com (δμ)2 há maior correlação entre 10 e 15 marcadores

do que entre 10 e 16 ou 15 e 16, e que para o último par de marcadores a correlação é

menor que entre 10 e 16. Relativamente a FST, a maior correlação registada foi entre 15

e 16 marcadores e a menor entre 10 e 16, sendo esta muito parecida com a observada

entre 10 e 15.


60

Em conjunto, estes resultados permitem concluir que a introdução do marcador

SE33 influencia muito as alterações nos valores de distância genética especialmente no

caso de (δμ)2. A introdução de SE33 no cálculo de FST não parece induzir grandes

distorções na avaliação de diferenciação populacional. O comportamento diferente de

SE33 quando se utiliza (δμ)2 e FST aponta para a necessidade de interpretar com cautela

os resultados produzidos pelas duas medidas, pois têm propriedades muito diferentes.

O valor de heterozigotia para o SE33 varia entre 94-95%, sendo muito superior

aos 75-83% observados para os outros marcadores. Este pode ser um dos fatores que

contribui para o decréscimo de relação que se observa com a introdução do marcador

SE33, uma vez que a heterozigotia influencia muito as distâncias obtidas por (δμ)2 [84].

No sentido de entender melhor a contribuição de cada marcador para avaliar

diferenças interpopulacionais, foram comparadas as distâncias FST e (δμ)2 produzidas

individualmente por cada STR entre os pares de 16 populações, e calcularam-se os

valores médios conforme se apresenta na Figura 20.

Figura 20. Distribuição das distâncias genéticas médias entre as 16 populações referidas em 4.2.4. por locus

Olhando para os FST, constata-se que o valor produzido pelo marcador SE33

está enquadrado na gama de distribuição, embora seja um dos mais baixos da gama.

Pelo contrário, destaca-se bem o marcador TH01 que revela a diferenciação extrema

entre populações. Quanto a (δμ)2 observa-se uma maior variabilidade de valores,


61

havendo marcadores associados a distâncias pequenas e outros a distâncias muito

superiores, em especial o marcador SE33 que retém um nível de diferenciação

excessivamente elevado quando comparado com os restantes.

Como já foi referido anteriormente, alguns marcadores podem produzir valores

de (δμ)2 enviesadamente elevados, acabando por dominar o valor médio da distância

[58]. O marcador SE33 pode ser um desses marcadores, e será importante ponderar se

deve ou não ser excluído em comparações de populações baseadas em (δμ)2, uma vez

que afeta consideravelmente os resultados [84].

Na Figura 21 mostra-se a distribuição da heterozigotia por locus em 16

populações e os respetivos valores encontram-se no anexo 6.

Figura 21. Valores de heterozigotia para as populações analisadas, por locus

Procurando analisar a influência desses valores nos valores médios de FST por

locus, marcadores cujos níveis de heterozigotia variam pouco de população para

população, como a FGA, o SE33 e o vWA, estão associados a FST relativamente baios,

tendência que, no entanto, não se encontra com valores de (δμ)2. Pelo contrário, o TH01,

que apresenta elevada variação na heterozigotia entre populações, tem um valor médio

de FST muito elevado, mas com um (δμ)2 relativamente baixo. Mas já o D2S1338, o locus

com segundo valor mais elevado de FST e um valor intermédio de (δμ)2, carateriza-se

por baixa variação da heterozigotia entre populações. Em suma, não se encontrou

relação aparente entre valores de (δμ)2 produzidos por um dado locus e variação

D1S1656

D2S441

D2S1338

D3S1358

D8S1179

D10S1248

D12S391

D16S539

D18S51

D19S433

D21S11

D22S1045

FGA

SE33

TH01

vWA

0,67

0,72

0,77

0,82

0,87

0,92

0,97

Ucrânia Lituânia Albânia Eslovênia

Iraque Turquia Bósnia e Herzegovina Alemanha

Holanda Espanha Dinamarca Gronelândia

Casaquistão África do Sul China Somália


62

interpopulacional da heterozigotia. Esta variação parece exercer alguma influência

sobre o FST, não obstante as mesmas irregularidades detetadas de marcador para

marcador.

Quanto aos níveis de heterozigotia por locus, a relação parece mais regular (δμ)2,

em que os valores mais baixos ou altos se encontram geralmente em loci com valores

baixos ou altos de heterozigotia, respetivamente, do que com FST,

Também se analisou a influência do número de alelos por locus e variação entre

populações (Figura 22) nas medidas de distância.

Figura 22. Valor de número de alelos médio para as populações analisadas em 4.2.4. (exceto Gronelândia) e respetivo

desvio padrão por locus

Não se vislumbrou relação consistente entre número de alelos e distância de FST.

No entanto, os STRs com maior número de alelos e variação interpopulacional, SE33 e

a FGA, possuíam as distâncias de (δμ)2 mais elevadas.

Para reforçar estas observações, efetuou-se a análise de regressão linear

confrontando os valores de heterozigotia média, os desvios padrões respetivos e o

número de alelos com as duas distâncias genéticas, estando os resultados

apresentados na tabela 14.

D1S1656

D2S441

D2S1338

D3S1358

D8S1179D10S1248

D12S391

D16S539

D18S51

D19S433

D21S11

D22S1045

FGA

SE33

TH01

Vwa

5

10

15

20

25

30

35

40

45


63

Tabela 14. Regressão linear e o respetivo valor de R2 para a variação dos parâmetros estudados em função de duas

distâncias genéticas

(δμ)2 FST

Heterozigotia média (por marcador) y = 0,0713x + 0,7946

R² = 0,4574, p = 0,0040

y = -1,5925x + 0,8509

R² = 0,1141, p = 0,2007

Variação na heterozigotia (desvio padrão)

y = -0,7475x + 2,2382

R² = 0,1836, p = 0,0977

y = 49,069x + 1,0591

R² = 0,3952, p = 0,0091

Variação no número de alelos (desvio padrão)

y = 3,0625x + 1,0249

R² = 0,7802, p = 5,77E-06

y = -44,545x + 3,0098

R² = 0,0824, p = 0,2809

Confirmou-se que a distância (δμ)2 se correlacionava significativamente com a

variação no número de alelos (R2=0,7802; p<<<0,05), mas não com a variação na

heterozigotia. Com a distância FST acontece o contrário: correlacionava-se com a

variação na heterozigotia (R²=0,3952, p=0,0091), mas não com variação no número de

alelos.

Compreende-se, assim, alguns valores discrepantes entre (δμ)2 e FST,

destacando-se os produzidos pelo marcador SE33. Este marcador alia uma grande

variação no número de alelos (28-59, desvio padrão 8,7) a baixo valor de variação na

heterozigotia (desvio padrão 0,9), dois fatores que contribuíram para inflacionar muito o

valor de (δμ)2. O mesmo pode justificar o que se passa no marcador FGA, em que a

tendência é idêntica à observada em SE33, embora a discrepância entre valores de

(δμ)2 e FST seja menor.

Em oposição, o marcador TH01, caraterizado por elevada variação na

heterozigotia (desvio padrão 3,9) e reduzida variação no número de alelos (5-8, desvio

padrão 1,06), produz um FST muito elevado e um (δμ)2 baixo. De forma menos

acentuada, o mesmo acontece com o marcador D22S1045.


64

5. Conclusões

• Elevado nível de discriminação entre ucranianos obtido com o kit NGM Select

• Ausência de desvios ao equilíbrio de Hardy-Weinberg na amostra estudada

• Elevados valores de probabilidade de exclusão e poder de discriminação, que

reforçam o grande poder do kit NGM Select em análises de rotina forense, sendo

mais vantajoso que a sua versão anterior, o kit NGM

• Reduzida capacidade dos marcadores D10S1248 e D16S539, e elevada dos

marcadores D1S1556 e SE33 em análises de identificação e averiguações de

parentesco

• Ausência de subestruturação populacional entre a amostra de indivíduos ucranianos

residentes em Portugal e a população portuguesa

• Satisfatória capacidade do kit NGM Select de separação entre grandes grupos

populacionais, nomeadamente Ásia centro-oriental, África subsariana e Europa.

Reduzida capacidade quando se considera zonas fronteiras entre continentes, ou

zonas intracontinentais

• Capacidade satisfatória para diferenciar os indivíduos ucranianos da maior parte das

populações não europeias

• Padrão global de distribuição da diversidade genética na zona da Eurásia

maioritariamente definida pela geografia

• Reduzida heterogeneidade entre populações europeias

• Depois da geografia, os eixos sudeste-noroeste e sul-norte são os que se

correlacionam mais com a diversidade genética dos países europeus, em

consonância com a história demográfica da Europa muito ditada pelos movimentos

migratórios, nomeadamente no neolítico aquando da introdução da agricultura, e

mais tarde, após a última época glaciar, quando se registou importante repovoação

do continente

• Capacidade limitada dos marcadores de rotina forense para inferir ancestralidades

populacionais dentro do contexto europeu

• Conveniência em complementar os 16-STRs do kit NGM Select com marcadores

adicionais de forma a perceber melhor o padrão de distribuição genético na Europa

• Panorama de relacionamento populacional baseado em STRs produzido por FSTs

enquadrando-se melhor com o que se sabe sobre a história dos grandes grupos

populacionais humanos, comparativamente ao produzido por (δμ)2


65

6. Referências bibliográficas

1. B. Charlesworth, D. Charlesworth, Population genetics from 1966 to 2016,

Heredity 118(1) (2017) 2-9.

2. J.H. Gillespie, Population Genetics: A Concise Guide, Johns Hopkins

University Press2004.

3. W. Goodwin, A. Linacre, S. Hadi, An Introduction to Forensic Genetics, John

Wiley & Sons, 2007, pp. 2-5, 76, 137-138.

4. J.M. Mullaney, R.E. Mills, W.S. Pittard, S.E. Devine, Small insertions and

deletions (INDELs) in human genomes, Human Molecular Genetics 19(R2) (2010) R131-

R136.

5. R. Pereira, C. Phillips, C. Alves, A. Amorim, A. Carracedo, L. Gusmao, A new

multiplex for human identification using insertion/deletion polymorphisms,

Electrophoresis 30(21) (2009) 3682-90.

6. J.M. Butler, Forensic DNA Typing: Biology, Technology, and Genetics of STR

Markers, 2ªedição, Elsevier Science, 2005, pp. 129, 229-258, 473-496.

7. M.F.T. Pinheiro, Genética Forense Perspectivas da Identificação Genética,

Edições Universidade Fernando Pessoa, Porto, 2010, pp. 80, 96.

8. EU Council, Council Resolution of 30 November 2009 on the exchange of DNA

analysis results

(2009/C 296/01), Official Journal of the European Union 52 (2009) 1-31.

9. P.M. Schneider, Expansion of the European Standard Set of DNA database

loci-the current situation, Profiles in DNA 12(1) (2009) 6-7.

10. R.L. Green, R.E. Lagace, N.J. Oldroyd, L.K. Hennessy, J.J. Mulero,

Developmental validation of the AmpFlSTR(R) NGM SElect PCR Amplification Kit: A

next-generation STR multiplex with the SE33 locus, Forensic science international.

Genetics 7(1) (2013) 41-51.

11. A.S. V, O.P. Balanovsky, A.V. Melnikov, A.Y. Lash-Zavada, V.N. Khar'kov,

T.V. Tyazhelova, V.L. Akhmetova, O.V. Zhukova, Y.V. Shneider, I.N. Shil'nikova, S.A.

Borinskaya, A.V. Marusin, M.G. Spiridonova, K.V. Simonova, I.Y. Khitrinskaya, M.O.

Radzhabov, A.G. Romanov, O.V. Shtygasheva, S.M. Koshel, E.V. Balanovskaya, A.V.

Rybakova, E.K. Khusnutdinova, V.P. Puzyrev, N.K. Yankovsky, Characteristics of

Populations of the Russian Federation over the Panel of Fifteen Loci Used for DNA

Identification and in Forensic Medical Examination, Acta naturae 3(2) (2011) 56-67.

12. M. Delghandi, B.J. Branting, L. Jorgensen, Evaluation of a Quadruplex Short

Tandem Repeat System (HUMVWA31/A, HUMD11S554, HUMAPOI1, and


66

HUMACTBP2 loci) for Forensic Identity Testing, Confident Typing of Complex Alleles,

and Population Databases, Croatian Medical Journal 42(1) (2001) 33–44.

13. N.A. Rosenberg, J.K. Pritchard, J.L. Weber, H.M. Cann, K.K. Kidd, L.A.

Zhivotovsky, M.W. Feldman, Genetic structure of human populations, Science (New

York, N.Y.) 298(5602) (2002) 2381-5.

14. M.D. Shriver, E.J. Parra, S. Dios, C. Bonilla, H. Norton, C. Jovel, C. Pfaff, C.

Jones, A. Massac, N. Cameron, A. Baron, T. Jackson, G. Argyropoulos, L. Jin, C.J.

Hoggart, P.M. McKeigue, R.A. Kittles, Skin pigmentation, biogeographical ancestry and

admixture mapping, Human genetics 112(4) (2003) 387-99.

15. B.S. Coates, D.V. Sumerford, N.J. Miller, K.S. Kim, T.W. Sappington, B.D.

Siegfried, L.C. Lewis, Comparative performance of single nucleotide polymorphism and

microsatellite markers for population genetic analysis, The Journal of heredity 100(5)

(2009) 556-64.

16. R. Nassir, R. Kosoy, C. Tian, P.A. White, L.M. Butler, G. Silva, R. Kittles, M.E.

Alarcon-Riquelme, P.K. Gregersen, J.W. Belmont, F.M. De La Vega, M.F. Seldin, An

ancestry informative marker set for determining continental origin: validation and

extension using human genome diversity panels, BMC genetics 10 (2009) 39.

17. M. Fondevila, C. Phillips, C. Santos, A. Freire Aradas, P.M. Vallone, J.M.

Butler, M.V. Lareu, A. Carracedo, Revision of the SNPforID 34-plex forensic ancestry

test: Assay enhancements, standard reference sample genotypes and extended

population studies, Forensic science international. Genetics 7(1) (2013) 63-74.

18. O. Bulbul, G. Filoglu, T. Zorlu, H. Altuncul, A. Freire-Aradas, J. Söchtig, Y.

Ruiz, M. Klintschar, S. Triki-Fendri, A. Rebai, C. Phillips, M.V. Lareu, Á. Carracedo, P.M.

Schneider, Inference of biogeographical ancestry across central regions of Eurasia,

International Journal of Legal Medicine 130(1) (2016) 73-79.

19. C. Phillips, Forensic genetic analysis of bio-geographical ancestry, Forensic

science international. Genetics 18 (2015) 49-65.

20. P. Drineas, J. Lewis, P. Paschou, Inferring geographic coordinates of origin

for Europeans using small panels of ancestry informative markers, PloS one 5(8) (2010)

e11892.

21. P. Kersbergen, K. van Duijn, A.D. Kloosterman, J.T. den Dunnen, M. Kayser,

P. de Knijff, Developing a set of ancestry-sensitive DNA markers reflecting continental

origins of humans, BMC genetics 10(1) (2009) 69.

22. J. Pardo-Seco, F. Martinon-Torres, A. Salas, Evaluating the accuracy of AIM

panels at quantifying genome ancestry, BMC genomics 15 (2014) 543.


67

23. J.R. Kidd, F.R. Friedlaender, W.C. Speed, A.J. Pakstis, F.M. De La Vega,

K.K. Kidd, Analyses of a set of 128 ancestry informative single-nucleotide polymorphisms

in a global set of 119 population samples, Investigative genetics 2(1) (2011) 1.

24. C. Phillips, L. Fernandez-Formoso, M. Gelabert-Besada, M. Garcia-

Magarinos, C. Santos, M. Fondevila, A. Carracedo, M.V. Lareu, Development of a novel

forensic STR multiplex for ancestry analysis and extended identity testing,

Electrophoresis 34(8) (2013) 1151-62.

25. O. Lao, T.T. Lu, M. Nothnagel, O. Junge, S. Freitag-Wolf, A. Caliebe, M.

Balascakova, J. Bertranpetit, L.A. Bindoff, D. Comas, G. Holmlund, A. Kouvatsi, M.

Macek, I. Mollet, W. Parson, J. Palo, R. Ploski, A. Sajantila, A. Tagliabracci, U. Gether,

T. Werge, F. Rivadeneira, A. Hofman, A.G. Uitterlinden, C. Gieger, H.E. Wichmann, A.

Ruther, S. Schreiber, C. Becker, P. Nurnberg, M.R. Nelson, M. Krawczak, M. Kayser,

Correlation between genetic and geographic structure in Europe, Current biology : CB

18(16) (2008) 1241-8.

26. M. Otte, The history of European populations as seen by archaelogy, in:

Archaeogenetis: DNA and the population prehistory of Europe (ed. C. Renfrew and K.

Boyle), Cambridge, UK: McDonald Institute for Archaeological Research (2000) 41-44.

27. E.M. Belle, P.A. Landry, G. Barbujani, Origins and evolution of the Europeans'

genome: evidence from multiple microsatellite loci, Proceedings. Biological sciences

273(1594) (2006) 1595-602.

28. L. Guy Straus, Age of the modern Europeans, Nature 342(6249) (1989) 476-

477.

29. A.J. Ammerman, L.L. Cavalli-Sforza, The Neolithic Transition and the

Genetics of Populations in Europe, Princeton University Press1984.

30. R.R. Sokal, N.L. Oden, C. Wilson, Genetic evidence for the spread of

agriculture in Europe by demic diffusion, Nature 351(6322) (1991) 143-145.

31. L.L. Cavalli-Sforza, P. Menozzi, A. Piazza, Demic expansions and human

evolution, Science (New York, N.Y.) 259(5095) (1993) 639-46.

32. M.F. Seldin, R. Shigeta, P. Villoslada, C. Selmi, J. Tuomilehto, G. Silva, J.W.

Belmont, L. Klareskog, P.K. Gregersen, European Population Substructure: Clustering

of Northern and Southern Populations, PLoS Genetics 2(9) (2006) e143.

33. J. Novembre, T. Johnson, K. Bryc, Z. Kutalik, A.R. Boyko, A. Auton, A. Indap,

K.S. King, S. Bergmann, M.R. Nelson, M. Stephens, C.D. Bustamante, Genes mirror

geography within Europe, Nature 456(7218) (2008) 98-101.

34. I. Lazaridis, N. Patterson, A. Mittnik, G. Renaud, S. Mallick, K. Kirsanow, P.H.

Sudmant, J.G. Schraiber, S. Castellano, M. Lipson, B. Berger, C. Economou, R.


68

Bollongino, Q. Fu, K.I. Bos, S. Nordenfelt, H. Li, C. de Filippo, K. Prufer, S. Sawyer, C.

Posth, W. Haak, F. Hallgren, E. Fornander, N. Rohland, D. Delsate, M. Francken, J.M.

Guinet, J. Wahl, G. Ayodo, H.A. Babiker, G. Bailliet, E. Balanovska, O. Balanovsky, R.

Barrantes, G. Bedoya, H. Ben-Ami, J. Bene, F. Berrada, C.M. Bravi, F. Brisighelli, G.B.

Busby, F. Cali, M. Churnosov, D.E. Cole, D. Corach, L. Damba, G. van Driem, S.

Dryomov, J.M. Dugoujon, S.A. Fedorova, I. Gallego Romero, M. Gubina, M. Hammer,

B.M. Henn, T. Hervig, U. Hodoglugil, A.R. Jha, S. Karachanak-Yankova, R. Khusainova,

E. Khusnutdinova, R. Kittles, T. Kivisild, W. Klitz, V. Kucinskas, A. Kushniarevich, L.

Laredj, S. Litvinov, T. Loukidis, R.W. Mahley, B. Melegh, E. Metspalu, J. Molina, J.

Mountain, K. Nakkalajarvi, D. Nesheva, T. Nyambo, L. Osipova, J. Parik, F. Platonov, O.

Posukh, V. Romano, F. Rothhammer, I. Rudan, R. Ruizbakiev, H. Sahakyan, A.

Sajantila, A. Salas, E.B. Starikovskaya, A. Tarekegn, D. Toncheva, S. Turdikulova, I.

Uktveryte, O. Utevska, R. Vasquez, M. Villena, M. Voevoda, C.A. Winkler, L.

Yepiskoposyan, P. Zalloua, T. Zemunik, A. Cooper, C. Capelli, M.G. Thomas, A. Ruiz-

Linares, S.A. Tishkoff, L. Singh, K. Thangaraj, R. Villems, D. Comas, R. Sukernik, M.

Metspalu, M. Meyer, E.E. Eichler, J. Burger, M. Slatkin, S. Paabo, J. Kelso, D. Reich, J.

Krause, Ancient human genomes suggest three ancestral populations for present-day

Europeans, Nature 513(7518) (2014) 409-13.

35. W. Haak, I. Lazaridis, N. Patterson, N. Rohland, S. Mallick, B. Llamas, G.

Brandt, S. Nordenfelt, E. Harney, K. Stewardson, Q. Fu, A. Mittnik, E. Banffy, C.

Economou, M. Francken, S. Friederich, R.G. Pena, F. Hallgren, V. Khartanovich, A.

Khokhlov, M. Kunst, P. Kuznetsov, H. Meller, O. Mochalov, V. Moiseyev, N. Nicklisch,

S.L. Pichler, R. Risch, M.A. Rojo Guerra, C. Roth, A. Szecsenyi-Nagy, J. Wahl, M. Meyer,

J. Krause, D. Brown, D. Anthony, A. Cooper, K.W. Alt, D. Reich, Massive migration from

the steppe was a source for Indo-European languages in Europe, Nature 522(7555)

(2015) 207-211.

36. M.G. Tomas, T. Kivisild, L. Chikhi, J. Burger, Europe and Western Asia:

genetics and population history, in: I. Ness, P. Bellwood (eds.) The Encyclopedia of

Global Human Migration, Wiley-Blackwell: Malden, MA and Oxford (2013) 146-156.

37. Basic Facts about Ukraine, Consulado da Ucrânia em Nova Iorque, 2007

(consultado em 1 Maio 2017), disponível em:

http://www.ukrconsul.org/BASIC_FACTS.htm.

38. The World Factbook - Ucrânia, Central Intelligence Agency, Washington DC,

2013 (consultado em 1 Maio 2017), disponível em:

https://www.cia.gov/library/publications/the-world-factbook/index.html.

http://www.ukrconsul.org/BASIC_FACTS.htm

https://www.cia.gov/library/publications/the-world-factbook/index.html


69

39. L. Roewer, P.J. Croucher, S. Willuweit, T.T. Lu, M. Kayser, R. Lessig, P. de

Knijff, M.A. Jobling, C. Tyler-Smith, M. Krawczak, Signature of recent historical events in

the European Y-chromosomal STR haplotype distribution, Human genetics 116(4)

(2005) 279-91.

40. K. Rebala, A.I. Mikulich, I.S. Tsybovsky, D. Sivakova, Z. Dzupinkova, A.

Szczerkowska-Dobosz, Z. Szczerkowska, Y-STR variation among Slavs: evidence for

the Slavic homeland in the middle Dnieper basin, Journal of human genetics 52(5) (2007)

406-14.

41. O. Utevska, L. Atramentova, E. Balanovska, O. Balanovsky, Y-chromosome

STR variation in Ukrainian populations, 2015.

42. A população estrangeira em Portugal - 2011, Instituto Nacional de Estatística,

Statistics Portugal, disponível em: www.ine.pt (2011).

43. S.V. Serga, I.V. Dombrovskyi, O.M. Maistrenko, L.I. Ostapchenko, S.V.

Demydov, R.G. Krivda, I.A. Kozeretska, Allele frequencies for 15 STR loci in the

Ukrainian population, Forensic Science International: Genetics 29 e40-e41.

44. P.S. Walsh, D.A. Metzger, R. Higushi, Chelex 100 as a medium for simple

extraction of DNA for PCR-based typing from forensic material. BioTechniques 10(4):

506-13 (April 1991), BioTechniques 54(3) (2013) 134-9.

45. L. Excoffier, H.E. Lischer, Arlequin suite ver 3.5: a new series of programs to

perform population genetics analyses under Linux and Windows, Molecular ecology

resources 10(3) (2010) 564-7.

46. B.S. Weir, Genetic Data Analysis II: Methods for Discrete Population Genetic

Data, Sinauer Associates, 1996, pp. 150-156.

47. J.E. Wigginton, D.J. Cutler, G.R. Abecasis, A note on exact tests of Hardy-

Weinberg equilibrium, American journal of human genetics 76(5) (2005) 887-93.

48. L. Excoffier, Lischer, H., Arlequin ver 3.5. An Integrated Software Package

for Population Genetics Data Analysis, Swiss Institute of Bioinformatics, Switzerland,

2015.

49. A.K. Huston, Statistical Analysis of STR Data, Promega Corporation, Profiles

in Dna, 1998, pp. 14-15.

50. D. Botstein, R.L. White, M. Skolnick, R.W. Davis, Construction of a genetic

linkage map in man using restriction fragment length polymorphisms, American journal

of human genetics 32(3) (1980) 314-31.

51. R.C. Elston, Polymorphism Information Content, Encyclopedia of

Biostatistics, John Wiley & Sons, Ltd 2005.

www.ine.pt


70

52. R.C. Elston, Probability and paternity testing, American journal of human

genetics 39(1) (1986) 112-22.

53. C. Brenner, J.W. Morris, Paternity index calculations in single locus

hypervariable DNA probes: validation and other studies, Proceedings for The

International Symposium on Human Identification, Data Acquisition and Statistical

Analysis for DNA Typing Laboratories, Promega Corporation, Madison WI, 1989, pp. 21-

53.

54. S. Wright, The genetical structure of populations, Annals of eugenics 15(4)

(1951) 323-54.

55. B.S. Weir, C.C. Cockerham, Estimating F-Statistics for the Analysis of

Population Structure, Evolution 38(6) (1984) 1358-1370.

56. K.E. Holsinger, B.S. Weir, Genetics in geographically structured populations:

defining, estimating and interpreting F(ST), Nature reviews. Genetics 10(9) (2009) 639-

50.

57. S. Wright, Evolution in Mendelian Populations, Genetics 16(2) (1931) 97-159.

58. D.B. Goldstein, A. Ruiz Linares, L.L. Cavalli-Sforza, M.W. Feldman, Genetic

absolute dating based on microsatellites and the origin of modern humans, Proceedings

of the National Academy of Sciences of the United States of America 92(15) (1995)

6723-7.

59. T. Ohta, M. Kimura, A model of mutation appropriate to estimate the number

of electrophoretically detectable alleles in a finite population, Genetical research 22(2)

(1973) 201-4.

60. G. Cooper, W. Amos, R. Bellamy, M.R. Siddiqui, A. Frodsham, A.V.S. Hill,

D.C. Rubinsztein, An Empirical Exploration of the (δμ)(2) Genetic Distance for 213

Human Microsatellite Markers, American journal of human genetics 65(4) (1999) 1125-

1133.

61. N. Takezaki, M. Nei, K. Tamura, POPTREEW: web version of POPTREE for

constructing population trees from allele frequency data and computing some other

quantities, Molecular biology and evolution 31(6) (2014) 1622-4.

62. R.C. Team, R: A language and environment for statistical computing, R

Foundation for Statistical Computing, Vienna, Austria, 2013.

63. C. IBM, IBM Statistics for Windows, Version 24.0, Armonk, NY: IBM Corp,

Released 2016.

64. R. Peakall, P.E. Smouse, GenAlEx 6.5: genetic analysis in Excel. Population

genetic software for teaching and research--an update, Bioinformatics (Oxford, England)

28(19) (2012) 2537-9.


71

65. P.J.F. Groenen, M.v.d. Velden, Multidimensional Scaling, Econometric

Institute Report EL 15 (2004).

66. F.W. Young, Multidimensional scaling, in: S. Kotz, N.L. Johnson (eds.),

Encyclopedia of statistical sciences, Wiley, New York 5 (1985) 649-659.

67. K. Pearson, LIII. On lines and planes of closest fit to systems of points in

space, Philosophical Magazine Series 6 2(11) (1901) 559-572.

68. J.A.F. Diniz-Filho, T.N. Soares, J.S. Lima, R. Dobrovolski, V.L. Landeiro, M.P.

de Campos Telles, T.F. Rangel, L.M. Bini, Mantel test in population genetics, Genetics

and Molecular Biology 36(4) (2013) 475-485.

69. N. Mantel, The detection of disease clustering and a generalized regression

approach, Cancer research 27(2) (1967) 209-20.

70. B.K. Epperson, Geographical Genetics (MPB-38), Princeton University Press

2003, p.357.

71. J.M. Butler, Reeder, D. J., StrBase: Short Tandem Repeat DNA Internet

DataBase, National Institute of Standards and Technology, Estados Unidos da América,

1997 (consultada em 12 Janeiro 2017), disponível em:

http://www.cstl.nist.gov/div831/strbase/.

72. M.J. Farfan, P. Sanz, M.V. Lareu, A. Carracedo, Population data on the

D1S1656 and D12S391 STR loci in Andalusia (south Spain) and the maghreb (north

Africa), Forensic science international 104(1) (1999) 33-6.

73. M. Kimura, Rare variant alleles in the light of the neutral theory, Molecular

biology and evolution 1(1) (1983) 84-93.

74. P.C. Sham, S.M. Purcell, Statistical power and significance testing in large-

scale genetic studies, Nature reviews. Genetics 15(5) (2014) 335-46.

75. L. Poulsen, C. Tomas, K. Drobnic, V. Ivanova, H.S. Mogensen, A. Kondili, P.

Miniati, D. Bunokiene, J. Jankauskiene, V. Pereira, N. Morling, NGMSElect and

Investigator((R)) Argus X-12 analysis in population samples from Albania, Iraq,

Lithuania, Slovenia, and Turkey, Forensic science international. Genetics 22 (2016) 110-

2.

76. AmpFlSTR® NGM SElect™ PCR Amplification Kit User Guide, Applied

biosystems, Life Technologies Corporation, Estados Unidos da América, 2012,

disponível em:

https://www3.appliedbiosystems.com/cms/groups/applied_markets_marketing/docume

nts/generaldocuments/cms_089008.pdf.

http://www.cstl.nist.gov/div831/strbase/

https://www3.appliedbiosystems.com/cms/groups/applied_markets_marketing/documents/generaldocuments/cms_089008.pdf

https://www3.appliedbiosystems.com/cms/groups/applied_markets_marketing/documents/generaldocuments/cms_089008.pdf


72

77. N.A. Rosenberg, L.M. Li, R. Ward, J.K. Pritchard, Informativeness of genetic

markers for inference of ancestry, American journal of human genetics 73(6) (2003)

1402-22.

78. L. Excoffier, G. Hamilton, Comment on "Genetic structure of human

populations", Science (New York, N.Y.) 300(5627) (2003) 1877; author reply 1877.

79. N.M. Silva, L. Pereira, E.S. Poloni, M. Currat, Human neutral genetic variation

and forensic STR data, PloS one 7(11) (2012) e49666.

80. E.R. Londin, M.A. Keller, C. Maista, G. Smith, L.A. Mamounas, R. Zhang, S.J.

Madore, K. Gwinn, R.A. Corriveau, CoAIMs: a cost-effective panel of ancestry

informative markers for determining continental origins, PloS one 5(10) (2010) e13443.

81. C. Phillips, L. Fernandez-Formoso, M. Garcia-Magarinos, L. Porras, T.

Tvedebrink, J. Amigo, M. Fondevila, A. Gomez-Tato, J. Alvarez-Dios, A. Freire-Aradas,

A. Gomez-Carballa, A. Mosquera-Miguel, A. Carracedo, M.V. Lareu, Analysis of global

variability in 15 established and 5 new European Standard Set (ESS) STRs using the

CEPH human genome diversity panel, Forensic science international. Genetics 5(3)

(2011) 155-69.

82. C.D. Steele, D.S. Court, D.J. Balding, Worldwide F(ST) estimates relative to

five continental-scale populations, Annals of human genetics 78(6) (2014) 468-77.

83. S. Ramachandran, O. Deshpande, C.C. Roseman, N.A. Rosenberg, M.W.

Feldman, L.L. Cavalli-Sforza, Support from the relationship of genetic and geographic

distance in human populations for a serial founder effect originating in Africa,

Proceedings of the National Academy of Sciences of the United States of America

102(44) (2005) 15942-7.

84. G. Cooper, W. Amos, R. Bellamy, M.R. Siddiqui, A. Frodsham, A.V. Hill, D.C.

Rubinsztein, An empirical exploration of the (delta mu)2 genetic distance for 213 human

microsatellite markers, American journal of human genetics 65(4) (1999) 1125-33.

85. S.C. Heath, I.G. Gut, P. Brennan, J.D. McKay, V. Bencko, E. Fabianova, L.

Foretova, M. Georges, V. Janout, M. Kabesch, H.E. Krokan, M.B. Elvestad, J.

Lissowska, D. Mates, P. Rudnai, F. Skorpen, S. Schreiber, J.M. Soria, A.-C. Syvanen,

P. Meneton, S. Hercberg, P. Galan, N. Szeszenia-Dabrowska, D. Zaridze, E. Genin, L.R.

Cardon, M. Lathrop, Investigation of the fine structure of European populations with

applications to disease association studies, Eur J Hum Genet 16(12) (0000) 1413-1429.

86. L.M. Huckins, V. Boraska, C.S. Franklin, J.A. Floyd, L. Southam, P.F.

Sullivan, C.M. Bulik, D.A. Collier, C. Tyler-Smith, E. Zeggini, I. Tachmazidou, Using

ancestry-informative markers to identify fine structure across 15 populations of European

origin, Eur J Hum Genet 22(10) (2014) 1190-200.


73

87. A. Torroni, H.J. Bandelt, V. Macaulay, M. Richards, F. Cruciani, C. Rengo, V.

Martinez-Cabrera, R. Villems, T. Kivisild, E. Metspalu, J. Parik, H.V. Tolk, K. Tambets,

P. Forster, B. Karger, P. Francalacci, P. Rudan, B. Janicijevic, O. Rickards, M.L.

Savontaus, K. Huoponen, V. Laitinen, S. Koivumaki, B. Sykes, E. Hickey, A. Novelletto,

P. Moral, D. Sellitto, A. Coppa, N. Al-Zaheri, A.S. Santachiara-Benerecetti, O. Semino,

R. Scozzari, A signal, from human mtDNA, of postglacial recolonization in Europe,

American journal of human genetics 69(4) (2001) 844-52.

88. L. Chikhi, R.A. Nichols, G. Barbujani, M.A. Beaumont, Y genetic data support

the Neolithic demic diffusion model, Proceedings of the National Academy of Sciences

of the United States of America 99(17) (2002) 11008-13.

89. L. Chikhi, G. Destro-Bisol, V. Pascali, V. Baravelli, M. Dobosz, G. Barbujani,

Clinal variation in the nuclear DNA of Europeans, Human biology 70(4) (1998) 643-57.

90. L. Chikhi, G. Destro-Bisol, G. Bertorelle, V. Pascali, G. Barbujani, Clines of

nuclear DNA markers suggest a largely neolithic ancestry of the European gene pool,

Proceedings of the National Academy of Sciences of the United States of America 95(15)

(1998) 9053-8.

91. Z.H. Rosser, T. Zerjal, M.E. Hurles, M. Adojaan, D. Alavantic, A. Amorim, W.

Amos, M. Armenteros, E. Arroyo, G. Barbujani, G. Beckman, L. Beckman, J. Bertranpetit,

E. Bosch, D.G. Bradley, G. Brede, G. Cooper, H.B. Corte-Real, P. de Knijff, R. Decorte,

Y.E. Dubrova, O. Evgrafov, A. Gilissen, S. Glisic, M. Golge, E.W. Hill, A. Jeziorowska, L.

Kalaydjieva, M. Kayser, T. Kivisild, S.A. Kravchenko, A. Krumina, V. Kucinskas, J.

Lavinha, L.A. Livshits, P. Malaspina, S. Maria, K. McElreavey, T.A. Meitinger, A.V.

Mikelsaar, R.J. Mitchell, K. Nafa, J. Nicholson, S. Norby, A. Pandya, J. Parik, P.C.

Patsalis, L. Pereira, B. Peterlin, G. Pielberg, M.J. Prata, C. Previdere, L. Roewer, S.

Rootsi, D.C. Rubinsztein, J. Saillard, F.R. Santos, G. Stefanescu, B.C. Sykes, A. Tolun,

R. Villems, C. Tyler-Smith, M.A. Jobling, Y-chromosomal diversity in Europe is clinal and

influenced primarily by geography, rather than by language, American journal of human

genetics 67(6) (2000) 1526-43.

92. L.A. Welch, P. Gill, C. Phillips, R. Ansell, N. Morling, W. Parson, J.U. Palo, I.

Bastisch, European Network of Forensic Science Institutes (ENFSI): Evaluation of new

commercial STR multiplexes that include the European Standard Set (ESS) of markers,

Forensic science international. Genetics 6(6) (2012) 819-26.

93. A.A. Westen, T. Kraaijenbrink, E.A. Robles de Medina, J. Harteveld, P.

Willemse, S.B. Zuniga, K.J. van der Gaag, N.E. Weiler, J. Warnaar, M. Kayser, T. Sijen,

P. de Knijff, Comparing six commercial autosomal STR kits in a large Dutch population

sample, Forensic science international. Genetics 10 (2014) 55-63.


74

94. O. Garcia, J. Alonso, J.A. Cano, R. Garcia, G.M. Luque, P. Martin, I.M. de

Yuso, S. Maulini, D. Parra, I. Yurrebaso, Population genetic data and concordance study

for the kits Identifiler, NGM, PowerPlex ESX 17 System and Investigator ESSplex in

Spain, Forensic science international. Genetics 6(2) (2012) e78-9.

95. C. Tomas, H.S. Mogensen, S.L. Friis, C. Hallenberg, M.C. Stene, N. Morling,

Concordance study and population frequencies for 16 autosomal STRs analyzed with

PowerPlex(R) ESI 17 and AmpFlSTR(R) NGM SElect in Somalis, Danes and

Greenlanders, Forensic science international. Genetics 11 (2014) e18-21.

96. H. Zhang, S. Yang, W. Guo, B. Ren, L. Pu, T. Ma, M. Xia, L. Jin, L. Li, S. Li,

Population genetic analysis of the GlobalFiler STR loci in 748 individuals from the

Kazakh population of Xinjiang in northwest China, International journal of legal medicine

130(5) (2016) 1187-9.

97. P.G. Ristow, K.W. Cloete, M.E. D'Amato, GlobalFiler((R)) Express DNA

amplification kit in South Africa: Extracting the past from the present, Forensic science

international. Genetics 24 (2016) 194-201.

98. B. Li, J. Ge, F. Wu, L. Ye, B. Budowle, Y. Chen, Population genetic analyses

of the STR loci of the AmpFlSTR NGM SElect kit for Han population in Fujian Province,

China, International journal of legal medicine 127(2) (2013) 345-6.

99. M.F. Pinheiro, L. Caine, L. Pontes, D. Abrantes, G. Lima, M.J. Pereira, P.

Rezende, Allele frequencies of sixteen STRs in the population of Northern Portugal,

Forensic science international 148(2-3) (2005) 221-3.

100. A.M. Bento, A. Semo, V. Lopes, V. Bogas, P. Brito, A. Serra, L. Andrade, L.

Souto, F. Corte-Real, M.J. Anjos, Population data for Central Portugal population with

NGM amplification kit, Forensic Science International: Genetics Supplement Series 4(1)

(2013) e152-e153.

101. T. Ribeiro, P. Dario, N. Vital, S. Sanches, R. Espinheira, H. Geada, J. Costa-

Santos, Population data of the AmpFlSTR(R) NGM loci in South Portuguese population,

Forensic science international. Genetics 7(2) (2013) e37-9.

102. F. Stanciu, S. Vladu, V. Cutar, D. Cocioaba, F. Iancu, A. Cotolea, I.M. Stoian,

Genetic parameters and allele frequencies of five new European Standard Set STR loci

(D10S1248, D22S1045, D2S441, D1S1656, D12S391) in the population of Romania,

Croatian medical journal 54(3) (2013) 232-7.

103. L.E. Barbarii, B. Rolf, C. Constantinescu, C. Hohoff, P. Calistru, D.

Dermengiu, Allele frequencies of 13 short tandem repeat (STR) loci in the Romanian

population, Forensic science international 141(2-3) (2004) 171-4.


75

104. I. Soltyszewski, W. Pepinski, P. Wolanska-Nowak, A. Maciejewska, R.

Paszkowska, M. Abreu-Glowacka, W. Achrem, A. Jonkisz, A. Lebioda, M. Konarzewska,

R. Ploski, Polish population data on 15 autosomal STRs of AmpFlSTR NGM PCR kit,

Forensic science international. Genetics 9 (2014) 142-9.

105. R. Pawlowski, A. Maciejewska, R. Paszkowska, A. Welz, Frequencies for

five short tandem repeat (STR) systems in a population from north Poland, International

journal of legal medicine 110(1) (1997) 10-3.

106. M. Sotak, E. Petrejcikova, A. Bozikova, J. Bernasovska, I. Bernasovsky, A.

Sovicova, I. Boronova, P. Svickova, D. Gabrikova, S. Macekova, J. Carnogurska, K.

Rebala, D. Vlcek, Population database of 17 autosomal STR loci from the four

predominant Eastern Slovakia regions, Forensic science international. Genetics 5(3)

(2011) 262-3.

107. A. Molnar, A. Zalan, G. Horvath, H. Pamjav, Allele distribution of the new

European Standard Set (ESS) loci in the Hungarian population, Forensic science

international. Genetics 5(5) (2011) 555-6.

108. S.A. Rak, A. Zalan, G. Szabados, H. Pamjav, Population genetic data on 15

STR loci in the Hungarian population, Forensic science international. Genetics 5(5)

(2011) 543-4.

109. Z. Jakovski, K. Nikolova, I. Furac, M. Masic, B. Janeska, M. Kubat, Allele

frequencies for 15 STR loci in a population from the Republic of Macedonia, International

journal of legal medicine 120(1) (2006) 53-5.

110. Z. Jakovski, K. Nikolova, R. Jankova-Ajanovska, B. Janeska, N. Pojskic, D.

Marjanovic, Allele frequencies of the new European Standard Set (ESS) loci plus SE33

locus in a population from the Republic of Macedonia, Forensic science international.

Genetics 6(3) (2012) e90-2.

111. L. Kovatsi, T.J. Parsons, R.S. Just, J.A. Irwin, Genetic variation for 15

autosomal STR loci (PowerPlex 16) in a population sample from northern Greece,

Forensic science international 159(1) (2006) 61-3.

112. Q. GmbH, Base de dados ALLST*R: Database for autosomal short tandem

repeats, Germany, 2011 (consultada em 2016), Disponivel em:

http://allstr.de/allstr/home.seam?cid=211171.

113. P. Hatzer-Grubwieser, B. Berger, D. Niederwieser, M. Steinlechner, Allele

frequencies and concordance study of 16 STR loci--including the new European

Standard Set (ESS) loci--in an Austrian population sample, Forensic science

international. Genetics 6(1) (2012) e50-1.

http://allstr.de/allstr/home.seam?cid=211171


76

114. M. Klintschar, F. Neuhuber, A study on the short tandem repeat system

ACTBP2 (SE33) in an Austrian population sample, International journal of legal medicine

111(1) (1998) 46-8.

115. D. Vanek, R. Hradil, B. Budowle, Czech population data on 10 short tandem

repeat loci of SGM Plus STR system kit using DNA purified in FTA cards, Forensic

science international 119(1) (2001) 107-8.

116. I. Rostedt, K. Lalu, M. Lukka, A. Sajantila, Genotyping of five short tandem

repeat loci via triplex and duplex PCR, Forensic science international 82(3) (1996) 217-

26.

117. S. Dognaux, M.H. Larmuseau, L. Jansen, T. Heylen, N. Vanderheyden, B.

Bekaert, F. Noel, R. Decorte, Allele frequencies for the new European Standard Set

(ESS) loci and D1S1677 in the Belgian population, Forensic science international.

Genetics 6(2) (2012) e75-7.

118. R. Decorte, M. Engelen, L. Larno, K. Nelissen, A. Gilissen, J.J. Cassiman,

Belgian population data for 15 STR loci (AmpFlSTR SGM Plus and AmpFlSTR profiler

PCR amplification kit), Forensic science international 139(2-3) (2004) 211-3.

119. G. Mertens, N. Mommers, H. Heylen, M. Gielis, L. Muylle, A. Vandenberghe,

Allele frequencies of nine STR systems in the Flemish population and application in

parentage testing, International journal of legal medicine 110(4) (1997) 177-80.

120. A. Berti, F. Brisighelli, A. Bosetti, E. Pilli, C. Trapani, V. Tullio, C. Franchi, G.

Lago, C. Capelli, Allele frequencies of the new European Standard Set (ESS) loci in the

Italian population, Forensic science international. Genetics 5(5) (2011) 548-9.

121. C. Previdere, P. Grignani, F. Alessandrini, M. Alu, R. Biondo, I. Boschi, L.

Caenazzo, I. Carboni, E. Carnevali, F. De Stefano, R. Domenici, M. Fabbri, E. Giardina,

S. Inturri, S. Pelotti, A. Piccinini, M. Piglionica, N. Resta, S. Turrina, A. Verzeletti, S.

Presciuttini, The 2011 GeFI collaborative exercise. Concordance study, proficiency

testing and Italian population data on the new ENFSI/EDNAP loci D1S1656, D2S441,

D10S1248, D12S391, D22S1045, Forensic science international. Genetics 7(1) (2013)

e15-8.

122. I. Carboni, A.L. Nutini, B. Porfirio, M. Genuardi, U. Ricci, Genetic STRs

variation in a large population from Tuscany (Italy), Forensic science international.

Genetics 1(3-4) (2007) e10-1.

123. M.L. Pontes, M.F. Pinheiro, Population data of the AmpFISTR(R) NGM STR

loci in a North of Portugal sample, Forensic science international. Genetics 6(5) (2012)

e127-8.


77

124. V. Jemeljanova, O. Gobrusjonoka, O. Bergere, K. Latisheva, E. Podovsovnik

Axelsson, I. Zupanic Pajnic, Population data for 15 autosomal STR loci from Latvia,

International journal of legal medicine 129(4) (2015) 739-40.

125. M. Sadam, G. Tasa, A. Tiidla, A. Lang, E.P. Axelsson, I.Z. Pajnic, Population

data for 22 autosomal STR loci from Estonia, International journal of legal medicine

129(6) (2015) 1219-20.

126. D. Zgonjanin, G. Stojiljkovic, M. Antov, S. Petkovic, D. Draskovic, Population

data of the AmpFlSTR((R)) NGM loci in the population of Vojvodina Province, Serbia,

Forensic science international. Genetics 23 (2016) e12-3.

127. N. Haliti, M. Carapina, M. Masic, D. Strinovic, I.M. Klaric, M. Kubat,

Evaluation of population variation at 17 autosomal STR and 16 Y-STR haplotype loci in

Croatians, Forensic science international. Genetics 3(4) (2009) e137-8.

128. G. Curic, V. Gasic, V. Pluzaric, D. Smiljcic, Genetic parameters of five new

European Standard Set STR loci (D10S1248, D22S1045, D2S441, D1S1656, D12S391)

in the population of eastern Croatia, Croatian medical journal 53(5) (2012) 409-15.

129. I.W. Evett, P.D. Gill, J.A. Lambert, N. Oldroyd, R. Frazier, S. Watson, S.

Panchal, A. Connolly, C. Kimpton, Statistical analysis of data for three British ethnic

groups from a new STR multiplex, International journal of legal medicine 110(1) (1997)

5-9.

130. V.C. Tucker, C. Baumgartner, G.R. Stead, A.J. Hopwood, UK population

data generated with the PowerPlex(R) ESI 16 system, Forensic science international.

Genetics 6(4) (2012) e112-8.

131. C.P. Phillips, C.D. Syndercombe, N. Tamaki, UK Caucasian databases for

the short tandem repeat loci D21S11, HUMFIBRA (FGA) and D8S1179, Progress in

Forensic Genetics 7 (1998) 398-400.

132. F. Stanciu, O.R. Popescu, I.M. Stoian, Allele frequencies of 15 STR loci in

Moldavia region (NE Romania), Forensic science international. Genetics 4(1) (2009)

e39-40.

133. L.A. Zhivotovsky, V.M. Veremeichyk, N.N. Kuzub, L.A. Atramentova, I.G.

Udina, N.A. Kartel, I.S. Tsybovsky, A reference data base on STR allele frequencies in

the Belarus population developed from paternity cases, Forensic science international.

Genetics 3(3) (2009) e107-9.

134. W. Pepinski, A. Niemcunowicz-Janica, M. Skawronska, E. Koc-Zorawska,

J. Janica, I. Soltyszewski, Allele distribution of 15 STR loci in a population sample of

Byelorussian minority residing in the northeastern Poland, Forensic science international

139(2-3) (2004) 265-7.


78

135. K. Montelius, A.O. Karlsson, G. Holmlund, STR data for the AmpFlSTR

Identifiler loci from Swedish population in comparison to European, as well as with non-

European population, Forensic science international. Genetics 2(3) (2008) e49-52.

136. R. Andreassen, L. Pereira, B.M. Dupuy, B. Mevaag, Icelandic population

data for the STR loci in the AMPFlSTR SGM Plus system and the PowerPlex Y-system,

Forensic science international. Genetics 4(4) (2010) e101-3.

137. E. Nasibov, O. Bulbul, G. Jabrayili, T. Zorlu, M.S. Shahzad, S. Cengiz, G.

Filoglu, H. Altuncul, G. Sadixov, Allele frequencies of 15 STR loci in Azerbaijan

population, Forensic science international. Genetics 7(3) (2013) e99-100.

138. L.A. Zhivotovsky, B.A. Malyarchuk, M.V. Derenko, M. Wozniak, T.

Grzybowski, Developing STR databases on structured populations: the native South

Siberian population versus the Russian population, Forensic science international.

Genetics 3(4) (2009) e111-6.

139. Z. Zhao, J. Zhang, H. Wang, Z.P. Liu, M. Liu, Y. Zhang, L. Sun, H. Zhang,

Mutation rate estimation for 15 autosomal STR loci in a large population from Mainland

China, Meta gene 5 (2015) 150-6.

140. K. Bentayebi, F. Abada, H. Ihzmad, S. Amzazi, Genetic ancestry of a

Moroccan population as inferred from autosomal STRs, Meta gene 2 (2014) 427-38.

141. M.M. Melo, M. Carvalho, V. Lopes, M.J. Anjos, A. Serra, D.N. Vieira, J.

Sequeiros, F. Corte-Real, Genetic study of 15 STRs loci of Identifiler system in Angola

population, Forensic science international. Genetics 4(5) (2010) e153-7.


79

Anexos

Anexo 1


80

Anexo 2

Tabela 15. Referências bibliográficas, número de indivíduos, loci estudados e regiões geográficas dos dados utilizados

para os diversos países presentes neste estudo

População Região

Número de

indivíduos

v

W

a

D

1

6

S

5

3

9

D

2

S

1

3

3

8

D

8

S

1

1

7

9

D

2

1

S

1

1

D

1

8

S

5

1

D

1

9

S

4

3

3

T

H

0

1

F

G

A

D

3

S

1

3

5

8

D

1

0

S

1

2

4

8

D

2

2

S

1

0

4

5

D

2

S

4

4

1

D

1

S

1

6

5

6

D

1

2

S

3

9

1

S

E

3

3 Ref.

Ucrânia Europa 72 x x x x x x x x x x x x x x x x -

Roménia Europa

1331 x x x x x x x x x x x x x x x [102]

139 x [103]

Polónia Europa


126 x [105]

Lituânia Europa 110 x x x x x x x x x x x x x x x x [75]

Albânia Europa 170 x x x x x x x x x x x x x x x x [75]

Eslovênia Europa 157 x x x x x x x x x x x x x x x x [75]

Iraque “Médio

Oriente” 96 x x x x x x x x x x x x x x x x [75]

Turquia “Médio

Oriente” 93 x x x x x x x x x x x x x x x x [75]

Eslováquia Europa

247/ 245 (SE33) x x x x x x x x x x x x x x x [92]

558 x [106]

Hungria Europa

531 (D2S1338,

D19S433)/ 254 x x x x x x x [107]

8426/ 1334

(D16S539)/ 1326

(TH01)

x x x x x x x x [108]

223 x [92]

Macedónia Europa

163 x x x x x x x x x x [109]

205 x x x x x x [110]

Bósnia e Herzegovina Europa 171 x x x x x x x x x x x x x x x x [92]


81

Grécia Europa

318 x [111]

208 x x x x x x x x x x x x x [92]

585 (TH01)/ 1543

(D3S1358) x x [112]

Áustria Europa

609/ 709/ 609/ 509/

928/ 709/ 1816/

724

x x x x x x x x [112]

219 x x x x x x [113]

932 x x [114]

Republica Checa Europa

202 x x x x x x x x x x [115]

200 x x x x x x [92]

Alemanha Europa 662 x x x x x x x x x x x x x x x x [92]

Finlândia Europa

210 x x x x x x x x [92]

1274 x [116]

180 x x x x x x x [112]

Holanda Europa 2085 x x x x x x x x x x x x x x x x [93]

Bélgica Europa

400 x x x x x x [117]

206 x [92]

222 x x x x x x x x [118]

245 x [119]

Suíça Europa

202 x x x x x [92]

511 (TH01)/ 392

(SE33)/ 206 x x x x x x x x x x x [112]

Itália Europa

209 x x [120]

960 x x x x x [121]

821/ 484/ 155/ 785/

786/ 785/ 785/ 544/

833/ 824

x x x x x x x x x [122]

Portugal (e Portugal

norte) Europa


200 x [99]

Portugal (centro) Europa 150 x x x x x x x x x x x x x x x [100]

Portugal (sul) Europa 452 x x x x x x x x x x x x x x x [101]

Espanha Europa 284 x x x x x x x x x x x x x x x X [94]


82

Dinamarca Europa 199 x x x x x x x x x x x x x x x X [95]

Gronelândia América 194 x x x x x x x x x x x x x x x X [95]

Cazaquistão Ásia 748 x x x x x x x x x x x x x x x X [96]

Letónia Europa 500 x x x x x x x x x x x x x x x [124]

Estónia Europa 303 x x x x x x x x x x x x x x x [125]

Sérvia Europa

3304/ 3360/ 1990/

2750/ 2382/ 2404/

1970/ 3492/ 2392

x x x x x x x x x [112]

356 x x x x x x [126]

Montenegro Europa 200 x x x x x x x x x x x x x x x [92]

Croácia Europa

200 x x x x x x x x x x [127]

217 x x x x x [128]

Noruega Europa 202 x x x x x x x x x x x x x x x [92]

França Europa 208 x x x x x x x x x x x x x x x

Reino Unido Europa

370/ 602/ 602/ 900 x x x x [129]

370 x x x x x x x x x x [130]

370 x [131]

Irlanda Europa 304 x x x x x x x x x x x x x x x [92]

Moldávia Europa 1321 x x x x x x x x x x [132]

Bielorrússia Europa

1102/ 1108/ 1005/

1098/ 1110/ 1106/

1090/ 1098

x x x x x x x x [133]

212 x x [134]

Suécia Europa 311 x x x x x x x x x x [135]

Islândia Europa 151 x x x x x x x x x x [136]

Azerbaijão Ásia

283/ 285/ 285/ 285/

284/ 281/ 285/ 285/

284/ 285

x x x x x x x x x x [137]

Rússia (europeia) Europa

340/ 371/ 184/ 371/

371/ 371/ 184/ 371/

369/ 371


Sibéria ("região sul") Ásia

515/ 558/ 261/ 558/

558/ 556/ 260/ 558/

558/ 558



83

China (mainland) Ásia 42416 x x x x x x x x x x [139]

China (população Han,

província de Fujing) Ásia 433 x x x x x x x x x x x x x x x x [98]

África do Sul

(população amaXhosa

falante de bantu)

África 120 x x x x x x x x x x x x x x x x [97]

Marrocos África 320 x x x x x x x x x x [140]

Angola África 480 x x x x x x x x x x [141]

Somália África 597 x x x x x x x x x x x x x x x x [95]


84

Anexo 3

Tabela 16. Matriz de distâncias genéticas para as 46 populações (valores de FST acima da diagonal e (δμ)2 abaixo)

Ucrâ

nia

0

0,0

98

0,0

5

0,1

67

0,0

59

0,0

67

0,1

69

0,1

75

0,0

82

0,0

59

0,0

88

0,0

36

0,0

63

0,0

84

0,0

68

0,0

49

0,1

38

0,2

06

0,0

56

0,0

68

0,0

66

0,0

5

0,0

54

0,0

85

0,4

38

0,3

04

0,0

73

0,0

83

0,0

39

0,0

56

0,0

25

0,0

82

0,0

59

0,0

83

0,0

65

0,0

94

0,0

22

0,0

54

0,1

16

0,1

48

0,0

26

0,4

97

0,4

0,6

67

0,1

66

0,9

11

Ro

mé

nia

0,0

04

0

0,0

45

0,0

9

0,0

55

0,0

2

0,0

74

0,0

52

0,0

26

0,0

12

0,0

18

0,0

33

0,0

43

0,0

17

0,0

43

0,0

22

0,0

54

0,0

91

0,0

31

0,0

3

0,0

7

0,0

3

0,0

41

0,0

34

0,2

78

0,1

05

0,0

43

0,0

38

0,0

25

0,0

24

0,0

36

0,0

31

0,0

21

0,0

23

0,0

36

0,0

06

0,0

49

0,0

31

0,0

51

0,0

34

0,0

51

0,2

17

0,1

34

0,4

72

0,2

16

0,6

22

Po

lón

ia

0

0,0

04

0

0,0

51

0,0

91

0,0

15

0,1

51

0,1

16

0,0

25

0,0

16

0,0

42

0,0

29

0,0

85

0,0

29

0,0

08

0,0

25

0,0

41

0,1

38

0,0

33

0,0

51

0,1

08

0,0

42

0,0

69

0,0

32

0,3

94

0,1

85

0,0

04

0,0

18

0,0

34

0,0

31

0,0

14

0,0

34

0,0

33

0,0

26

0,0

38

0,0

34

0,0

09

0,0

23

0,0

5

0,1

23

0,0

19

0,3

15

0,2

42

0,5

94

0,2

7

0,7

86

Lit

uâ

nia

0,0

02

0,0

07

0,0

02

0

0,2

2

0,0

53

0,2

02

0,1

54

0,0

59

0,0

69

0,1

09

0,1

06

0,1

9

0,0

92

0,0

59

0,1

11

0,0

8

0,2

32

0,1

17

0,1

4

0,2

51

0,1

39

0,1

97

0,1

05

0,4

84

0,1

58

0,0

41

0,0

59

0,1

3

0,1

21

0,1

05

0,1

14

0,1

24

0,0

93

0,1

46

0,0

81

0,0

77

0,1

08

0,1

2

0,2

05

0,0

93

0,2

15

0,1

75

0,5

16

0,4

7

0,6

47

Alb

ân

ia

0,0

04

0,0

02

0,0

06

0,0

09

0

0,0

66

0,0

69

0,1

0,1

04

0,0

53

0,0

41

0,0

32

0,0

07

0,0

65

0,1

06

0,0

38

0,1

4

0,1

42

0,0

39

0,0

56

0,0

09

0,0

38

0,0

18

0,0

72

0,2

49

0,2

01

0,1

03

0,0

93

0,0

21

0,0

34

0,0

41

0,0

54

0,0

39

0,0

73

0,0

54

0,0

58

0,0

67

0,0

58

0,0

93

0,0

43

0,0

55

0,3

78

0,2

95

0,5

84

0,1

13

0,8

2

Es

lov

ên

ia

0,0

02

0,0

02

0,0

01

0,0

03

0,0

03

0

0,1

01

0,0

81

0,0

25

0,0

09

0,0

27

0,0

14

0,0

55

0,0

26

0,0

22

0,0

25

0,0

48

0,1

35

0,0

31

0,0

48

0,0

84

0,0

37

0,0

56

0,0

38

0,3

22

0,1

42

0,0

11

0,0

18

0,0

22

0,0

19

0,0

21

0,0

33

0,0

27

0,0

27

0,0

46

0,0

16

0,0

19

0,0

32

0,0

44

0,0

81

0,0

28

0,2

52

0,1

98

0,4

93

0,2

46

0,6

47

Ira

qu

e

0,0

08

0,0

04

0,0

08

0,0

11

0,0

03

0,0

05

0

0,0

53

0,1

57

0,0

95

0,0

74

0,0

99

0,0

47

0,1

15

0,1

73

0,1

06

0,1

67

0,1

91

0,0

78

0,1

37

0,0

96

0,0

96

0,1

13

0,1

16

0,1

25

0,0

67

0,1

5

0,1

06

0,0

91

0,0

91

0,1

17

0,0

97

0,0

99

0,1

14

0,1

29

0,0

91

0,1

46

0,1

17

0,1

2

0,0

39

0,1

24

0,1

67

0,1

45

0,4

05

0,2

27

0,6

54

Tu

rqu

ia

0,0

06

0,0

03

0,0

08

0,0

12

0,0

04

0,0

05

0,0

01

0

0,1

02

0,0

66

0,0

75

0,1

13

0,0

66

0,0

55

0,1

1

0,0

69

0,0

77

0,1

9

0,0

55

0,0

99

0,1

02

0,0

7

0,1

19

0,0

57

0,1

88

0,0

5

0,1

18

0,0

78

0,0

88

0,0

82

0,0

99

0,0

64

0,0

59

0,0

59

0,0

83

0,0

58

0,1

34

0,0

73

0,0

93

0,0

32

0,1

18

0,1

59

0,1

24

0,5

62

0,3

28

0,7

15

Es

lov

áq

uia

0,0

01

0,0

01

0,0

02

0,0

03

0,0

03

0,0

01

0,0

06

0,0

07

0

0,0

17

0,0

49

0,0

42

0,0

9

0,0

21

0,0

2

0,0

27

0,0

39

0,1

3

0,0

5

0,0

22

0,1

22

0,0

54

0,0

77

0,0

33

0,4

47

0,1

76

0,0

28

0,0

41

0,0

49

0,0

39

0,0

37

0,0

41

0,0

38

0,0

25

0,0

48

0,0

21

0,0

34

0,0

26

0,0

56

0,0

97

0,0

46

0,3

02

0,1

93

0,5

67

0,2

89

0,7

1

Hu

ng

ria

0

0,0

01

0,0

01

0,0

03

0,0

03

0,0

01

0,0

05

0,0

05

0

0

0,0

21

0,0

19

0,0

45

0,0

09

0,0

2

0,0

07

0,0

37

0,1

05

0,0

13

0,0

23

0,0

66

0,0

2

0,0

42

0,0

17

0,3

27

0,1

29

0,0

19

0,0

18

0,0

16

0,0

17

0,0

11

0,0

16

0,0

11

0,0

12

0,0

25

0,0

06

0,0

2

0,0

12

0,0

41

0,0

59

0,0

23

0,2

57

0,1

77

0,5

24

0,2

22

0,6

95


85

Ma

ce

dó

nia

0,0

04

0,0

04

0,0

05

0,0

07

0,0

02

0,0

04

0,0

05

0,0

06

0,0

04

0,0

04

0

0,0

29

0,0

34

0,0

26

0,0

44

0,0

23

0,0

61

0,1

19

0,0

27

0,0

44

0,0

63

0,0

43

0,0

42

0,0

35

0,2

56

0,1

22

0,0

39

0,0

41

0,0

28

0,0

18

0,0

33

0,0

23

0,0

29

0,0

32

0,0

33

0,0

17

0,0

46

0,0

33

0,0

48

0,0

43

0,0

31

0,2

52

0,1

78

0,5

29

0,2

27

0,7

36

Bo

sn

ia e

Herz

eg

ov

ina

0,0

01

0,0

04

0,0

02

0,0

04

0,0

04

0,0

01

0,0

07

0,0

06

0,0

03

0,0

02

0,0

04

0

0,0

33

0,0

43

0,0

44

0,0

24

0,0

88

0,1

32

0,0

33

0,0

39

0,0

52

0,0

34

0,0

3

0,0

53

0,3

35

0,1

96

0,0

32

0,0

4

0,0

11

0,0

14

0,0

15

0,0

39

0,0

3

0,0

43

0,0

47

0,0

3

0,0

15

0,0

35

0,0

55

0,0

8

0,0

22

0,3

37

0,2

63

0,5

05

0,1

66

0,7

03

Gré

cia

0,0

02

0,0

02

0,0

05

0,0

07

0,0

01

0,0

01

0,0

03

0,0

03

0,0

02

0,0

02

0,0

03

0,0

03

0

0,0

55

0,0

94

0,0

35

0,1

2

0,1

65

0,0

33

0,0

55

0,0

17

0,0

37

0,0

3

0,0

62

0,2

25

0,1

58

0,0

94

0,0

79

0,0

25

0,0

32

0,0

42

0,0

49

0,0

36

0,0

63

0,0

53

0,0

49

0,0

65

0,0

52

0,0

86

0,0

28

0,0

48

0,3

21

0,2

51

0,5

5

0,1

53

0,7

72

Áu

str

ia

0,0

01

0,0

03

0,0

01

0,0

03

0,0

04

0,0

01

0,0

06

0,0

05

0,0

01

0,0

01

0,0

03

0,0

02

0,0

02

0

0,0

23

0,0

06

0,0

26

0,1

05

0,0

18

0,0

2

0,0

7

0,0

26

0,0

5

0,0

07

0,3

33

0,1

31

0,0

34

0,0

34

0,0

29

0,0

26

0,0

23

0,0

13

0,0

11

0,0

09

0,0

18

0,0

08

0,0

43

0,0

11

0,0

46

0,0

52

0,0

41

0,2

72

0,1

8

0,6

26

0,2

6

0,7

86

Rep

ub

lic

a

Ch

ec

a

0

0,0

04

0

0

0,0

06

0,0

01

0,0

08

0,0

07

0,0

02

0,0

01

0,0

04

0,0

02

0,0

04

0,0

01

0

0,0

26

0,0

24

0,1

54

0,0

37

0,0

48

0,1

15

0,0

45

0,0

76

0,0

28

0,4

06

0,1

88

0,0

1

0,0

23

0,0

43

0,0

34

0,0

23

0,0

36

0,0

3

0,0

19

0,0

29

0,0

31

0,0

21

0,0

21

0,0

49

0,1

2

0,0

27

0,3

19

0,2

4

0,6

18

0,3

02

0,7

71

Ale

ma

nh

a

0,0

01

0,0

02

0,0

01

0,0

03

0,0

03

0,0

01

0,0

05

0,0

04

0,0

02

0

0,0

03

0,0

01

0,0

02

0

0,0

01

0

0,0

43

0,1

08

0,0

1

0,0

14

0,0

45

0,0

17

0,0

3

0,0

1

0,3

32

0,1

59

0,0

35

0,0

35

0,0

14

0,0

15

0,0

09

0,0

11

0,0

06

0,0

13

0,0

13

0,0

13

0,0

27

0,0

06

0,0

44

0,0

52

0,0

24

0,3

18

0,2

22

0,6

22

0,2

07

0,8

13

Fin

lân

dia

0,0

06

0,0

08

0,0

06

0,0

07

0,0

11

0,0

07

0,0

12

0,0

08

0,0

06

0,0

06

0,0

08

0,0

07

0,0

09

0,0

05

0,0

05

0,0

06

0

0,1

56

0,0

44

0,0

63

0,1

52

0,0

7

0,1

22

0,0

18

0,3

68

0,1

32

0,0

36

0,0

27

0,0

8

0,0

5

0,0

58

0,0

28

0,0

42

0,0

14

0,0

42

0,0

35

0,0

75

0,0

27

0,0

3

0,1

05

0,0

73

0,2

46

0,1

8

0,6

24

0,3

74

0,7

75

Ho

lan

da

0,0

07

0,0

07

0,0

06

0,0

07

0,0

08

0,0

05

0,0

09

0,0

09

0,0

06

0,0

05

0,0

07

0,0

06

0,0

07

0,0

04

0,0

06

0,0

03

0,0

09

0

0,1

19

0,1

01

0,1

61

0,0

99

0,0

93

0,1

17

0,3

76

0,2

3

0,1

42

0,1

32

0,1

02

0,1

11

0,1

17

0,1

05

0,1

0,1

04

0,1

01

0,0

99

0,1

57

0,1

11

0,1

23

0,1

34

0,1

82

0,3

46

0,2

13

0,5

94

0,1

82

0,8

1

Bélg

ica

0,0

01

0,0

03

0,0

01

0,0

02

0,0

04

0,0

01

0,0

06

0,0

05

0,0

02

0,0

01

0,0

04

0,0

02

0,0

03

0

0,0

01

0,0

01

0,0

04

0,0

04

0

0,0

38

0,0

45

0,0

13

0,0

42

0,0

14

0,2

65

0,1

24

0,0

4

0,0

22

0,0

17

0,0

19

0,0

12

0,0

11

0,0

07

0,0

14

0,0

15

0,0

22

0,0

36

0,0

1

0,0

4

0,0

5

0,0

26

0,2

7

0,2

03

0,5

55

0,1

97

0,7

64

Su

iça

0,0

02

0,0

02

0,0

03

0,0

04

0,0

03

0,0

01

0,0

04

0,0

03

0,0

02

0,0

01

0,0

03

0,0

03

0,0

02

0

0,0

02

0

0,0

07

0,0

03

0,0

01

0

0,0

68

0,0

39

0,0

41

0,0

27

0,4

14

0,2

0,0

63

0,0

66

0,0

34

0,0

29

0,0

31

0,0

29

0,0

25

0,0

28

0,0

31

0,0

25

0,0

49

0,0

18

0,0

57

0,0

61

0,0

52

0,3

67

0,2

33

0,6

28

0,2

02

0,8

14

Itá

lia

0,0

02

0,0

03

0,0

04

0,0

06

0,0

02

0,0

02

0,0

03

0,0

03

0,0

03

0,0

02

0,0

03

0,0

03

0,0

01

0,0

02

0,0

03

0,0

01

0,0

08

0,0

05

0,0

03

0,0

01

0

0,0

33

0,0

2

0,0

82

0,2

58

0,2

27

0,1

23

0,1

11

0,0

27

0,0

52

0,0

49

0,0

7

0,0

39

0,0

83

0,0

54

0,0

73

0,0

81

0,0

68

0,1

21

0,0

54

0,0

7

0,4

18

0,3

33

0,6

51

0,1

17

0,8

51


86

Po

rtu

ga

l

0,0

02

0,0

02

0,0

02

0,0

05

0,0

03

0,0

03

0,0

04

0,0

04

0,0

02

0,0

01

0,0

04

0,0

03

0,0

03

0,0

01

0,0

03

0,0

01

0,0

07

0,0

04

0,0

01

0

0,0

02

0

0,0

2

0,0

35

0,2

77

0,1

62

0,0

54

0,0

38

0,0

09

0,0

28

0,0

13

0,0

34

0,0

06

0,0

25

0,0

15

0,0

32

0,0

36

0,0

21

0,0

66

0,0

57

0,0

41

0,3

12

0,2

31

0,5

58

0,1

48

0,7

33

Es

pa

nh

a

0,0

03

0,0

02

0,0

03

0,0

05

0,0

03

0,0

01

0,0

05

0,0

05

0,0

03

0,0

02

0,0

04

0,0

02

0,0

02

0,0

01

0,0

03

0,0

01

0,0

07

0,0

03

0,0

02

0

0,0

01

0,0

01

0

0,0

67

0,2

97

0,2

3

0,0

81

0,0

82

0,0

11

0,0

31

0,0

28

0,0

56

0,0

26

0,0

57

0,0

31

0,0

49

0,0

5

0,0

47

0,0

92

0,0

62

0,0

55

0,4

01

0,2

93

0,5

99

0,1

0,7

93

Din

am

arc

a

0,0

01

0,0

03

0,0

01

0,0

03

0,0

04

0,0

01

0,0

05

0,0

04

0,0

02

0,0

01

0,0

03

0,0

02

0,0

03

0

0,0

01

0

0,0

04

0,0

02

0

0

0,0

02

0,0

01

0,0

02

0

0,3

3

0,1

3

0,0

39

0,0

29

0,0

41

0,0

26

0,0

26

0,0

05

0,0

15

0,0

06

0,0

19

0,0

19

0,0

51

0,0

06

0,0

31

0,0

61

0,0

43

0,2

77

0,1

91

0,6

46

0,2

74

0,8

46

Gro

ne

lân

dia

0,0

61

0,0

52

0,0

58

0,0

61

0,0

53

0,0

55

0,0

46

0,0

46

0,0

54

0,0

55

0,0

51

0,0

58

0,0

54

0,0

54

0,0

55

0,0

54

0,0

5

0,0

53

0,0

53

0,0

49

0,0

5

0,0

52

0,0

51

0,0

52

0

0,1

79

0,3

79

0,2

96

0,2

88

0,2

86

0,3

41

0,2

98

0,2

87

0,3

13

0,3

04

0,3

1

0,4

03

0,3

4

0,3

06

0,1

88

0,3

67

0,2

48

0,3

1

0,5

61

0,3

94

0,8

09

Cas

aq

uis

tão

0,0

15

0,0

11

0,0

16

0,0

19

0,0

11

0,0

15

0,0

06

0,0

05

0,0

13

0,0

13

0,0

14

0,0

16

0,0

12

0,0

12

0,0

15

0,0

13

0,0

12

0,0

17

0,0

13

0,0

12

0,0

12

0,0

12

0,0

13

0,0

12

0,0

42

0

0,1

71

0,1

18

0,1

79

0,1

64

0,1

89

0,1

28

0,1

49

0,1

29

0,1

76

0,1

12

0,2

21

0,1

58

0,1

47

0,0

93

0,1

95

0,0

4

0,0

39

0,4

33

0,4

52

0,6

12

Le

tón

ia

0,0

03

0,0

06

0,0

02

0,0

03

0,0

08

0,0

01

0,0

09

0,0

09

0,0

03

0,0

03

0,0

07

0,0

04

0,0

06

0,0

03

0,0

01

0,0

03

0,0

08

0,0

07

0,0

03

0,0

03

0,0

06

0,0

05

0,0

04

0,0

03

0,0

56

0,0

19

0

0,0

14

0,0

41

0,0

31

0,0

25

0,0

36

0,0

4

0,0

28

0,0

47

0,0

31

0,0

18

0,0

32

0,0

42

0,1

26

0,0

27

0,2

82

0,2

23

0,5

46

0,2

92

0,7

22

Es

tón

ia

0,0

01

0,0

04

0,0

01

0,0

02

0,0

06

0,0

02

0,0

07

0,0

07

0,0

01

0,0

01

0,0

05

0,0

03

0,0

05

0,0

01

0

0,0

02

0,0

04

0,0

05

0,0

01

0,0

02

0,0

03

0,0

02

0,0

03

0,0

01

0,0

56

0,0

13

0,0

01

0

0,0

39

0,0

27

0,0

26

0,0

26

0,0

29

0,0

16

0,0

38

0,0

29

0,0

34

0,0

24

0,0

25

0,0

95

0,0

37

0,2

19

0,1

77

0,4

69

0,2

63

0,6

56

Sé

rbia

0,0

01

0,0

02

0,0

01

0,0

03

0,0

02

0

0,0

05

0,0

05

0,0

01

0

0,0

03

0,0

01

0,0

02

0,0

01

0,0

01

0,0

01

0,0

07

0,0

05

0,0

01

0,0

01

0,0

01

0,0

01

0,0

01

0,0

01

0,0

55

0,0

13

0,0

03

0,0

02

0

0,0

14

0,0

08

0,0

32

0,0

1

0,0

31

0,0

23

0,0

25

0,0

22

0,0

25

0,0

59

0,0

58

0,0

27

0,3

28

0,2

48

0,5

34

0,1

36

0,7

19

Mo

nte

neg

ro

0,0

03

0,0

02

0,0

04

0,0

07

0,0

01

0,0

01

0,0

04

0,0

05

0,0

02

0,0

02

0,0

03

0,0

02

0,0

01

0,0

03

0,0

03

0,0

02

0,0

1

0,0

08

0,0

03

0,0

03

0,0

03

0,0

03

0,0

03

0,0

03

0,0

57

0,0

14

0,0

04

0,0

04

0,0

01

0

0,0

16

0,0

15

0,0

15

0,0

18

0,0

22

0,0

2

0,0

31

0,0

15

0,0

2

0,0

54

0,0

31

0,3

06

0,2

31

0,5

33

0,1

82

0,7

39

Cro

ác

ia

0,0

02

0,0

04

0,0

01

0,0

03

0,0

05

0,0

01

0,0

08

0,0

07

0,0

02

0,0

02

0,0

04

0,0

01

0,0

03

0,0

02

0,0

01

0,0

02

0,0

05

0,0

07

0,0

01

0,0

02

0,0

03

0,0

02

0,0

04

0,0

02

0,0

56

0,0

15

0,0

03

0,0

02

0,0

01

0,0

02

0

0,0

23

0,0

11

0,0

22

0,0

17

0,0

28

0,0

09

0,0

12

0,0

5

0,0

83

0,0

13

0,3

45

0,2

61

0,5

86

0,1

77

0,7

91

No

rue

ga

0,0

03

0,0

04

0,0

03

0,0

04

0,0

04

0,0

02

0,0

06

0,0

05

0,0

03

0,0

02

0,0

03

0,0

03

0,0

03

0,0

01

0,0

01

0,0

01

0,0

04

0,0

03

0,0

01

0,0

01

0,0

02

0,0

03

0,0

03

-0,0

01

0,0

47

0,0

12

0,0

04

0,0

02

0,0

02

0,0

04

0,0

03

0

0,0

15

0,0

09

0,0

2

0,0

17

0,0

49

0,0

09

0,0

2

0,0

53

0,0

39

0,2

72

0,1

93

0,5

96

0,2

39

0,8

15


87

Fra

nç

a

0

0,0

02

0,0

01

0,0

03

0,0

03

0

0,0

05

0,0

03

0,0

02

0

0,0

03

0,0

01

0,0

02

0

0,0

01

0

0,0

05

0,0

03

0

0

0

0

0

0

0,0

54

0,0

13

0,0

03

0,0

01

0

0,0

02

0,0

01

0,0

01

0

0,0

1

0,0

07

0,0

16

0,0

35

0,0

09

0,0

41

0,0

47

0,0

35

0,2

98

0,2

15

0,5

78

0,1

84

0,7

49

Rein

o U

nid

o

0,0

03

0,0

03

0,0

02

0,0

04

0,0

05

0,0

02

0,0

06

0,0

05

0,0

02

0,0

01

0,0

04

0,0

03

0,0

04

0

0,0

01

0,0

01

0,0

04

0,0

03

0

0

0,0

03

0,0

01

0,0

02

-0,0

01

0,0

52

0,0

13

0,0

03

0,0

01

0,0

02

0,0

03

0,0

02

0

0

0

0,0

13

0,0

14

0,0

43

0,0

05

0,0

2

0,0

61

0,0

43

0,2

6

0,1

8

0,5

67

0,2

47

0,7

41

Irla

nd

a

0,0

02

0,0

03

0,0

02

0,0

03

0,0

04

0,0

02

0,0

06

0,0

05

0,0

02

0,0

01

0,0

04

0,0

03

0,0

04

0,0

01

0,0

01

0,0

01

0,0

04

0,0

03

0

0

0,0

02

0,0

01

0,0

01

0

0,0

48

0,0

13

0,0

03

0,0

01

0,0

02

0,0

04

0,0

02

0,0

01

0

0

0

0,0

31

0,0

44

0,0

1

0,0

45

0,0

64

0,0

4

0,3

37

0,2

41

0,6

34

0,1

94

0,8

26

Mo

ldá

via

0,0

02

0

0,0

02

0,0

05

0,0

02

0

0,0

03

0,0

03

0,0

01

0

0,0

03

0,0

03

0,0

02

0,0

01

0,0

02

0,0

01

0,0

07

0,0

05

0,0

02

0,0

01

0,0

02

0,0

02

0,0

02

0,0

02

0,0

52

0,0

11

0,0

03

0,0

02

0,0

01

0,0

02

0,0

03

0,0

03

0,0

01

0,0

02

0,0

02

0

0,0

43

0,0

21

0,0

38

0,0

44

0,0

42

0,2

31

0,1

5

0,5

11

0,2

42

0,6

62

Bie

lorr

ús

sia

0,0

01

0,0

04

0

0,0

02

0,0

06

0,0

01

0,0

07

0,0

08

0,0

02

0,0

01

0,0

05

0,0

02

0,0

04

0,0

02

0

0,0

02

0,0

06

0,0

06

0,0

02

0,0

03

0,0

03

0,0

03

0,0

03

0,0

02

0,0

55

0,0

15

0,0

02

0,0

01

0,0

02

0,0

04

0,0

02

0,0

03

0,0

02

0,0

03

0,0

02

0,0

02

0

0,0

32

0,0

72

0,1

23

0,0

09

0,3

67

0,2

87

0,5

74

0,2

15

0,7

68

Su

éc

ia

0,0

02

0,0

06

0,0

02

0,0

04

0,0

06

0,0

02

0,0

08

0,0

07

0,0

04

0,0

02

0,0

05

0,0

03

0,0

05

0,0

01

0,0

02

0,0

01

0,0

04

0,0

03

0

0,0

01

0,0

04

0,0

03

0,0

03

-0,0

01

0,0

56

0,0

14

0,0

03

0,0

02

0,0

03

0,0

05

0,0

03

0,0

01

0,0

01

0

0,0

01

0,0

04

0,0

04

0

0,0

28

0,0

65

0,0

29

0,3

11

0,2

17

0,6

05

0,2

21

0,8

1

Islâ

nd

ia

0,0

07

0,0

05

0,0

06

0,0

08

0,0

06

0,0

05

0,0

07

0,0

07

0,0

04

0,0

04

0,0

06

0,0

06

0,0

06

0,0

03

0,0

05

0,0

04

0,0

07

0,0

07

0,0

02

0,0

03

0,0

05

0,0

04

0,0

04

0,0

02

0,0

48

0,0

14

0,0

07

0,0

04

0,0

05

0,0

05

0,0

06

0,0

03

0,0

03

0,0

01

0,0

03

0,0

05

0,0

07

0,0

03

0

0,0

85

0,0

71

0,2

63

0,2

03

0,5

15

0,2

63

0,7

29

Azerb

eij

ão

0,0

07

0,0

04

0,0

08

0,0

1

0,0

03

0,0

05

0,0

01

0,0

02

0,0

05

0,0

05

0,0

06

0,0

07

0,0

03

0,0

06

0,0

07

0,0

05

0,0

1

0,0

1

0,0

07

0,0

05

0,0

03

0,0

04

0,0

05

0,0

06

0,0

52

0,0

08

0,0

11

0,0

07

0,0

05

0,0

05

0,0

06

0,0

07

0,0

05

0,0

07

0,0

06

0,0

04

0,0

07

0,0

1

0,0

08

0

0,1

03

0,2

29

0,1

51

0,5

28

0,2

1

0,7

16

Rú

ss

ia

0

0,0

04

0

0,0

01

0,0

06

0,0

01

0,0

07

0,0

06

0,0

02

0,0

01

0,0

04

0,0

01

0,0

03

0,0

01

0

0,0

01

0,0

06

0,0

05

0,0

02

0,0

02

0,0

03

0,0

03

0,0

02

0,0

01

0,0

53

0,0

13

0,0

01

0,0

01

0,0

01

0,0

03

0,0

01

0,0

02

0,0

01

0,0

02

0,0

02

0,0

02

0,0

01

0,0

02

0,0

06

0,0

08

0

0,3

52

0,2

76

0,5

86

0,2

31

0,8

06

Sib

éri

a

0,0

24

0,0

19

0,0

26

0,0

28

0,0

19

0,0

24

0,0

14

0,0

11

0,0

21

0,0

21

0,0

23

0,0

27

0,0

2

0,0

21

0,0

24

0,0

22

0,0

17

0,0

24

0,0

22

0,0

21

0,0

2

0,0

19

0,0

21

0,0

2

0,0

42

0,0

03

0,0

29

0,0

22

0,0

22

0,0

25

0,0

24

0,0

2

0,0

21

0,0

21

0,0

2

0,0

19

0,0

24

0,0

23

0,0

22

0,0

14

0,0

23

0

0,0

45

0,3

55

0,6

43

0,4

89

Ch

ina

0,0

33

0,0

25

0,0

33

0,0

4

0,0

27

0,0

34

0,0

2

0,0

17

0,0

29

0,0

3

0,0

32

0,0

34

0,0

27

0,0

31

0,0

33

0,0

3

0,0

31

0,0

36

0,0

33

0,0

29

0,0

27

0,0

28

0,0

29

0,0

31

0,0

56

0,0

08

0,0

38

0,0

31

0,0

3

0,0

31

0,0

33

0,0

32

0,0

31

0,0

32

0,0

32

0,0

27

0,0

32

0,0

36

0,0

31

0,0

2

0,0

31

0,0

1

0

0,3

91

0,5

17

0,5

39


88

Áfr

ica

do

Su

l

0,0

4

0,0

35

0,0

42

0,0

45

0,0

36

0,0

42

0,0

29

0,0

31

0,0

38

0,0

38

0,0

33

0,0

43

0,0

39

0,0

41

0,0

42

0,0

39

0,0

43

0,0

39

0,0

41

0,0

37

0,0

35

0,0

35

0,0

39

0,0

41

0,0

55

0,0

35

0,0

48

0,0

39

0,0

39

0,0

39

0,0

43

0,0

41

0,0

37

0,0

4

0,0

39

0,0

36

0,0

42

0,0

47

0,0

36

0,0

32

0,0

41

0,0

38

0,0

43

0

0,5

7

0,1

31

Ma

rro

co

s

0,0

1

0,0

08

0,0

11

0,0

15

0,0

09

0,0

1

0,0

08

0,0

07

0,0

1

0,0

09

0,0

1

0,0

09

0,0

08

0,0

09

0,0

11

0,0

08

0,0

16

0,0

11

0,0

1

0,0

07

0,0

05

0,0

06

0,0

05

0,0

1

0,0

51

0,0

15

0,0

14

0,0

1

0,0

08

0,0

1

0,0

11

0,0

11

0,0

07

0,0

1

0,0

09

0,0

08

0,0

11

0,0

12

0,0

1

0,0

09

0,0

1

0,0

22

0,0

26

0,0

3

0

0,8

42

An

go

la

0,0

38

0,0

31

0,0

38

0,0

39

0,0

32

0,0

38

0,0

26

0,0

28

0,0

34

0,0

34

0,0

3

0,0

38

0,0

36

0,0

36

0,0

38

0,0

34

0,0

38

0,0

34

0,0

36

0,0

32

0,0

31

0,0

3

0,0

33

0,0

35

0,0

46

0,0

29

0,0

42

0,0

34

0,0

35

0,0

37

0,0

39

0,0

35

0,0

33

0,0

35

0,0

34

0,0

33

0,0

36

0,0

41

0,0

31

0,0

28

0,0

37

0,0

31

0,0

39

0,0

06

0,0

25

0

Ucrâ

nia

Ro

mé

nia

Po

lón

ia

Lit

uâ

nia

Alb

ân

ia

Es

lov

ên

ia

Ira

qu

e

Tu

rqu

ia

Es

lov

áq

uia

Hu

ng

ria

Ma

ce

dó

nia

Bo

sn

ia e

Herz

eg

ov

ina

Gré

cia

Áu

str

ia

Rep

ub

lic

a

Ch

ec

a

Ale

ma

nh

a

Fin

lân

dia

Ho

lan

da

Bélg

ica

Su

iça

Itá

lia

Po

rtu

ga

l

Es

pa

nh

a

Din

am

arc

a

Gro

ne

lân

dia

Cas

aq

uis

tão

Le

tón

ia

Es

tón

ia

Sé

rbia

Mo

nte

neg

ro

Cro

ác

ia

No

rue

ga

Fra

nç

a

Re

ino

Un

ido

Irla

nd

a

Mo

ldá

via

Bie

lorr

ús

sia

Su

éc

ia

Islâ

nd

ia

Azerb

eij

ão

Rú

ss

ia

Sib

éri

a

Ch

ina

Áfr

ica

do

Su

l

Ma

rro

co

s

An

go

la


89

Anexo 4

Tabela 17. Valor de p locus a locus para a distância de FST (intracontinental)

Dentro da África Dentro da Ásia (este) Dentro

do

médio

oriente

Norte de

África vs

Sudoeste

de Ásia

Norte de África vs

Médio Oriente

Norte

de

África

vs

Europa

Médio Oriente vs

sudoeste asiático Sudoeste asiático vs este asiático

Somália

vs África

Sul

(bantu)

Somália

vs

Marrocos

Marrocos

vs África

Sul

(bantu)

Cazaquistão

vs Sibéria Cazaquistão

vs China Sibéria

vs China

Iraque

vs

Turquia

Marrocos

vs

Azerbaijão

Marrocos

vs Iraque

Marrocos

vs

Turquia

Marrocos

vs

Ucrânia

Iraque vs

Azerbaijão Turquia vs

Azerbaijão Sibéria vs

Azerbaijão China vs

Azerbaijão Cazaquistão

vs Azerbaijão

SE33 0,07207 … … … … … 0,63063 … … … … … … … … …

vWA 0,00000 0,06306 0,00000 0,30631 0,00000 0,00000 0,76577 0,00000 0,16216 0,01802 0,02703 0,26126 0,26126 0,00000 0,00000 0,00000

D16S539 0,00000 0,01802 0,00000 0,74775 0,00000 0,07207 0,69369 0,01802 0,12613 0,07207 0,75676 0,82883 0,92793 0,00000 0,00000 0,00000

D2S1338 0,00000 0,00000 0,00000 0,90090 0,00000 0,27027 0,20721 0,00000 0,00000 0,02703 0,73874 0,68468 0,31532 0,00000 0,00000 0,00000

D8S1179 0,01802 0,00901 0,00000 0,02703 0,00000 0,00000 0,61261 0,00000 0,48649 0,09910 0,00000 0,48649 0,49550 0,36937 0,00000 0,84685

D21S11 0,00000 0,00901 0,00000 0,00000 0,06306 0,00000 0,90090 0,07207 0,28829 0,33333 0,06306 0,87387 0,91892 0,00000 0,00000 0,00000

D18S51 0,01802 0,00000 0,00000 0,05405 0,00000 0,00000 0,96396 0,00000 0,12613 0,79279 0,11712 0,00000 0,00000 0,00000 0,00000 0,00000

D19S433 0,00000 0,02703 0,00000 0,00901 0,00000 0,11712 0,76577 0,00000 0,07207 0,29730 0,46847 0,18919 0,46847 0,09910 0,00000 0,00000

TH01 0,00000 0,00000 0,00000 0,08108 0,00000 0,00000 0,97297 0,00000 0,23423 0,04505 0,00000 0,93694 0,71171 0,00000 0,00000 0,00000

FGA 0,01802 0,00000 0,00000 0,14414 0,02703 0,00000 0,20721 0,00000 0,00000 0,00000 0,01802 0,36937 0,64865 0,00000 0,00000 0,00000

D3S1358 0,00000 0,03604 0,00000 0,03604 0,11712 0,09009 0,83784 0,90991 0,84685 0,49550 0,50450 0,83784 0,27928 0,00000 0,00000 0,01802

D10S1248 0,00901 … … … … … 0,07207 … … … … … … … … …

D22S1045 0,00000 … … … … … 0,16216 … … … … … … … … …

D2S441 0,00000 … … … … … 0,88288 … … … … … … … … …

D1S1656 0,00000 … … … … … 0,93694 … … … … … … … … …

D12S391 0,00901 … … … … … 0,81982 … … … … … … … … …

Valor de significância para 95% (valores significativos a azul; p<0,003 após a correção de Bonferroni)


90

Anexo 5

Tabela 18. Valor de p para a comparação de FST locus a locus entre a Ucrânia e os outros países já descritos na literatura

Ucrânia

vs

Lituânia

[75]

Albânia

[75]

Eslovêni

a [75]

Iraque

[75]

Turquia

[75]

Bósnia e

Herzegovi

na [92]

Alemanh

a [92]

Holanda

[93]

Espanh

a [94]

Dinamarc

a [95]

Gronelâ

ndia [95]

Cazaquist

ão [96]

África do

Sul a [97]

China b[98]

Somália

[95]

SE33 0,39640 0,19820 0,56757 0,32432 0,49550 0,09910 0,54955 0,37838 0,12613 0,55856 0,00000 0,02703 0,09009 0,02703 0,00901

vWA 0,97297 0,78378 0,42342 0,84685 0,43243 0,83784 0,54955 0,00000 0,09009 0,74775 0,10811 0,52252 0,00901 0,01802 0,00000

D16S539 0,71171 0,73874 0,89189 0,24324 0,34234 0,80180 0,74775 0,43243 0,90090 0,87387 0,00901 0,00000 0,00000 0,00000 0,47748

D2S1338 0,13514 0,43243 0,52252 0,10811 0,17117 0,79279 0,40541 0,20721 0,82883 0,27928 0,00000 0,00000 0,00000 0,00000 0,00000

D8S1179 0,49550 0,25225 0,60360 0,21622 0,30631 0,75676 0,79279 0,89189 0,29730 0,90090 0,00000 0,27928 0,00000 0,00000 0,00000

D21S11 0,71171 0,11712 0,78378 0,58559 0,90090 0,89189 0,63063 0,42342 0,26126 0,58559 0,00000 0,02703 0,00000 0,00000 0,00901

D18S51 0,40541 0,19820 0,33333 0,19820 0,63063 0,64865 0,02703 0,04505 0,07207 0,23423 0,00901 0,03604 0,00901 0,42342 0,00000

D19S433 0,92793 0,52252 0,40541 0,48649 0,89189 0,15315 0,78378 0,46847 0,81982 0,54955 0,01802 0,27027 0,05405 0,03604 0,08108

TH01 0,63964 0,39640 0,61261 0,29730 0,33333 0,74775 0,89189 0,28829 0,66667 0,52252 0,00000 0,01802 0,00000 0,00000 0,00000

FGA 0,81982 0,54054 0,88288 0,15315 0,24324 0,88288 0,97297 0,79279 0,88288 0,98198 0,00000 0,00000 0,07207 0,00901 0,00000

D3S1358 0,80180 0,89189 0,89189 0,35135 0,26126 0,90090 0,99099 0,98198 0,99099 0,87387 0,00000 0,04505 0,00901 0,01802 0,05405

D10S124

8 0,94595 0,58559 0,81982 0,95495 0,09009 0,63063 0,32432 0,07207 0,13514 0,20721 0,08108 0,01802 0,01802 0,00000 0,09910

D22S104

5 0,86486 0,82883 0,89189 0,26126 0,88288 0,81081 0,39640 0,37838 0,09910 0,51351 0,00901 0,16216 0,00000 0,14414 0,01802

D2S441 0,86486 0,22523 0,44144 0,11712 0,25225 0,73874 0,19820 0,18919 0,41441 0,21622 0,00000 0,01802 0,00000 0,00000 0,00901

D1S1656 0,72973 0,74775 0,80180 0,51351 0,35135 0,68468 0,74775 0,72973 0,75676 0,80180 0,00000 0,00000 0,00000 0,00000 0,00000

D12S391 0,36937 0,65766 0,92793 0,72072 0,63964 0,81081 0,54054 0,38739 0,56757 0,75676 0,00000 0,13514 0,23423 0,17117 0,00000

Valor de significância para 95% (valores significativos a azul; p<0,003 após a correção de Bonferroni)


91

Anexo 6

Tabela 19. Valores de heterozigotia e desvio padrão para cada um dos marcadores do kit NGM Select para 16 populações

Ucrâni

a

Lituânia

[75]

Albâni

a [75]

Eslovênia

[75]

Iraque

[75]

Turquia

[75]

Bósnia e

Herzegov

ina [92]

Aleman

ha [92]

Holan

da

[93]

Espan

ha [94]

Dina

marc

a [95]

Gronelâ

ndia [95]

Cazaquist

ão [96]

África

do Sul a [97]

Chi

na b[98]

Somá

lia

[95]

desvi

o

padr

ão

(%)

D1S1656 0,89 0,89 0,90 0,90 0,88 0,90 0,89 0,90 0,90 0,89 0,90 0,82 0,86 0,84 0,82 0,87 2,6

D2S441 0,78 0,75 0,77 0,78 0,76 0,76 0,77 0,75 0,75 0,76 0,75 0,66 0,74 0,76 0,78 0,79 1,5

D2S1338 0,85 0,86 0,87 0,88 0,89 0,87 0,86 0,87 0,88 0,86 0,88 0,77 0,87 0,88 0,86 0,85 1,2

D3S1358 0,80 0,79 0,78 0,78 0,76 0,76 0,79 0,80 0,80 0,79 0,79 0,59 0,74 0,72 0,72 0,75 2,8

D8S1179 0,79 0,75 0,80 0,80 0,83 0,83 0,79 0,81 0,81 0,82 0,81 0,73 0,81 0,77 0,85 0,78 2,6

D10S1248 0,75 0,76 0,77 0,77 0,77 0,78 0,78 0,77 0,75 0,77 0,75 0,66 0,78 0,79 0,74 0,79 1,5

D12S391 0,87 0,89 0,89 0,87 0,87 0,89 0,90 0,89 0,90 0,90 0,90 0,83 0,86 0,86 0,85 0,84 2,1

D16S539 0,76 0,74 0,79 0,75 0,80 0,78 0,74 0,78 0,77 0,76 0,77 0,70 0,81 0,76 0,79 0,80 2,1

D18S51 0,86 0,88 0,87 0,88 0,89 0,88 0,88 0,88 0,88 0,87 0,88 0,85 0,86 0,88 0,86 0,90 1,2

D19S433 0,81 0,80 0,83 0,77 0,84 0,80 0,78 0,78 0,78 0,79 0,79 0,83 0,83 0,82 0,82 0,81 2,1

D21S11 0,86 0,86 0,84 0,85 0,86 0,87 0,86 0,86 0,84 0,84 0,84 0,81 0,82 0,84 0,82 0,84 1,4

D22S1045 0,77 0,73 0,73 0,75 0,71 0,76 0,74 0,72 0,73 0,68 0,73 0,69 0,77 0,84 0,77 0,73 3,7

FGA 0,86 0,84 0,87 0,87 0,86 0,85 0,84 0,86 0,87 0,86 0,87 0,85 0,85 0,88 0,87 0,85 1,1

SE33 0,95 0,95 0,94 0,94 0,95 0,95 0,94 0,95 0,95 0,95 0,95 0,85 0,95 0,92 0,95 0,93 0,9

TH01 0,78 0,75 0,79 0,77 0,79 0,80 0,79 0,79 0,77 0,79 0,78 0,52 0,79 0,71 0,66 0,75 3,9

Vwa 0,82 0,82 0,81 0,81 0,80 0,81 0,82 0,81 0,81 0,81 0,81 0,78 0,80 0,80 0,80 0,80 0,6