FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
i
Resumo e palavras-chave
Neste trabalho, uma amostra de indivíduos ucranianos residentes em Portugal
foi caraterizada para os marcadores incluídos no kit NGM Select, um dos kits comerciais
mais usado em análises de rotina forense. Os valores de heterozigotia, poder de
discriminação combinado (PDc) e poder de exclusão combinado (PEc), demonstram um
elevado nível de discriminação entre indivíduos de origem ucraniana que este kit
oferece, reforçando a seu poder informativo e importância em análises de rotina forense.
Comparações entre populações revelaram diferenciação genética significativa entre a
amostra ucraniana e populações de regiões não europeias. As análises comparativas,
efetuadas com diferente número de marcadores do kit e de populações, e baseadas em
duas medidas de diferenciação genética, indicaram ainda que em estudos
populacionais, combinando os marcadores do kit ou os sub-conjuntos foi possível
diferenciar bem populações de diferentes continentes. Na Europa, encontrou-se baixa
substrutura populacional, modestamente relacionada com a geografia. Os gradientes de
diversidade detetados podem ter resultado de algumas migrações que marcaram a
história da Europa, nomeadamente as que ocorreram no período neolítico aquando da
introdução da agricultura, e mais tarde, após a última época glaciar, quando se registou
importante repovoação do continente.
Palavras-chave:
Genética Forense, STRs, Dados Populacionais, Ucrânia, Comparações intra e
interpopulacionais
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
ii
Abstract and keywords
In this work, a sample of Ukrainians living in Portugal was characterized for the
autosomal markers included in the NGM Select kit, a kit primarily used in forensic
casework analysis. The estimated values of heterozygosity, combined power of
discrimination (PDc) and combined probability of paternity exclusion (PEc),
demonstrated the high level of discrimination between Ukrainians afforded by this kit,
thereby making it very informative and consequently an important asset in forensic
routine. Interpopulation comparisons showed significant genetic differentiation between
the sample of Ukrainians and populations from non-European regions. Interpopulational
comparisons with different number of populations and makers and based in two different
genetic distances pinpoint the prospective use of the NGM Select kit mainly in population
genetic studies addressing the genetic differentiation between continental populations.
Within Europe, low population structure, modestly related with geography, was detected
with this kit. Some of the genetic diversity gradients observed might be related with major
migrations within Europe, namely in Neolithic, when the introduction of agriculture in
Europe occurred, and later, after the last glaciar maxium (LGM) during the continent
repopulation.
Keywords:
Forensic Genetics, STRs, Populational Data, Ukraine, intrapopulation and
interpopulacional comparisons
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
iii
Índice
Resumo e palavras-chave ................................................................ i
Abstract and keywords ................................................................... ii
Lista de tabelas .............................................................................. v
Lista de figuras .............................................................................. vii
Lista de abreviaturas ..................................................................... ix
1. Introdução ................................................................................... 1
1.1. Marcadores genéticos .......................................................................... 1
1.1.1. STRs ..................................................................................................... 2
1.1.2. kit NGM Select ....................................................................................... 3
1.1.3. Utilização dos marcadores genéticos em estudos de ancestralidade .... 5
1.2. Genética da Europa ............................................................................. 5
1.3. Da Ucrânia até Portugal ........................................................................ 7
2. Objetivos .................................................................................... 9
3. Material e métodos .................................................................. 10
3.1. Amostragem populacional .................................................................. 10
3.2. Extração do ADN ............................................................................... 10
3.3. Amplificação do ADN ......................................................................... 11
3.4. Separação e genotipagem ................................................................. 11
3.5. Análise de dados ................................................................................ 12
3.5.1. Intrapopulacional .......................................................................... 12
3.5.2. Interpopulacional .......................................................................... 16
4. Resultados e discussão ........................................................... 21
4.1. Diversidade genética dos ucranianos ................................................ 21
4.2. Estudo interpopulacional ......................................................................... 30
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
iv
4.2.1. Intercontinental ..................................................................................... 30
4.2.1.1. Análise com a distância genética FST ............................................. 31
4.2.1.2. Análise com a distância genética (δμ)2 ........................................... 35
4.2.1.3. Testes de Mantel ........................................................................ 38
4.2.2. Fronteira Europa-Ásia/ fronteira Ucrânia ............................................... 38
4.2.2.1. Fronteira Europa-Ásia ......................................................................... 38
4.2.2.2. Fronteira Ucrânia ................................................................................. 41
4.2.3. Europa .................................................................................................. 44
4.2.4. Kit NGM Select ............................................................................. 54
4.3. Marcadores e distâncias genéticas ............................................................. 57
5. Conclusões ............................................................................... 64
6. Referências bibliográficas ......................................................... 65
Anexos ......................................................................................... 79
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
v
Lista de tabelas
Tabela 1. Parametização do termociclador para a reação de PCR com o kit AmpFℓSTR®
NGM SelectTM ........................................................................................................... 11
Tabela 2. Tabela com os parâmetros forenses e populacionais estudados .............. 26
Tabela 3. Variação nos valores da distância de FST (em percentagem) entre 7 regiões
definidas (médio oriente, Europa, Ásia (oeste), Ásia (centro-oriente), Norte de África,
África e Gronelândia) ................................................................................................ 32
Tabela 4. Variação nos valores da distância de (δμ)2 entre 7 regiões definidas (médio
oriente, Europa, Ásia (oeste), Ásia (centro-oriente), Norte de África, África e
Gronelândia) ............................................................................................................. 37
Tabela 5. Relação entre a latitude/longitude e as variáveis [,1] e [,2] para os gráficos de
MDS das distâncias genéticas entre as populações ................................................. 49
Tabela 6. Distâncias de FST médias e desvio padrão entre as zonas europeias definidas
no gráfico da Figura 14 ............................................................................................. 49
Tabela 7. Regressão linear para a variação na distância genética FST ou heterozigotia
em função da variação na longitude ......................................................................... 53
Tabela 8. Comparação de FST locus a locus entre a Ucrânia e outros países já descritos
na literatura ............................................................................................................... 55
Tabela 9. Valores de FST e respetivos valores de p para a comparação locus a locus
entre a Ucrânia e 3 regiões (norte, centro e sul) de Portugal .................................... 57
Tabela 10. Valores de R2 e p para os testes de Mantel avaliando a relação entre a
distância genética (FST ou (δμ)2) e geográfica para 10, 15 e 16 marcadores ............. 58
Tabela 11. Valores de R2 e p para os testes de Mantel avaliando a relação entre as
distâncias genéticas FST e (δμ)2, para 10, 15 e 16 marcadores genéticos ................. 58
Tabela 12. Valores de R2 e p para os testes de Mantel entre as distâncias genéticas FST
e (δμ)2, consoante o número de populações estudadas ............................................ 59
Tabela 13. Valores de R2 e p para os testes de Mantel avaliando a relação entre o
número de marcadores para os dados de FST e (δμ)2 ............................................... 59
Tabela 14. Regressão linear e o respetivo valor de R2 para a variação dos parâmetros
estudados em função de duas distâncias genéticas ................................................. 63
Tabela 15. Referências bibliográficas, número de indivíduos, loci estudados e regiões
geográficas dos dados utilizados para os diversos países presentes neste estudo .. 80
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
vi
Tabela 16. Matriz de distâncias genéticas para 46 populações (valores de FST acima da
diagonal e (δμ)2 abaixo) ............................................................................................ 84
Tabela 17. Valor de p locus a locus para a distância de FST (intracontinental) .......... 87
Tabela 18. Valor de p para a comparação de FST locus a locus entre a Ucrânia e os
outros países já descritos na literatura ...................................................................... 89
Tabela 19. Valores de heterozigotia e desvio padrão para cada um dos marcadores do
kit NGM Select para 16 populações .......................................................................... 91
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
vii
Lista de figuras
Figura 1. Variação no número de motivos repetitivos, CTA, de STR para diferentes
indivíduos ................................................................................................................... 3
Figura 2. Marcadores incluídos no kit AmpFℓSTR® NGM Select™ ............................ 4
Figura 3. Eletroferograma referente a 4 dos STRs testados obtido para um dos
indivíduos estudados ................................................................................................ 21
Figura 4. Número de alelos e de alelos raros presentes em cada um dos loci analisados
.................................................................................................................................. 23
Figura 5. Representação geográfica dos 46 países/zonas utilizados (a vermelho) na
comparação genética efetuada com os 10 marcadores descritos ............................. 30
Figura 6. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a
partir da comparação das populações representadas na Figura 5 para os 10 marcadores
anteriormente referidos .............................................................................................. 31
Figura 7. Valores de heterozigotia para os 10 marcadores referidos anteriormente, para
as 46 populações utilizadas na comparação ............................................................. 34
Figura 8. Gráfico de Multidimensional Scaling (MDS) para os valores de (δμ)2, obtidos
a partir da comparação das populações representadas na Figura 5 para os 10
marcadores anteriormente referidos ......................................................................... 36
Figura 9. Representação geográfica dos 18 países/zonas utilizados (a vermelho) na
comparação genética efetuada com os 10 marcadores descritos no ponto 4.2.1. ..... 39
Figura 10. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a
partir da comparação das populações representadas na Figura 9 para os 10 marcadores
referidos no ponto 4.2.1. ........................................................................................... 39
Figura 11. Heatmap da matriz da distância genética de (δμ)2 para as populações
estudadas ................................................................................................................. 41
Figura 12. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráficos de PCA para
frequências alélicas e heterozigotia (a), b), c) e d) respetivamente) obtidos a partir da
comparação das populações europeias representadas na Figura 9 que são fronteiras à
Ucrânia, para os 10 marcadores referidos no ponto 4.2.1. ......................................... 42
Figura 13. Representação geográfica dos 31 países (a vermelho) Europeus utilizados
na comparação genética efetuada com os 15 marcadores descritos anteriormente . 44
Figura 14. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráfico de PCA para
frequências alélicas (a), b) e c) respetivamente) obtidos a partir da comparação das
populações europeias representadas na Figura 13 .................................................. 45
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
viii
Figura 15. Relação entre a latitude/longitude e os componentes principais (1,2 e 3) para
o gráfico de PCA das frequências alélicas das populações europeias ...................... 48
Figura 16. Relação entre a variação na heterozigotia/ distância genética para os 15
marcadores e a distância em graus de latitude ao “sul europeu” .............................. 51
Figura 17. Relação entre a variação na heterozigotia / distância genética para os 15
marcadores e a distância em graus de latitude ao Levante ....................................... 52
Figura 18. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a
partir da comparação das populações descritas anteriormente para o kit NGM Select. O
gráfico a azul corresponde a um zoom in da área rodeada a azul ............................ 56
Figura 19. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos
a partir da comparação das populações descritas anteriormente para o kit NGM Select.
O gráfico a azul corresponde a um zoom in da área rodeada a azul ......................... 56
Figura 20. Distribuição das distâncias genéticas médias entre as 16 populações
referidas em 4.2.4. por locus ..................................................................................... 60
Figura 21. Valores de heterozigotia para as populações analisadas, por locus ........ 61
Figura 22. Valor de número de alelos médio para as populações analisadas em 4.2.4.
(exceto Gronelândia) e respetivo desvio padrão por locus ........................................ 62
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
ix
Lista de abreviaturas
ADN Ácido desoxirribonucleico
AIM Ancesty informative marker (marcador informativo de ancestralidade)
cMDS Classical Multidimensional scaling
CODIS Combined DNA Index System
EHW Equilíbrio de Hardy-Weinberg
ESS European Standard Set STR
FST Índice de fixação
He Heterozigotia esperada
HGDP-CEPH Human Genome Diversity Cell Line Panel
Ho Heterozigotia observada
HT Heterozigotia esperada da população (total)
HS Heterozigotia esperada da subpopulação
IP Índice de paternidade
LGM Last glaciar maximum (última época glaciar)
LR Razão de verossimilhança (likelihood ratio)
MDS Multidimensional Scaling (escalamento multidimensional)
PCA Principal component analysis (análise de componentes principais)
PCR Reação em cadeia da polimerase (polimerase chain reaction)
PD Poder de discriminação
PDc Poder de discriminação combinado
PE Probabilidade de exclusão
PEc Probabilidade de exclusão combinada
PI Probabilidade de identidade/ matching probability
PIB Produto interno bruto
PIC Polymorphic information content
SMM Setpwise mutation model
SGBF-N Serviços de genética e biologia forenses, delegação do Norte
SNP Single Nucleotide polymorphism
STR Short Tandem Repeat
STRBase Short Tandem Repeat DNA Internet DataBase
URSS União das Repúblicas Socialistas Soviéticas
VNTR Variable number tandem repeat
W Probabilidade de paternidade
(δμ)2 Delta mu squared
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
1
1. Introdução
A genética é um ramo da biologia que se debruça sobre o estudo dos genes e
dos mecanismos de transmissão da informação genética de geração em geração. Os
avanços nesta disciplina têm revolucionado muitas áreas do conhecimento, e resultaram
em aplicações extremamente importantes. Diversas áreas têm beneficiado dos
desenvolvimentos registados na genética, nomeadamente, a área forense, a ecologia,
o estudo da evolução das espécies, a medicina, a engenharia molecular, entre outras. A genética populacional é um dos ramos que tem dado dos contributos mais
extraordinários em termos de métodos e enquadramento teórico para diferentes áreas
da Biologia [1]. O seu foco é o estudo da variação genética entre e dentro das
populações através da análise da variação nas frequências génicas ao longo do espaço
e do tempo. Esta variação é ditada por diversos fenómenos, como recombinação,
mutação, e outros associados a processos evolutivos como: a seleção natural, a deriva
génica, a mutação e o fluxo génico [2].
A genética forense recebeu um grande impulso a partir de 1984, quando Alec
Jeffreys se apercebeu do potencial em aplicar o estudo dos marcadores de tipo VNTR
(variable number tandem repeat) à área forense. Graças aos avanços anteriormente
alcançados nas técnicas da biologia molecular, nomeadamente com a descoberta do
processo de PCR (reação de amplificação da polimerase), em 1983. Esta descoberta
constituiu uma revolução na genética molecular que permitiu analisar detalhadamente
o genoma. Aos VNTRs, cedo se juntou o estudo de outro tipo de marcadores, como os
SNP (single nucleotide polymorfism) e STR (short tandem repeat), que são atualmente
os mais utilizados na área forense [3]. Com o auxílio destes marcadores é possível
caraterizar geneticamente os indivíduos pertencentes a uma população e diferenciá-los
dos demais. Esses marcadores podem estar localizados no genoma nuclear, nos
autossomas, ou nos cromossomas sexuais (X e Y), ou no genoma mitocondrial, e
podem ser de diversos tipos, como se descreverá a seguir.
1.1. Marcadores genéticos
No homem, o ADN nuclear está repartido por 23 pares de cromossomas, dos
quais 22 são de autossomas e um é constituído pelos cromossomas sexuais (X e Y). A
informação dos autossomas é passada à descendência por ambos os progenitores.
Quanto ao cromossoma X, enquanto que os indivíduos do sexo feminino recebem X de
ambos os progenitores, herdando 50% da informação contida nos cromossomas da
mãe, e 100% da contida no único cromossoma X que o pai possui, os indivíduos do
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
2
sexo masculino recebem apenas o X da mãe, herdando, assim 50% da informação que
a mãe contém no par de cromossomas X e a totalidade da informação que o pai contem
no cromossoma Y. Este último cromossoma transmite-se somente aos indivíduos
masculinos e por via paterna.
No entanto, existe também um ADN que se organiza numa forma circular: é o
que se encontra nas mitocôndrias das células. Este ADN é designado de ADN
mitocondrial, e quanto às propriedades de transmissão carateriza-se por ser passado à
descendência exclusivamente por via materna.
De entre o leque de marcadores existentes para análise genética forense podem-
se salientar os short tandem repeats (STRs), os single nucleotide polymorphisms
(SNPs) e os insertion delection polymorphisms (INDELs).
Os SNPs são caracterizados por uma alteração num único nucleótido, ou seja,
por variação de base em determinado nucleótido, como por exemplo a substituição de
uma citosina (C) por uma timina (T). São extremamente frequentes, em média 1 em
cada 300 par de bases, sendo por isso de extrema utilidade para a área forense.
Os INDELs, como o próprio nome indica, correspondem a inserções ou deleções
de nucleótidos na cadeia de ADN, podendo o tamanho da porção adicionada/retirada
ser bastante variável (1-10 000 bp). Muitos destes INDELs estão localizados em zonas
do genoma responsáveis por diversas caraterísticas humanas e doenças, e por este
motivo o seu estudo é de extrema importância [4, 5].
1.1.1. STRs
Cada molécula de ADN é constituída por regiões codificantes de proteínas ou
RNAs e regiões não codificantes. Em genética forense, utilizam-se habitualmente
marcadores de ADN localizados em zonas não codificantes (intrões, ou regiões
intergénicas). Cada marcador localiza-se numa região específica de um cromossoma,
designada de locus, e pode pertencer a diferentes categorias estruturais. Entre elas
incluem-se os short tandem repeats (STR), em que os diferentes alelos são definidos
por variações no número de repetições de uma pequena sequência (motivo da
repetição), habitualmente com tamanho compreendido entre 2-6 bp.
Cada alelo corresponde, assim, a diferentes tamanhos de uma sequência de ADN,
sendo que o tamanho depende do número de vezes que um conjunto de nucleótidos se
repete. Por exemplo, no caso de um STR, com o motivo repetitivo CTA, o alelo 5
corresponder à presença de 5 repetições dessa sequência (CTA CTA CTA CTA CTA),
o alelo 6 a seis (Figura 1) e assim sucessivamente.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
3
Figura 1. Variação no número de motivos repetitivos, CTA, de STR para diferentes indivíduos
Em termos das caraterísticas do motivo de repetição, os STR podem ser de três
tipos: simples, compostos e complexos. Os simples consistem em repetições que são
idênticas no seu tamanho e sequência. Os complexos podem apresentar um motivo
repetitivo com uma variação na sequência e os compostos podem apresentar variações
tanto no tamanho como na sequência.
Os STR são extremamente abundantes, constituindo cerca de 3% do genoma
humano, destacando-se também pelo elevado nível de polimorfismo. Por estes motivos,
têm sido considerados marcadores de eleição para fins identificativos, em especial os
simples e tetranucleotídicos (isto é, com motivo de repetição de 4 bp), que
compreendem a maioria dos STR usados na casuística forense.
Os STR podem estar localizados tanto em autossomas como nos cromossomas X
e Y. Através do estudo destes marcadores num indivíduo, é possível caraterizá-lo para
um conjunto de loci e comparar o seu perfil com o dos demais indivíduos da população.
Naturalmente que quanto mais informativos forem os loci estudados maior será o poder
de discriminação entre indivíduos de uma população. Para além dos aspetos referidos,
os STRs apresentam ainda outras propriedades desejáveis em genética forense,
nomeadamente, facilidade de amplificação por reação em cadeia da polimerase (PCR)
e de deteção dos produtos de amplificados, possibilidade de análise de vários STR em
simultâneo com sistemas multiplex, existência de diversos kits comerciais, entre outras
[6].
1.1.2. Kit NGM Select
Os kits de amplificação consistem num conjunto de marcadores que são analisados
em conjunto. A utilização destes kits frequentemente contribui para obter um elevado
poder de discriminação entre indivíduos pertencentes a uma determinada população.
Entre os numerosos kits de STRs que diferentes companhias comerciais oferecem,
inclui-se o AmpFℓSTR® NGM Select™, uma versão atualizada do kit AmpFℓSTR®
NGM™, que contém os 16 STR discriminados na Figura 2.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
4
Figura 2. Marcadores incluídos no kit AmpFℓSTR® NGM Select™
12 desses 16 STRs correspondem a marcadores que fazem parte do European
Standard STR set (ESS), conforme foi estabelecidos pelo Conselho da União Europeia
2009/C296/01 a 30 de novembro de 2009 [7, 8].
O set ESS consiste no conjunto de STR definidos como obrigatórios nas análises
de rotina forense dos laboratórios europeus. Esta medida foi implementada no sentido
de tornar mais precisa a comparação entre análises de laboratórios distintos, e diminuir
a probabilidade de encontrar perfis repetidos nas diferentes bases de dados dos países
europeus. Inicialmente era constituído por 7 loci: TH01, vWA, FGA, D21S11, D3S1358,
D8S1179 e D18S51, mas em 2009 foi aprovada a inclusão de 5 novos loci, com
amplicões de menor tamanho (70-180 pares de base (bp)), designados de mini-STRs,
sendo eles: D10S1248, D22S1045, D2S441, D12S391 e D1S1656. Esta alteração
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
5
surgiu pelo fraco desempenho dos marcadores de STR utilizados na rotina laboratorial
forense, quando comparados com os mini-STR ou os SNP. Sendo assim, os principais
objetivos que determinaram a inclusão dos novos ESS foram: aumentar o poder de
discriminação, aumentar a sensibilidade das análises em amostras de ADN degradadas,
e melhorar a robustez/qualidade dos resultados [9].
O kit AmpFℓSTR® NGM Select™ também inclui o locus SE33, um locus
extremamente polimórfico, que é reconhecido como uma importante mais valia em
analises genéticas. A performance geral do kit NGM Select é equivalente à do kit NGM,
no entanto, a inclusão do locus SE33 aumenta significativamente o poder de
discriminação, tornando-o no kit com maior poder discriminativo de todos os kits
AmpFℓSTR® [10]. Para a maioria dos loci contidos neste kit, abundam na literatura
científica dados sobre frequências alélicas em diversas populações. No entanto, até à
data a população Ucraniana encontra-se francamente sub-representada [11, 12], sendo
que maior parte dos estudos se foca na antiga União Soviética, e não nos estados
emergentes após a dissolução da URSS.
1.1.3. Utilização dos marcadores genéticos em estudos de ancestralidade
Existe a potencialidade de utilização dos marcadores anteriormente
mencionados em estudos de ancestralidade com o objetivo de inferir a origem
geográfica de determinado indivíduo. Para o efeito, tem-se recorrido a marcadores
designados de AIMs (ancestry informative markers) [13, 14], cujo denominador comum
é apresentarem grandes diferenças nas frequências alélicas entre diversas populações
de forma a potenciar a diferenciação entre indivíduos de diferentes populações.
De entre os marcadores apresentados, os SNP têm sido dos AIMs mais
utilizados pelo facto de terem baixas taxas de mutação e de não sofrerem enviesamento
devido à existência de um elevado número de alelos [15]; existindo também inúmeras
bases de dados de SNP e diversos conjuntos/painéis de marcadores construídos com
o propósito da discriminação geográfica [16-23]. Por estes motivos, a maior parte de
estudos iniciais de ancestralidade usaram AIMs tipo SNP, embora nos últimos anos
terem ganho grande protagonismo AIMs de tipo INDEL. Tem sido mais difícil selecionar
AIMs entre STRs, mas também existem alguns kits de STR disponíveis [24, 25].
1.2. Genética da Europa
Embora não exista consenso sobre os acontecimentos que mais contribuíram
para o legado genético europeu, sabe-se, no entanto, que entre os principais se incluem
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
6
desde logo a colonização inicial há cerca de 35 000-40 000 anos por caçadores-
recolectores modernos que vindos do Levante acabariam por substituir os neandertais,
um grupo Homo que há muito habitava a Europa. Apesar do breve período de
coexistência entre os 2 grupos, alguma mistura entre eles ocorreu, como indica a
presença residual de ancestralidade Neandertal no genoma dos europeus atuais [26-
28]. Posteriormente, há indicações de uma importante reconfiguração populacional
associada à dispersão da agricultura por todo o continente, depois de ter surgido pela
primeira vez há cerca de 10 000 anos no próximo-oriente.
Sobre o processo de dispersão da agricultura na Europa, ainda se debate entre
os diferentes modelos de difusão cultural e de difusão démica, segundo os quais se
atribui um papel menor ou maior, respetivamente, à migração de agricultores a partir do
próximo-oriente [27, 29-31]. Apesar do modelo da difusão démica ser o mais aceite,
admitindo-se, portanto, fluxo migratório considerável de agricultores, o impacto genético
desta migração continua pouco claro, embora os estudos mais recentes baseados em
um elevado número de marcadores genéticos aponte para um componente neolítico
superior ao paleolítico na composição genética dos europeus [27], sugerindo assim, que
os recolectores foram “substituídos” em grande parte, pelos agricultores provenientes
de leste.
Tem sido também documentado, no padrão de diversidade genética europeu,
um gradiente populacional de sentido sul norte, que se associa a movimentações
populacionais decorrentes no período arqueológico definido como a última época glaciar
(latest glaciar maximum, LGM), registada há cerca de 18 000 anos. Por essa altura, as
zonas mais a norte e centro da europa ficaram cobertas de gelo, levando a maior parte
da população aí residente a abandonar a região deslocando-se para zonas com
condições climáticas menos agrestes. Há indícios de que os únicos locais onde a
presença humana persistiu tenha sido nas zonas mais quentes situadas a sul, e
atualmente designadas de refúgios glaciares. Com o fim da época glaciar e o recuo do
gelo houve uma repovoação das zonas centro e norte. Esta fase de re-expansão
populacional que se prolongou pelo início do mesolítico influenciou significativamente a
distribuição genética europeia [25, 32, 33].
Já em período pós-neolítico, nomeadamente durante a idade do Bronze, uma
migração com origem no leste da eurásia do Norte, correspondente à atual Rússia
asiática, também contribuiu significativamente para o legado genético europeu,
admitindo-se até que pode ter sido responsável pela introdução das línguas indo-
europeias na europa [34, 35].
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
7
Migrações mais recentes continuaram a afetar o genoma europeu, sobretudo a
escalas geográficas mais restritas. Em suma, as descontinuidades genéticas
observadas na Europa desde o paleolítico até períodos pós-neolíticos devem-se
essencialmente a processos demográficos como migrações, crescimento e/ou declínio
populacional e mistura [36]. A seleção natural também afetou a diversidade em porções
específicas do genoma europeu, mas pouco influenciou o padrão geral que foi
maioritariamente ditado pelos fatores de ordem demográfica já mencionados.
Quanto às populações europeias contemporâneas, que globalmente se
caraterizam por considerável homogeneidade genética, tem-se verificado existir
marcada correlação entre distância genética e geográfica. Outros fatores, como a
língua, a etnia e a cultura, que se sabem poder afetar a distribuição genética,
desempenham um papel bem menor comparativamente à influência da geografia na
distribuição genética dos europeus atuais [36].
1.3. Da Ucrânia até Portugal
A Ucrânia é um país da antiga união soviética que se localiza no leste europeu,
sendo um dos países pertencestes à Eurásia e que faz fronteira com o continente
asiático. Excluindo a Rússia Europeia, a Ucrânia é o maior país do continente europeu
e que está localizado numa região geograficamente estratégica. Tem uma área de 603
700 km2, sendo que a distância longitudinal entre as extremidades do país é 1 316 km
e a latitudinal é 839 km. Faz fronteira com diversos países europeus, sendo eles:
Moldávia, Roménia, Hungria, Eslováquia, Polónia, Bielorrússia, Rússia e também com
o mar negro [37].
O país é composto por 24 províncias e uma região autónoma (a Crimeia) e
contém cerca de 44 209 733 habitantes, sendo que 77,8% são etnicamente Ucranianos,
17,3% Russos, 0,6% Bielorrussos, 0,5% Moldavos, 0,5% tártaros da Crimeia, 0,4%
Búlgaros, 0,3% Húngaros, 0,3% Romenos, 0,3% Polacos, 0,2% de origem judaica, entre
outros. A língua oficial é o ucraniano, no entanto, o russo está também muito presente.
Outras línguas são também faladas, correspondendo maioritariamente às línguas de
origem das minorias étnicas existentes no país. A religião predominante é o cristianismo
[38].
A Ucrânia faz parte do conjunto de países onde existem populações eslavas,
designação em que é comum integrar populações nas quais se falam línguas eslavas,
um grupo de línguas que pertence a um dos maiores ramos linguístico da família das
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
8
línguas indo-europeias. Na europa, existem populações eslavas na região central e em
toda a faixa que vai do Nordeste até ao Sudoeste do continente. A partir do estudo de
marcadores de linhagem, nomeadamente do cromossoma Y, foi possível detetar uma
certa separação entre populações eslavas e populações europeias não-eslavas, apesar
da diferenciação ser pouco percetível com base em marcadores autossómicos [39]. A
análise do cromossoma Y revelou ainda que as populações eslavas se separam em
dois grupos principais (eslavos do sul e outros eslavos), que tiveram origem há cerca de
15 000 anos na bacia do rio Dnieper, região localizada na atual Ucrânia [40].
A Ucrânia foi posteriormente palco de diversas migrações, o que moldou a sua
herança genética. Atualmente, não se encontra diferenciação significativa entre
indivíduos das diversas regiões da Ucrânia com o recurso a marcadores STR do
cromossoma Y [41].
A formação do estado ucraniano só se observou após a queda da união
soviética, em 1991. Este período foi marcado por um processo de recessão de que
resultou a diminuição drástica do produto interno bruto ucraniano. A instabilidade
financeira causada levou a que muitos ucranianos procurassem como solução a
migração para outros países, incluindo Portugal. Por este motivo, na década anterior o
número de imigrantes ucranianos a residir em Portugal aumentou cerca de 213%. O
número de imigrantes registados no censo de 2011 foi de 33 790 indivíduos,
correspondendo ao terceiro maior grupo de imigrantes a residir em Portugal,
constituindo cerca de 9% do total de imigrantes [42].
Pelo facto de os ucranianos terem, de entre os migrantes, uma representação
significativa na população portuguesa, existe uma necessidade da sua caraterização
genética. A possível existência de substruturação populacional pode ser um problema
e condicionar as análises de rotina forense. Além disso, o difícil acesso a estudos
populacionais sobre a Ucrânia para marcadores de STR autossómicos pela comunidade
científica, é outro dos motivos para a realização deste estudo populacional. Muito
recentemente foi publicado um estudo com diversos marcadores (15) de STR para a
população ucraniana [43], no entanto, parte dos marcadores aqui analisados ainda não
se encontram tipados para a população ucraniana, nomeadamente os mini-STR do ESS
(European Standard Set) e o locus SE33 que se encontrava somente caracterizado para
uma mistura de indivíduos ucranianos e russos.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
9
2. Objetivos
• Caraterizar geneticamente um grupo de indivíduos ucranianos residentes em
Portugal com o kit NGM Select
• Estudar a possível existência de subestruturação populacional entre os
indivíduos de origem ucraniana e os portugueses
• Averiguar a capacidade de um kit de rotina forense para discriminar
geneticamente grupos de indivíduos, nomeadamente tendo em conta diversas
escalas geográficas, desde o nível intercontinental ao nível inter-país
• Averiguar a capacidade do kit para discriminar países fronteiros de zonas
intercontinentais, nomeadamente na Eurásia
• Averiguar o poder do mesmo kit para compreender alguns dos processos
migratórios, nomeadamente dentro da Europa, e perceber como o padrão de
distribuição genética se relaciona com a geografia e história das populações
• Avaliar a coerência das diferenciações genéticas interpopulacionais produzidas
por duas medidas de distâncias genéticas, FST e (δμ)2
• Avaliar a capacidade dos marcadores de rotina forense para serem utilizados em
estudos de ancestralidade
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
10
3. Material e métodos
3.1. Amostragem populacional e material biológico
As amostras utilizadas neste estudo foram previamente colhidas a voluntários de
nacionalidade ucraniana a residir em Portugal. De entre um total de 83 amostras
disponíveis foram excluídas 11, por serem de indivíduos pertencentes a duos pai-filho(a)
ou trios mãe-filhos, ficando-se, assim com uma amostra populacional que consistia em
72 indivíduos, 31 homens e 41 mulheres, não relacionados, de origem ucraniana a
residir em Portugal.
Todos os voluntários foram esclarecidos verbalmente e por escrito acerca dos
objetivos do estudo e metodologia de colheita, e assinam um termo de consentimento
informado (anexo 1). Simultaneamente à colheita do material biológico foram
registrados numa ficha de identificação anonimizada alguns dados pessoais como a
idade, o sexo, a nacionalidade e a naturalidade.
O material biológico usado foi um esfregado da cavidade bucal, colhido com uma
zaragatoa por indivíduo. As zaragatoas foram secas ao ar e armazenadas à temperatura
ambiente até ao momento da extração de ADN.
3.2. Extração do ADN (ácido desoxirribonucleico)
O ADN foi extraído a partir de esfregaços de células bucais pelo método de
extração de Chelex [44]. Esta técnica inclui os seguintes passos:
a. Cortar um pedaço (cerca de 1/3) da parte da zaragatoa que entra em contato
com a superfície bucal;
b. Adicionar 970 µl de água ultrapura;
c. Incubar cerca de 20 min à temperatura ambiente (T.A.)
d. Adicionar 130 µl da resina Chelex 100 (200-400 mesh, solução a 5%) e agitar os
tubos;
e. Incubar a 100 ºC durante 10 minutos;
f. Centrifugar durante 5 min à velocidade máxima (12 000 a 14 000 rpm)
g. Conservar o sobrenadante no frigorífico (-4 ºC) para os passos posteriores.
As amostras extraídas foram rotuladas e anonimizadas, utilizando um código interno
correspondente a cada indivíduo.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
11
3.3. Amplificação do ADN
A amplificação foi feita por PCR (polimerase chain reaction), usando o kit de
amplificação AmpFℓSTR® NGM SelectTM (Applied Biosystem, Foster City, CA) seguindo
o protocolo do fabricante, mas reduzindo o volume total de todos os reagentes a metade,
no termociclador GeneAmp 9700 (Applied Biosystem, Foster City, CA). Para cada
amostra, preparou-se um volume final de 12,5 µl por reação de PCR contendo os
seguintes reagentes: Master Mix (5 µl) e Primer Set (2,5 µl) do kit AmpFℓSTR® NGM
SelectTM, água desionizada (4 µl) e amostra contendo o ADN extraído (1 µl).
Em todos os ensaios de PCR foi incluído um controlo negativo (contendo a
mistura de amplificação sem o ADN a amplificar e perfazendo o volume final com água
desionizada) de forma a controlar possíveis contaminações, e um controlo positivo
(constituído por Master Mix (5 µl), Primer Set (2,5 µl) e um ADN denominado de 007,
incluído no kit comercial, que serve como controlo positivo (5 µl)) para avaliar a eficiência
da amplificação e genotipagem usando o ladder alélico presente no kit. As amostras
foram previamente quantificadas, e naquelas (cerca de 10) que continham uma
quantidade excessiva de ADN, procedeu-se ao ajuste da sua concentração por diluição
com água, em proporção máxima de 1:10, o que permitiu obter sempre perfis de boa
qualidade. O kit de amplificação utilizado foi o AmpFℓSTR® NGM Select™ anteriormente
descrito.
Após a preparação da mistura de PCR e adicionando respetivamente, cada uma
das amostras, efetuou-se a amplificação no termociclador GeneAmp PCR 9700
previamente programado segundo os parâmetros apresentados na Tabela 1:
Tabela 1. Parametrização do termociclador para a reação de PCR para o kit AmpFℓSTR® NGM SelectTM
Passo de
incubação
inicial
Ciclos (29 ou 30) Extensão
final “Espera” final
Desnaturação Annealing/extensão
95 ºC
11 minutos
94 ºC
20 segundos
59 ºC
3 minutos
60 ºC
10 minutos
4 º C
---
3.4. Separação e genotipagem
Os fragmentos de ADN obtidos após amplificação foram separados por
eletroforese capilar num analisador/sequenciador genético ABI 3500 Genetic Analyser
(Applied Biosystem, Foster City, CA) de acordo com as recomendações do fabricante.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
12
As amostras foram preparadas de acordo com o seguinte protocolo:
a. Adicionar 10 µl de formamida Hi-Di™ desionizada e 0,5 µl de GeneScan™ 600
LIZ™ Size Standard (para cada amostra) num tubo de polipropileno com o
tamanho adequado;
b. Agitar (Vortex) o tubo;
c. Em cada poço da MicroAmp® Optical 96-Well Reaction Plate adicionar 10,5 µL
da mistura preparada no ponto a. e 1 µL dos produtos de PCR correspondentes
a cada amostra ou 1 µL de ladder alélico (para cada conjunto de 16 amostras);
d. Selar a placa e desnaturar selecionando o programa adequado (3 min a 95 ºC
seguido de arrefecimento até 4 ºC);
e. Montar a placa para a eletroforese e colocar no autosampler;
f. Proceder à eletroforese de acordo com as condições de corrida programadas
estabelecidas nas instruções do fabricante.
O controlo negativo e o positivo, previamente sujeitos a PCR, foram também
adicionados à placa para garantir a qualidade dos resultados. A genotipagem foi
realizada recorrendo ao software GeneMapper ID-X v1.4 (Applied Biosystems) através
da comparação do tamanho dos fragmentos amplificados com o tamanho dos
fragmentos contidos no ladder alélico de referência.
3.5. Análise de dados
3.5.1. Nível intrapopulacional
Para avaliar se os marcadores genéticos cumpriram os requisitos necessários
para serem utilizados em estudos forenses/populacionais e obter estimativas sobre a
sua eficiência, testou-se o equilíbrio de Hardy-Weinberg (EHW) e calcularam-se os
parâmetros estatísticos mais comuns em Genética Forense, como se descrimina
seguidamente.
• Frequências alélicas
As frequências alélicas para cada locus foram estimadas pelo método de
contagem direta implementado no software Arlequin ver3.5 [45], utilizando a seguinte
fórmula:
Pi = ni/2n
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
13
sendo ni o número de vezes que o alelo i foi observado na amostra populacional e n o
número de indivíduos analisados.
• Heterozigotia
A heterozigotia é uma das medidas mais informativas e amplamente utilizada na
estimativa da diversidade genética: quanto maior o seu valor maior será a diversidade
genética de uma população para um locus. Relativamente a uma dada amostra
populacional, podem obter-se dois valores de heterozigotia, a heterozigotia observada
(Ho), que representa a frequência de indivíduos heterozigóticos na amostra, e a
heterozigotia esperada (He) que consiste na frequência esperada de indivíduos
heterozigóticos assumindo equilíbrio de Hardy-Weinberg na população [46].
Para cada locus, a estimativa da heterozigotia esperada foi obtida com o
software Arlequin v3.5, que recorre à fórmula:
ℎ =n
n − 1 (1 − ∑ 𝑝𝑘
𝑖=1 i2)
sendo n o número de cromossomas analisados, k o número de alelos e pi a frequência
do alelo i.
A estimativa da heterozigotia observada foi feita através da razão entre o número
de indivíduos heterozigóticos observados naquele locus e o número total de indivíduos
analisados [6]. A heterozigotia média numa população, ou seja, ponderando os vários
marcadores analisados, é dada pela média das heterozigotias por locus.
• Equilíbrio de Hardy-Weinberg (EHW)
Segundo o princípio fundamental da Genética Populacional, determinada
população manterá constante a sua composição genética ao longo do tempo (equilíbrio
de Hardy-Weinberg), assumindo cruzamentos ao acaso, e ausência de efeitos de
migração, mutação e seleção. Igualmente assume que a população é infinita, o que na
prática é impossível. Presume-se, no entanto, que em populações suficientemente
grandes os efeitos da deriva génica não representem fator importante de alteração das
frequências alélicas [3], pelo que também podem estar em EHW, desde que os restantes
pressupostos se verifiquem.
Assim, para uma população em equilíbrio, as frequências genotípicas dependem
apenas das frequências alélicas de acordo com princípio de Hardy-Weinberg que se
pode generalizar da seguinte forma:
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
14
(p1 + … + pi)2 = (p12 + … + pi
2 + 2p1pi + …)
considerando os alelos A1, …, Ai aos quais estão associados as frequências alélicas p1,
…, pi.
Pode, então, usar-se a fórmula para calcular as frequências de genótipos
homozigóticos:
f(AiAi) = pi2
e heterozigóticos:
f(AiAj) = 2pipj
sendo pi, …, pj as frequências dos alelos i, …, j para determinado locus [6, 47].
Para avaliar se uma população está em equilíbrio de Hardy-Weinberg (EHW),
aplica-se habitualmente o teste exato de EHW, que permite verificar se há ou não desvio
estatisticamente significativo entre as distribuições genotípicas observadas e as
esperadas em equilíbrio. Este teste é efetuado para cada locus e o valor de p permite
avaliar a significância dos desvios detetados, assumindo normalmente como limite de
significância estatística p = 0,05, sendo que valores de p inferiores a 0,05 permitem
rejeitar a hipótese de a população estar em EHW, verificando-se o oposto para valores
superiores a 0,05 [48].
• Probabilidade de identidade/ matching probability (PI)
Estimativa da probabilidade de dois indivíduos (não relacionados), selecionados
ao acaso de uma mesma população, terem o mesmo genótipo. Sendo uma
probabilidade, tem um valor que varia entre 0 e 1. PI é um parâmetro de eficiência
forense que se calcula com o propósito de avaliar o poder de discriminação entre duas
amostras de um set de marcadores.
É dada, para cada locus, pela equação [3]:
PI = 2(∑ 𝑝i2)2 − ∑ 𝑝i
4
sendo pi o valor da frequência do alelo i em cada locus.
O PI global é calculado através da multiplicação dos diversos PI´s,
correspondentes a cada locus, assumindo não haver linkage ou linkage disequilibrium
entre os mesmos.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
15
• Poder de discriminação (PD)
Corresponde à probabilidade de dois indivíduos não relacionados, selecionados
ao acaso de uma mesma população, terem genótipos diferentes. Varia entre 0 e 1 e
pode ser obtido, para cada locus, através da expressão [6]:
PD = 1 - PI
sendo PI a matching probability para cada locus. O poder de discriminação para vários
loci (por exemplo um kit forense) é calculado através da fórmula [3]:
PDc = 1 − ∏ (𝑛𝑖=1 1 − PDi)
sendo que PDi corresponde ao poder de discriminação para cada locus e recordando
que ∏ corresponde ao sinal de multiplicação.
• Probabilidade de exclusão (PE)
Corresponde à fração de indivíduos que, para um dado locus, tem um perfil
genético diferente de um indivíduo escolhido ao acaso na população. É uma medida
importante da eficiência forense em estudos de paternidade. O valor para determinado
locus corresponde ao poder de exclusão do mesmo. A fórmula utilizada para o cálculo
do poder de exclusão para cada locus é [49]:
PE = h2(1 − 2hH2)
sendo h a heterozigotia e H a homozigotia observadas para esse locus. O poder de
exclusão combinado (PEc) é calculado através da fórmula [6]:
PEc = 1 − ∏ (𝐿𝑙=1 1 − PEl)
sendo PEl correspondente ao poder de exclusão para cada locus.
• Polymorphic information content (PIC)
É uma medida de diversidade que inicialmente foi utilizada para avaliar o poder
informativo de um marcador em estudos de ligação [50]. O valor de PIC corresponde à
probabilidade de um alelo de determinado locus ser transmitido à descendência através
de um progenitor heterozigótico, tendo conhecimento do genótipo do segundo
progenitor [51].
Pode ser calculado através da seguinte expressão [49]:
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
16
PIC = 1 – (∑ 𝑝𝑛𝑖=1 i
2) – ∑ ∑ 2𝑛𝑗=𝑖+1
𝑛𝑖=1 pi
2pj2
sendo pi a frequência do alelo i, n o número de alelos e pj a frequência do alelo j para
determinado marcador.
• Índice de paternidade (IP)
O índice de paternidade (IP) é uma razão de verossimilhança que indica se um
alelo partilhado por um par alegado pai/filho para determinado locus é ou não a favor da
hipótese de o alegado pai ser o verdadeiro pai, face à hipótese alternativa de o
verdadeiro pai ser um outro individuo ao acaso da população que possua o mesmo alelo.
Assim, uma razão inferior a 1 contraria a hipótese de paternidade, enquanto um valor
superior a apoia [52]. Este índice pode ser generalizado para determinado locus (typical
paternity index), de forma a obter e avaliar o índice de paternidade “geral” para esse
locus em vez do índice de paternidade para um caso de paternidade específico [53].
A fórmula utilizada para o cálculo deste índice generalizado é a seguinte [6]:
IP = 1/2h
sendo h correspondente ao valor da homozigotia para determinado locus. O índice de
paternidade combinado é determinado multiplicando os IP’s individuais de todos os loci
estudados.
3.5.2. Nível interpopulacional
Para o estudo interpopulacional foram utilizados dados de frequências
publicadas em artigos científicos e/ou depositadas em algumas bases de dados (ver
referências no anexo 2). Para alguns países foram compilados dados provenientes de
estudos diferentes, que se consideraram em conjunto de modo a poder efetuar
comparações com 15 (kit NGM) e 16 (kit NGM Select) marcadores. Havendo mais que
um conjunto de dados publicados para a mesma população, optou-se pela fonte
baseada no maior número de indivíduos analisados.
Nas análises comparativas, planeou-se uma abordagem em que se
consideraram diversos níveis geográficos começando pelo continental, mais
especificamente intercontinental, passando pelo que incluía a zona da Eurásia e
fronteira com a Ucrânia, e posteriormente focando restritivamente a Europa.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
17
No nível intercontinental, foram abrangidos 45 países, pertencentes a 4 grandes
zonas geográficas (Europa, Ásia, África, “Médio Oriente”) e a Gronelândia. Neste caso,
foi necessário reduzir a comparação a 10 dos 16 marcadores do kit NGM Select que se
encontravam tipados nas 46 amostras populacionais, nomeadamente: vWA, D16S539,
D2S1338, D8S1179, D21S11, D18S51, D19S433, TH01, FGA e D3S1358.
No nível geográfico da Eurásia, tirou-se recurso dos mesmos 10 marcadores e
18 populações localizadas na região. Como foram eliminados alguns países,
produziram-se novas matrizes genéticas, assim como gráficos de MDS.
Quanto à Europa, uma vez que existem guidelines com os marcadores que
devem ser analisados em contexto forense, foi possível estender a comparação a todos
os marcadores do kit NGM Select com a exceção do SE33, ou seja a 15 STRs, para os
quais se encontrou dados disponíveis em 31 populações europeias.
Finalmente, e de forma a integrar na análise comparativa a totalidade dos 16
marcadores do kit NGM Select, recrutaram-se dados de frequências que tinham sido
publicados na integra em artigos científicos, evitando usar mistura de frequências
recolhidas de fontes diferentes. Assim, a população ucraniana pode ser contrastada com
15 amostras populacionais (especificadas no anexo 2) já tipadas na íntegra para este
kit. Estes foram comparados com os dados obtidos para a população ucraniana.
Para avaliar o nível de divergência genética entre as populações foram
calculadas duas medidas de distância genética, nomeadamente FST e (δμ)2, que se
descrevem de seguida.
• FST – Índice de Fixação
Pode ser definido como a correlação existente entre alelos escolhidos ao acaso
dentro da mesma subpopulação em relação à população inteira, ou como a proporção
de diversidade genética causada por diferenças de frequências alélicas entre
populações [54, 55]. Como o FST mede a redução na heterozigotia de uma subpopulação
relativamente à população total avalia consequentemente o grau de diferenciação
genética entre subpopulações.
É dado pela seguinte fórmula:
FST = (HT - HS) / HT
onde HT é a heterozigotia total no conjunto de subpopulações e HS a média das
heterozigotias esperadas nas subpopulações [56].
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
18
A diferenciação genética entre populações está diretamente relacionada com os
processos evolutivos, de que são exemplo migrações, mutações, deriva génica e
seleção [57]. O FST está também diretamente relacionado com a variância nas
frequências alélicas entre populações e inversamente com o grau de semelhança entre
indivíduos dentro da mesma população.
• (δμ)2 – delta mu squared
Distância genética desenvolvida especificamente para marcadores de tipo STR
(short tandem repeat) [58]. A principal diferença relativamente a outras medidas de
distância genética reside no modelo mutacional assumido. Em alternativa ao infinite
alleles model em que se baseia a maioria das distancias genéticas, (δμ)2 considera o
stepwise mutation model (SSM) por ser um processo de mutação que melhor se aplica
aos STRs, já que o aparecimento de novos alelos ocorre pelo ganho ou perda de um
motivo repetitivo [59]. É calculada através da seguinte expressão:
(δμ)2 = ∑ (𝑟𝑗 μXj - μYj)
2 / r,
onde μXj (= ∑ 𝑖𝑥𝑖 ij) e μyj (= ∑ 𝑖𝑦𝑖 ij) é o número de repetições médio do alelo i no locus j
para as populações X e Y e xij e yij são as frequências do alelo com i repetições no
locus j para as populações X e Y [60].
Tanto o FST como o (δμ)2 foram calculados com base nas frequências genéticas
aqui obtidas para os ucranianos e as previamente publicadas para outras populações,
uma vez que as publicações originais raramente continham dados genótipicos. Tal
limitou a escolha do programa para obter as distâncias, pois são raros os softwares
disponíveis que as calculam usando como input frequências alélicas, principalmente no
caso da distância (δμ)2, em que os softwares utilizam normalmente dados genótipicos.
Por isso, as distâncias foram obtidas com o auxílio do software Poptrew [61], que, no
entanto, não fornece os valores de p associados. A heterozigotia e número de alelos,
por população e marcador, foram também calculados com este software. Para
complementar esta análise, também foram calculados valores de FST locus a locus, no
software Arlequin v3.5 [45], que computa as distâncias e os respetivos valores de p,
assumindo um intervalo de confiança de 95 % (p < 0,05).
A análise Multidimensional Scaling (MDS) foi efetuada no software R [62]. As
coordenadas produzidas foram posteriormente usadas para construir gráficos no Excel.
Os gráficos resultantes de Principal Component Analysis (PCA) foram obtidos com o
software SPSS Statistics v24 [63].
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
19
As coordenadas geográficas de GPS (latitude e longitude) foram retiradas da
internet para cada população, e depois usadas para obter matrizes de distâncias
geográficas entre populações recorrendo ao software GenAlEx v.6.5 [64]. Este software
foi também utilizado para efetuar os testes de Mantel com o intuito de comparar matrizes
de distâncias geográficas com matrizes de distâncias genéticas para as mesmas
populações.
De seguida, descrevem-se em traços largos princípios das técnicas MDS e PCA,
bem como dos testes de Mantel.
• Multidimensional Scaling (MDS)
Corresponde a um conjunto de técnicas que permitem representar
geometricamente os objetos que neste trabalho correspondem a amostras
populacionais presentes num conjunto de dados, fornecendo uma visualização espacial
da distância entre esses objetos. São técnicas que recorrem a métodos não-lineares de
redução dimensional. Cada ponto presente num gráfico, obtido por MDS, corresponde
a um dos objetos do conjunto de dados. Os objetos são agrupados de acordo com a
distância existente entre os diferentes pares, sendo que objetos mais próximos são
representados por pontos geometricamente mais próximos de modo a preservar as
distâncias entre objetos.
Os dados devem representar a semelhança/diferença entre os objetos. Quando
estão em causa comparações entre populações, os dados correspondem a matrizes de
distâncias genéticas e os objetos a populações. A cada objeto são atribuídas
coordenadas geográficas para cada uma das dimensões estudadas [65] [66]. Neste
estudo será utilizado um tipo de MDS designado de classical Multidimensional Scaling
(cMDS) que recorre a dados provenientes de uma só matriz de semelhança,
representando-os depois num gráfico que se optou sempre por ter apenas duas
dimensões por permitir visualizar melhor as distâncias entre populações.
• PCA (análise de componentes principais)
É também uma das técnicas de redução dimensional que tem como principal
objetivo reduzir o número de dimensões existente num conjunto de dados mantendo a
maior parte da sua variabilidade. Isto é feito através da combinação linear de variáveis,
que estão correlacionadas, em variáveis não relacionadas designadas de componentes
principais. Estes são caracterizados sequencialmente para que o primeiro componente
compreenda a maior parte da variação total do conjunto de dados. O número de
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
20
componentes varia consoante os dados, mas é em regra menor que o número de
dimensões iniciais [19, 67]. Os componentes principais podem depois ser representados
visualmente integrando diferentes números de componentes. Neste trabalho, utilizaram-
se os 2 primeiros componentes principais que foram representados num gráfico 2D. A
vantagem do PCA relativamente a MDS reside em não utilizar matrizes de distâncias
genéticas e, por conseguinte, não ser influenciado pela formulação das distâncias
dependendo exclusivamente da relação matemática entre as variáveis em jogo, que nos
nossos dados são frequências alélicas.
• Teste de Mantel
É um teste que avalia a correlação entre dados contidos em duas matrizes da
mesma ordem. As matrizes resumem as diferenças entre pares de amostras agrupando-
as num só conjunto de dados. Pelo facto de se utilizarem matrizes, os dados a comparar
podem ser de diversos tipos confrontando assim diferentes variáveis [68]. Foi
inicialmente desenhado com o propósito de ser utilizado em ecologia [69], no entanto, é
atualmente usado em muitas áreas, incluindo na genética populacional para avaliar a
relação entre a distância genética com a geográfica entre populações [70], ou seja, para
perceber se há uma relação entre a distribuição geográfica dos indivíduos e a sua
semelhança/diferença genética. Neste trabalho, será utilizado para este mesmo
propósito, mas também para relacionar diversas matrizes genéticas entre si.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
21
4. Resultados e discussão
4.1. Diversidade nos ucranianos residentes em Portugal
Na maior parte das amostras foi possível obter perfis de boa qualidade, ou seja,
relativamente limpos, e com um pico ou dois por marcador, consoante se tratasse de
produtos de amplificação de homozigóticos ou heterozigóticos, respetivamente, para um
dado locus. Em alguns perfis registou-se a presença de stutters, sendo sempre
facilmente identificados, uma vez que não representavam mais do que 5-10% da altura
dos “verdadeiros” picos. A Figura 3 representa um eletroferograma referente a 4 dos 16
STRs testados.
Para chegar a resultados como o que se ilustra na Figura 3, foi necessário
proceder ao ajuste da quantidade de ADN para efetuar o multiplex PCR nas amostras
em que a quantificação prévia revelou excesso de ADN. Nestes casos, e sem proceder
a diluição pré-PCR, obtinham-se picos demasiado intensos e desdobrados, ainda que
não comprometessem a identificação dos alelos a que correspondiam. Apesar disso, a
quantidade de amostra foi sempre ajustada de forma a se conseguir perfis de melhor
qualidade.
Figura 3. Eletroferograma referente a 4 dos STRs testados obtido para um dos indivíduos estudados
Num dos indivíduos analisados, detetou-se um padrão de mistura, que se
replicou após diversas amplificações sem nunca se conseguir isolar um perfil único.
Muito provavelmente tal resultou de um problema de contaminação da amostra durante
a respetiva colheita ou armazenamento, pelo que esta amostra foi descartada do estudo.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
22
Sendo assim, o conjunto amostral passou a ser constituído por 72 ucranianos, não
relacionados, a residir em Portugal.
Foram detetados alelos off-ladder em diversos indivíduos, ou seja, alelos cujos
produtos de amplificação apresentavam tamanhos não coincidentes com os alelos de
referência contidos nos ladders alélicos dos diferentes loci [6]. Um desses alelos, até se
encontrava fora do intervalo de tamanhos previsto no ladder específico para esse
marcador, tratando-se do alelo 15 no locus FGA, cuja “escada” alélica de referência
continha desde o alelo 17 ao 51.2. O resultado foi o mesmo após re-amplificação da
amostra do indivíduo em questão, o que confirmou a presença de um perfil alélico para
FGA contendo o alelo 15. Através da consulta da Short Tandem Repeat DNA Internet
DataBase (http://www.cstl.nist.gov/strbase/) verificou-se que esse alelo já tinha sido
identificado, encontrando-se em 1 heterozigótico no total de 4514 indivíduos contidos
nessa base de dados (consultada em 12 de janeiro de 2017) [71].
Pelo facto de o indivíduo portador deste alelo ser um dos que se suspeitava estar
relacionado com um outro indivíduo também inicialmente estudado, foi possível
proceder-se à comparação do perfil com o da alegada filha (não incluída neste estudo),
verificando-se que nesta também estava presente o mesmo alelo, ou seja o alelo
FGA*15.
A presença de alelos raros numa população pode ser de extrema importância
pois torna os perfis genotípicos que os possuem mais facilmente distinguíveis dos
demais, permitindo obter valores de razões de verossimilhança (LR) superiores, tanto
para investigações de identidade como de paternidade. No caso especifico da
averiguação de paternidade acima mencionado, os valores de LR para os 16 STRs
tipados variaram entre 0,9 e 4,5, mas, para o locus FGA, devido ao alelo raro 15, o valor
de LR obtido foi 36. Sendo um valor bastante elevado, contribuiu para o aumento
substancial do valor do LR global, que assumindo a ausência de linkage calcula-se pela
multiplicação dos valores obtidos para os diferentes loci. Neste caso, sem o FGA o LR
era 481 217, e incluindo esse locus o LR era 17 334 897, valores que indicam ser meio
milhão ou 17 milhões, respetivamente, de vezes mais provável a obtenção dos
resultados segundo a hipótese de o alegado pai ser o pai biológico, do que segundo a
hipótese de o pai ser um homem ao acaso da mesma população. Fica, assim, clara a
grande diferença e segurança que se obtém ao incluir um marcador que possuía um
alelo tão raro.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
23
Os outros alelos off-ladder detetados, foram o alelo 18 nos loci D19S433 e
D1S1656, e os alelos 23 e 34 no locus SE33, estando todos descritos na literatura e/ou
referenciados nas bases de dados (com frequência na ordem dos 0,1%), e
inclusivamente já tendo sido identificados com o kit NGM Select [71], ao contrário do
alelo anteriormente referido, FGA*15.
Foram encontrados diversos alelos não consensuais ou microvariantes, ou seja,
alelos com um número de repetições não completo, cujo número por locus variou entre
1 e 15, tendo sido detetado 1 alelo deste tipo para os loci TH01 e D2S441, 3 para o
locus D12S391, 4 para os loci D21S11 e D1S1656, 5 para o locus D19S433 e 15 para
o locus SE33. Os restantes loci, não apesentavam alelos microvariantes na amostra
populacional estudada. Observaram-se também dois alelos microvariantes off-ladder,
ambos no locus D12S391, nomeadamente os alelos 17.3 e 18.3, já descritos na
literatura [72].
O número de alelos por locus está representado na figura 4, tendo-se registado
uma variação entre 5 e 28. As frequências alélicas para os diversos loci encontram-se
representadas na tabela 2. Alelos com frequência abaixo de 0,01, ou seja, aqueles com
a presença relativamente esporádica na população, são convencionalmente designados
de alelos raros [73]. Como já foi referido anteriormente, os alelos raros podem ser de
extrema importância pois tornam os perfis daqueles que os possuem mais fáceis de ser
distinguidos dos demais, levando a valores de razões de verossimilhança (LR), quer
02468
1012141618202224262830
Número de alelos Número de alelos raros
Figura 4. Número de alelos e de alelos raros presentes em cada um dos loci analisados
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
24
para identidades ou paternidades, superiores aos produzidos por alelos mais
frequentes. Vários alelos foram detetados em heterozigotia num único indivíduo do total
de 72 analisados, implicado, pois, um valor de frequência de 0,00694. O número de
alelos nesta condição, para cada locus, encontra-se também descrito na Figura 4.
Os valores de heterozigotia esperada e observada para cada locus estão
representados na Tabela 2, assim como os respetivos desvios padrões. De um modo
geral, os valores de heterozigotia esperada e observada diferem pouco entre si. A
discrepância mais acentuada observou-se no locus D18S51, onde o valor de
heterozigotia observado era 10% inferior ao esperado. No entanto, nem esta divergência
se revelou ser estatisticamente significativa, a avaliar pelos resultados obtidos nos
testes de EHW cujos valores de p associados se encontram também representados na
Tabela 2. Verificou-se que em 15 dos 16 loci testados os valores de p eram superiores
a 0,05, indicando que as distribuições genotípicas se encontravam dentro dos valores
esperados, o que permite aceitar a hipótese nula do teste, ou seja, a que assume EHW
para determinado locus. A exceção observada foi precisamente no locus D18S51,
anteriormente referido pela discrepância entre heterozigotia observada e esperada,
relativamente ao qual o p associado ao teste de EHW foi de 0,04210. No entanto,
quando se aplicou a correção de Bonferroni, usada normalmente com o objetivo de
controlar a quantidade de erros (falsos-positivos) cometidos, reduzindo o nível de
significância crítico de acordo com o número de testes realizados [74], o valor pD18S51 =
0,04210 deixou de ser estatisticamente significativo, uma vez que era superior ao limite
de confiança estatística reassumido, que passou a ser 0,00313 (0,05/16 iterações).
O facto de não haver desvios ao equilíbrio após a correção de Bonferroni,
permite concluir que os alelos foram herdados aleatoriamente e que fenómenos de
migração, subestruturação, seleção natural e mutação não influenciavam a amostra
populacional em estudo, permitindo assim assumir EHW nas análises estatísticas
posteriores. Por outro lado, a ausência de desvios ao EHW, não faz levantar suspeitas
sobre a existência de alelos nulos, o que poderia constituir um fator de enviesamento
dos resultados obtidos na genotipagem [6, 47].
Ainda relativamente aos níveis de heterozigotia observada por locus, o valor
máximo foi de 94,4 % para o locus SE33 e o mínimo de 70,8 % para o locus D10S1248,
correspondendo assim, respetivamente, aos loci com maior e menor variabilidade
genética de entre os 16 STRs estudados. Na Tabela 2 também se apresenta a
heterozigotia média e os desvios padrão estimados para a amostra de emigrantes
ucranianos a residir em Portugal. O valor de heterozigotia média encontra-se dentro da
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
25
gama de valores já reportados para outras populações europeias caraterizadas para o
mesmo kit, que ronda entre os 81 e 83 % [75].
O Polymorphic information content (PIC) variou desde 0,65153, no locus
D16S539, até 0,93817 no SE33. De acordo com os valores de PIC, de um modo geral
todos os loci são altamente polimórficos (PIC > 0,70), sendo o locus D16S539 aquele
com valor de PIC mais baixo, mas ainda na ordem dos 0,65. Por definição, os valores
de PIC são ligeiramente inferiores aos valores de heterozigotia esperada, mas
naturalmente que apresentam a mesma tendência de variação inter-loci que a registada
na heterozigotia esperada.
Também se pode constatar que o número de alelos por locus se relaciona
razoavelmente bem com o valor de PIC e heterozigotia e consequentemente com o grau
de polimorfismo, a diversidade genética e o poder informativo do locus. Em geral, os loci
com um maior número de alelos apresentam maiores valores nos parâmetros referidos.
No conjunto de marcadores que se analisou, SE33 era o locus com maior número de
alelos, sendo também o que possuía maiores valores de heterozigotia e PIC, assim
como de todos os outros parâmetros calculados.
No entanto, o locus com menor número de alelos, neste caso TH01, com 5 alelos,
apresentava valores de PIC e de heterozigotia observados elevados e superiores a
outros loci com maior número de alelos, como por exemplo o D10S1248 e o D16S539,
que apesar de terem um número de terem 7 alelos eram ambos menos polimórficos e
consequentemente menos informativos que o TH01. Isto revela que tanto o PIC como
He são fortemente determinados pela distribuição de frequências alélicas em cada
locus, e não apenas pelo número de variantes por locus.
Outros parâmetros estatísticos com grande interesse para o âmbito forense,
nomeadamente a matching probability, o poder de discriminação, a probabilidade de
exclusão e o índice de paternidade estão também representados na Tabela 2. Estes
parâmetros, quer referentes a cada marcador individualmente, quer à globalidade dos
marcadores contidos no kit, fornecem indicações sobre a sua utilidade em investigações
forenses.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
26
Tabela 2. Tabela com os parâmetros forenses e populacionais estudados
Alelo Loci
D10S1248 vWA D16S539 D2S1338 D8S1179 D21S11 D18S51 D22S1045 D19S433 TH01 FGA D2S441 D3S1358 D1S1656 D12S391 SE33
6 - - - - - - - - - 0,21528 - - - - - -
7 - - - - - - - - - 0,12500 - - - - - -
8 - - 0,01389 - 0,00694 - - - - 0,13889 - - - - - -
9 - - 0,12500 - 0,01389 - - - - 0,21528 - - - - - -
9.3 - - - - - - - - - 0,30556 - - - - - -
10 - - 0,03472 - 0,07639 - 0,00694 - - - - 0,25694 - - - -
11 - - 0,27778 - 0,07639 - 0,00694 0,19444 - - - 0,26389 - 0,06250 - -
11.3 - - - - - - - - - - - 0,09722 - - - -
12 0,02778 - 0,34028 - 0,15278 - 0,05556 0,02083 0,05556 - - 0,02778 - 0,15278 - 0,00694
12.2 - - - - - - - - 0,00694 - - - - - - -
13 0,18750 - 0,18056 - 0,38194 - 0,16667 0,00694 0,26389 - - 0,05556 - 0,08333 - 0,02778
13.2 - - - - - - - - 0,05556 - - - - - - -
14 0,36111 0,11111 0,02778 - 0,17361 - 0,13889 0,04861 0,29167 - - 0,27083 0,13194 0,10417 0,00694 0,02083
14.2 - - - - - - - - 0,02778 - - - - - - -
15 0,26389 0,12500 - 0,00694 0,09028 - 0,15972 0,31250 0,15972 - 0,00694 0,02083 0,23611 0,10417 0,01389 0,04167
15.2 - - - - - - - - 0,02778 - - - - - - -
15.3 - - - - - - - - - - - - - 0,02778 - -
16 0,15278 0,14583 - 0,04167 0,02083 - 0,23611 0,30556 0,04861 - - 0,00694 0,23611 0,15972 0,04167 0,09028
16.2 - - - - - - - - 0,04167 - - - - - - -
16.3 - - - - - - - - - - - - - 0,05556 - -
17 0,00694 0,25694 - 0,28472 0,00694 - 0,09722 0,06944 0,00694 - - - 0,20139 0,01389 0,11806 0,03472
17.2 - - - - - - - - 0,00694 - - - - - - -
17.3 - - - - - - - - - - - - - 0,15972 0,00694 -
18 - 0,25694 - 0,06944 - - 0,04861 0,04167 0,00694 - 0,02083 - 0,18056 0,01389 0,27083 0,07639
18.3 - - - - - - - - - - - - - 0,06250 0,01389 -
19 - 0,09028 - 0,08333 - - 0,05556 - - - 0,08333 - 0,01389 - 0,09722 0,06250
19.3 - - - - - - - - - - - - - - 0,02083 -
20 - 0,01389 - 0,20833 - - 0,01389 - - - 0,18056 - - - 0,12500 0,09722
20.2 - - - - - - - - - - - - - - - 0,02083
21 - - - 0,03472 - - 0,00694 - - - 0,19444 - - - 0,09028 0,03472
21.2 - - - - - - - - - - - - - - - 0,02083
22 - - - 0,02778 - - 0,00694 - - - 0,18750 - - - 0,09722 0,01389
22.2 - - - - - - - - - - - - - - - 0,02083
23 - - - 0,10417 - - - - - - 0,10417 - - - 0,07639 0,00694
23.2 - - - - - - - - - - - - - - - 0,02083
24 - - - 0,08333 - - - - - - 0,12500 - - - 0,01389 -
24.2 - - - - - - - - - - - - - - - 0,00694
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
27
25 - - - 0,04167 - - - - - - 0,06250 - - - 0,00694 -
25.2 - - - - - - - - - - - - - - - 0,02083
26 - - - 0,01389 - - - - - - 0,03472 - - - - -
26.2 - - - - - - - - - - - - - - - 0,07639
27 - - - - - 0,02083 - - - - - - - - - -
27.2 - - - - - - - - - - - - - - - 0,09722
28 - - - - - 0,18750 - - - - - - - - - -
28.2 - - - - - - - - - - - - - - - 0,03472
29 - - - - - 0,17361 - - - - - - - - - -
29.2 - - - - - - - - - - - - - - - 0,06250
30 - - - - - 0,22222 - - - - - - - - - -
30.2 - - - - - 0,06944 - - - - - - - - - 0,04861
31 - - - - - 0,04167 - - - - - - - - - -
31.2 - - - - - 0,09028 - - - - - - - - - 0,01389
32 - - - - - 0,02778 - - - - - - - - - -
32.2 - - - - - 0,08333 - - - - - - - - - 0,00694
33.2 - - - - - 0,08333 - - - - - - - - - 0,02083
34 - - - - - - - - - - - - - - - 0,00694
34.2 - - - - - - - - - - - - - - - 0,00694
Ho 0,70833 0,81944 0,75000 0,83333 0,83333 0,88889 0,75000 0,83333 0,86111 0,81944 0,84722 0,83333 0,84722 0,91667 0,86111 0,94444
He 0,74582 0,81605 0,76195 0,84615 0,78555 0,86150 0,85927 0,76709 0,81342 0,78448 0,86140 0,78263 0,80332 0,89112 0,86733 0,94784
P 0,60766 0,62188 0,95300 0,22110 0,71997 0,75687 0,04210* 0,38836 0,27809 0,62214 0,45746 0,25520 0,99579 0,80110 0,46041 0,10571
PI 0,11090 0,06228 0,09776 0,04232 0,07385 0,03698 0,03803 0,09379 0,06114 0,08403 0,03765 0,08459 0,07259 0,02431 0,03237 0,00654
PD 0,88910 0,93772 0,90224 0,95768 0,92615 0,96302 0,96197 0,90621 0,93886 0,91597 0,96235 0,91541 0,92741 0,97569 0,96763 0,99346
PE 0,44126 0,63560 0,50977 0,66229 0,66229 0,77278 0,50977 0,66229 0,71688 0,63560 0,68939 0,66229 0,68939 0,82959 0,71688 0,88677
PIC 0,69701 0,75589 0,65153 0,82347 0,75461 0,83941 0,83679 0,72473 0,78359 0,74383 0,83867 0,74225 0,76606 0,87386 0,84817 0,93817
IP 1,71427 2,76916 2,00000 2,99994 2,99944 3,50005 2,00000 2,99994 3,59997 2,76916 3,27268 2,99994 3,27268 6,00024 3,59997 8,99928
PDc = 0,99999999999999999999829836 PEc = 0,99999999213598 Ho média = 0,83420 +/₋ 0,06011 He média = 0,82468 +/₋ 0,05465
Ho: heterozigotia observada. He: heterozigotia esperada. P: valor de p do teste exato do equilíbrio de Hardy-Weinberg. PI: matching
probability. PD: poder de discriminação. PE: probabilidade de exclusão. PIC: polymorphic information content. IP: índice de paternidade.
PDc: poder de discriminação combinado. PEc: probabilidade de exclusão combinado. * aplicando a correção de Bonferroni (p = 0,00313)
o valor deixa de ter significância estatística
Naturalmente que os valores de matching probability (PI) estão diretamente
relacionados com os valores do poder de discriminação, uma vez que se obtêm um do
outro através da subtração à unidade. Focando-nos no poder de discriminação, todos
os marcadores apresentavam valores elevados variando desde 0,88910 no locus
D10S1248 a 0,99346 no locus SE33. À semelhança do obtido com outros parâmetros,
baixos valores de PI caraterizavam os loci D10S1248 e D16S539 enquanto elevados
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
28
caraterizavam os loci D1S1656 e SE33. O poder de discriminação combinado para o
conjunto de marcadores analisado foi de 0,999999999999999999998, valor que sendo
manifestamente muito elevado confere ao conjunto de marcadores uma excelente
capacidade de discriminação entre indivíduos.
Relativamente à probabilidade de exclusão, os valores variam desde 0,44126
para o locus D10S1248 até 0,88677 para o SE33, sendo em regra mais baixos para loci
menos informativos (D10S1248 e D16S539) e mais elevados para os mais informativos
(SE33 e D1S1656), e concordantes com os valores do poder de discriminação. A
probabilidade de exclusão combinada para o conjunto de marcadores analisados é de
0, 999999992.
Os valores do índice de paternidade (IP) calculados para cada locus variam
entre 1,7 e 9, sendo o menor correspondente ao locus D10S1248 e o maior ao SE33,
também se verificando uma relação com o poder informativo obtido para os loci com
outros parâmetros e anteriormente observado para o poder de exclusão. Estes valores
pelo facto de estarem associados a um locus e não a um caso de paternidade específico
permitem inferir com que peso esse locus contribuirá para o índice de paternidade
combinado num caso específico. Sendo assim, tendo em conta os valores obtidos,
podemos concluir que os 2 loci mais polimórficos e com maior número de alelos raros
são D1S1656 e SE33, uma vez que lhes estão associados os maiores valores de IP e
de PE, enquanto os loci D10S1248 e D16S539 são os menos informativos por lhes
estarem associados valores mais baixos destes parâmetros. Outro marcador com baixo
poder informativo para paternidades é o D18S51.
O valor do índice de paternidade combinado associado aos loci contidos no kit
NGM Select é de 1,1 × 108, correspondendo a um valor de “probabilidade de
paternidade” (W = IP/(IP + 1)) de 0,999999991. Este valor associado ao valor de
0,999999992 para a probabilidade de exclusão, permite concluir que este kit tem
elevada capacidade para dar resposta a casos que envolvam averiguações de
paternidade.
Diversas características são necessárias para que um marcador possa ser
integrado na prática forense, nomeadamente ser de fácil deteção com a tecnologia
atualmente disponível (eletroforese capilar, por rotina), permitir estratégias de
amplificação que originem produtos de PCR de tamanho reduzido e com baixo teor em
artefactos ou stutters, não estar em linkage com outros marcadores que sejam
simultaneamente testados, e ainda possuir um elevado poder de discriminação e níveis
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
29
de heterozigotia superiores a 70% [7]. Podemos afirmar que todos os marcadores
presentes no kit NGM Select cumprem os requisitos anteriormente mencionados, e que
o kit no seu conjunto constitui uma ferramenta poderosa para discriminar os indivíduos
de origem ucraniana, que foram alvo deste estudo.
Resumindo as caraterísticas individuais dos marcadores contidos no kit, o locus
D10S1248 revela ser o menos informativo uma vez que os valores de heterozigotia, a
probabilidade de exclusão, o poder de discriminação, e o índice de paternidade são mais
reduzidos para este marcador, comparativamente com os outros. O único indicador que
não é o mais baixo para este locus é o PIC. O locus D16S539 ó o que apresenta o
menor valor de PIC, sendo este marcador também um dos menos informativos por
apresentar valores reduzidos para todos os parâmetros. Esta observação está de
acordo com os dados publicados para populações caucasianas e hispânicas analisadas
com este kit, onde os loci D22S1045, D10S1248 e D16S539 são em geral os menos
informativos [76].
Quanto aos loci mais informativos, sobressaem o D1S1556, pelos valores muito
elevados para todos os parâmetros que o posicionam em segundo lugar em termos
informativos, mas sobretudo o SE33, sem dúvida o locus mais informativo com valores
de PE, PD, PIC, IP e heterozigotia claramente superiores aos registados nos restantes
marcadores contidos no kit NGM Select. Como já se referiu este kit tem um marcador
a mais relativamente à versão original, o kit NGM que era constituído por todos os
European Standard Set STR (ESS), incluindo o marcador amelogenina, estabelecidos
pelo Conselho da União Europeia 2009/C296/01 a 30 de novembro de 2009 [7].
Compreende-se bem que o novo marcador introduzido na versão atualizada,
NGM Select, tenha sido o SE33. Estudos anteriores envolvendo populações hispânicas,
caucasianas e afro-americanas [76] já tinham realçado que a inclusão do SE33 num kit
“forense” era uma mais valia, conclusão que sai reforçada neste estudo efetuado com
uma amostra de indivíduos ucranianos.
De facto, em comparação com o kit NGM, o NGM Select, para esta mesma
amostra populacional, proporciona um PDcombinado 160 vezes superior, uma PEcombinado e
um IP 9 vezes superior e também um aumento de cerca de 0,8 % na heterozigotia média
observada. Em termos de aplicações forenses o NGM Select é, pois, mais vantajoso
que a versão anterior.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
30
4.2. Estudo interpopulacional
Para efetuar comparações entre populações envolvendo áreas geográficas mais
ou menos abrangentes, foi necessário diminuir o número de marcadores comparados
sobretudo para populações asiáticas e fronteiras à Ucrânia, uma vez que não estavam
tipadas para todos os marcadores presentes no kit NGM Select. Sendo assim, durante
a descrição dos resultados, nos pontos seguintes, o número de marcadores e de
populações comparadas vai variando conforme foi discriminado na seção Material e
Métodos.
4.2.1. Intercontinental
Figura 5. Representação geográfica dos 46 países/zonas utilizados (a vermelho) na comparação genética efetuada com
os 10 marcadores descritos
CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. RE: Rússia Europeia. AZ: Azerbaijão. IQ: Iraque. TQ:
Turquia. AZ: África do Sul (população AmaXhosa). AO: Angola. MA: Marrocos. GL: Gronelândia. IS: Islândia. SE: Suécia.
NO: Noruega. FI: Finlândia. EE: Estónia. LV: Letónia. LT: Lituânia. BY: Bielorrússia. UA: Ucrânia. PL: Polônia. DK:
Dinamarca. DE: Alemanha. BE: Bélgica. NL: Holanda. FR: França. CH: Suíça. IT: Itália. AT: Áustria. CZ: Republica Checa.
SK: Eslováquia. HU: Hungria. RO: Roménia. MD: Moldávia. SI: Eslovénia. HR: Croácia. BA: Bósnia e Herzegovina. RS:
Sérvia. ME: Montenegro. AL: Albânia. MK: Macedónia. GR: Grécia. IE: Irlanda. GB: Reino Unido. ES: Espanha. PT:
Portugal.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
31
Para avaliar a capacidade de distinção genética entre populações provenientes
de diferentes continentes foram produzidas duas matrizes de distâncias genéticas, uma
com FST e outra com (δμ)2, apresentadas no anexo 3 obtidas com base em frequências
genéticas. De modo a englobar amostras populacionais de diversos países da Europa,
Ásia e África assim como da Gronelândia, foi necessário reduzir o número de
marcadores para 10, sendo eles: vWA, D16S539, D2S1338, D8S1179, D21S11,
D18S51, D19S433, TH01, FGA e D3S1358.
Na Figura 5 estão assinalados os países, a que pertenciam as amostras,
utilizados nesta comparação.
4.2.1.1. Análise com a distância genética FST
A matriz de FSTs foi submetida à analise de MDS da qual resultou o gráfico que
se mostras na Figura 6, onde se pode observar que as duas populações subsarianas
(Angola e África do Sul) e as 3 da Ásia centro-leste (Cazaquistão, China e Sibéria) se
diferenciaram bem das populações Europeias, indicando, assim, que o conjunto de 10
marcadores usados na análise permite distinguir, razoavelmente, populações
geograficamente bastante separados, nomeadamente as que se localizam em
diferentes continentes, mas excluindo as de regiões fronteiriças.
Figura 6. Gráfico de Multidimensional scaling (MDS) para os valores de FST, obtidos a partir da comparação das
populações representadas na Figura 5 para os 10 marcadores anteriormente referidos Europa médio oriente
Ásia África Gronelândia (continente americano)
Esse gráfico revela ainda que populações de países do médio-oriente (Iraque,
Turquia), do oeste asiático (Azerbaijão) e até do Norte de África (Marrocos) ocupam
UcrâniaRoméniaPolóniaLituânia Albânia
EslovêniaEslovaquiaHungria Macedónia
Bósnia e HerzegovinaGréciaAustriaRepublica Checa
Alemanha
Finlândia
HolandaBélgica Suiça
ItáliaPortugal
EspanhaDinamarcaLetónia
EstóniaSérbiaMontenegro
Croácia
Noruega
França
Reino UnidoIrlanda
MoldáviaBielorussia
Suécia
IslândiaRussia (europeia)
Gronelândia
Casaquistão
Arzebeijão
Sibéria
China
Africa Sul (bantu)
Marrocos
Angola
IraqueTurquia
-0,03
-0,02
-0,01
0
0,01
0,02
0,03
-1,20E-02 -2,00E-03 8,00E-03 1,80E-02 2,80E-02 3,80E-02
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
32
posições intermédias no gradiente de diversidade que abrange as populações
euroasiáticas, ainda que globalmente se agrupem mais próximo das populações
Europeias que das central-asiáticas. Destaca-se ainda a Gronelândia pela enorme
diferenciação relativamente a qualquer outra população.
Na Tabela 3 compilam-se os valores de FST retirados da matriz completa de FST,
depois de terem sido agrupados consoante envolviam populações das seguintes
regiões: médio oriente, África subsariana, Europa, Ásia centro-oriental, oeste da Ásia
(Azerbaijão), norte de África (Marrocos) e Gronelândia.
Tabela 3. Variação nos valores da distância de FST (em percentagem) entre 7 regiões definidas (médio oriente, Europa,
Ásia (oeste), Ásia (centro-oriental), Norte de África, África subsariana e Gronelândia)
médio
oriente Europa Ásia (oeste)
Ásia
(centro-
oriental)
Norte África África Gronelândia
médio oriente 0,1 0,4-0,9 0,1-0,2 1,1-2 0,7-0,8 2,6-3,1 4,6
Europa 0,4-0,9 0-0,8 0,3-1,1 1,9-3,8 0,5-1,6 3-4,8 5,2-6,1
Ásia (oeste) 0,1-0,2 0,3-1,1 - 0,8-2 0,9 2,8-3,2 5,2
Ásia (centro-
oriental) 1,1-2 1,9-3,8 0,8-2 0,3-1 1,5-2,6 3,1-4,3 4,2-5,6
Norte África 0,7-0,8 0,5-1,6 0,9 1,5-2,6 - 2,5-3 5,1
África
subsariana 2,6-3,1 3-4,8 2,8-3,2 3,1-4,3 2,5-3 0,6 4,6-5,5
Gronelândia 4,6 5,2-6,1 4,2 4,2-5,6 5,1 4,6-5,5 -
Analisando a Tabela 3 constata-se que as distâncias entre populações das
mesmas zonas geográficas (valores a azul na linha diagonal) são todas inferiores a 1%
e estatisticamente não significativos (anexo 4 e seção 4.2.3), sendo que o maior valor
se observou entre populações da Ásia (centro-oriental), e os menores entre populações
da Europa ou do médio-oriente (ressalvando que no médio-oriente só se compararam
dois países, Iraque e Turquia). Em geral, os intervalos de FST dentro de cada região são
mais baixos que os observados entre regiões diferentes.
Atendendo aos intervalos de FST entre regiões, pode inferir-se que o médio
oriente está mais relacionado geneticamente com o oeste asiático, europa e Norte de
África (por esta ordem) do que com a Ásia centro-oriental, África subsariana e
Gronelândia. Que o oeste asiático tem mais afinidades com o médio oriente, Europa e
norte de África do que com o resto do continente asiático. E que o mesmo acontece com
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
33
o Norte de África, no sentido de diferir em geral menos de populações do médio-oriente,
Europa e oeste asiático do que das populações da África subsariana.
Não se observaram diferenças estatisticamente significativas entre as regiões:
Norte de África, oeste asiático, Europa e médio oriente (anexo 4). Esta observação era
expectável, uma vez que, mesmo recorrendo a um elevado número de marcadores de
STR, não se consegue diferenciar bem as zonas anteriormente mencionadas [77].
Quanto aos valores de distância entre regiões geograficamente mais afastadas,
Ásia centro-oriental, África subsariana, Europa e Gronelândia, assinalados a vermelho
na tabela, os maiores encontram-se entre a Gronelândia e qualquer uma das outras
regiões (4,2-6,1%), e os seguintes são os que separam a África subsariana das
restantes regiões (3,1-4,8%). Em comparação, o intervalo de distâncias entre
populações da Europa e da Ásia centro-oriental é bem mais baixo (1,9-3,8%).
A marcada diferenciação da Gronelândia é em parte devida ao isolamento da
região e dos seus habitantes, o que contribuiu para uma diminuição da diversidade
genética na população desta grande ilha. Analisando em diferentes populações os
valores de heterozigotia para cada marcador e a respetiva heterozigotia média, é
evidente a reduzida diversidade dos gronelandeses. Na Figura 7, onde se representam
os valores de heterozigotia, por marcador, para os 46 países, consegue-se visualizar
claramente os picos de decréscimo de heterozigotia na Gronelândia em relação aos
restantes países, o que também se regista nos valores de heterozigotia média dado que
na Gronelândia estes eram de 77% e nos outros países variavam entre 80-83%.
Certamente que a diferença de diversidade contribui para inflacionar os valores de FST
entre a Gronelândia e os restantes países.
Excluindo a Gronelândia, os FSTs entre África subsariana, Ásia e Europa variaram
entre 1,9 e 4,8%, sendo valores em média baixos e inferiores aos reportados em estudos
baseados em painéis com maior número de marcadores (9-12%) [78]. Usando como
referência o trabalho de Rosenberg et al. 2002, em que foram analisados 377 STRs
não-forenses, os valores de FST rondaram 4,3-5,7% [13], ou seja, superiores aos
observados neste estudo. Mas já no estudo realizado por Silva et al, 2012 baseado
apenas em 10 ou 13 STRs forenses (mais especificamente do CODIS) [79] e em grupos
populacionais definidos segundo o mesmo critério de Rosenberg et al. 2002, os valores
obtidos eram mais baixos (2,3-2,7%) e claramente mais próximos dos nossos.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
34
Figura 7. Valores de heterozigotia para os 10 marcadores referidos anteriormente, para as 46 populações utilizadas na
comparação
Silva et al., 2012 também calcularam distâncias tendo em conta 434 loci
tetraméricos não-forenses e as populações do HGDP-CEPH (Human Genome Diversity
Cell Line Panel), chegando a valores que subiram até 5,3%, sendo todos superiores aos
obtidos com marcadores forenses. Esta observação permitiu concluir que as menores
diferenciações capturadas pelos marcadores forenses refletem no fundo o facto de estes
marcadores serem selecionados em função da eficiência na identificação individual, ou
seja, muito mais pelo nível de diversidade em geral do que pela capacidade em detetar
subestruturação entre os grandes grupos populacionais humanos. Dai que no conjunto
se caracterizem por menor variância interpopulacional que a média registada para
STRs, tendendo, pois, a produzir distâncias genéticas inferiores às que decorrem da
análise de marcadores neutros não-forenses. Os resultados obtidos neste trabalho
reforçam bem esta ideia.
Existem, no entanto, investigações forenses em que é importante referir a
ancestralidade genética de uma amostra, o que implica recorrer a marcadores com
elevada capacidade para discriminar grandes grupos populacionais humanos. Por isso,
têm sido desenvolvidos esforços para otimizar baterias de marcadores contendo um
número relativamente reduzido de loci (como convém na rotina forense) mas,
selecionados especificamente pela capacidade em detetar acentuada divergência entre
0,52
0,57
0,62
0,67
0,72
0,77
0,82
0,87U
crân
ia
Ro
mén
ia
Po
lón
ia
Litu
ânia
Alb
ânia
Esl
ovê
nia
Iraq
ue
Turq
uia
Eslo
vaq
uia
Hu
ngr
ia
Mac
edó
nia
Bo
snia
e H
erze
gow
ina
Gré
cia
Au
stri
a
Rep
ub
lica
Ch
eca
Ale
man
ha
Fin
lân
dia
Ho
lan
da
Bél
gica
Suiç
a
Itál
ia
Po
rtu
gal
Esp
anh
a
Din
amar
ca
Gro
nel
ând
ia
Cas
aqu
istã
o
Letó
nia
Estó
nia
Sérb
ia
Mo
nte
neg
ro
Cro
ácia
No
rueg
a
Fran
ça
Rei
no
Un
ido
Irla
nd
a
Mo
ldáv
ia
Bie
loru
ssia
Suéc
ia
Islâ
nd
ia
Arz
ebei
jão
Ru
ssia
Sib
éria
Ch
ina
Afr
icaS
ul
Mar
roco
s
An
gola
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
35
indivíduos de diferentes zonas geográficas (continentes). Esse tipo de marcadores são
habitualmente designados de ancestry informative markers (AIMs), existindo já vários
kits de AIMs, quer de tipo STR, SNP ou INDEL, que permitem obter suficiente distinção
com números razoáveis de marcadores [24, 80].
Comparando os nossos resultados de diferenciação intercontinental com os
baseados em AIMs, não é de estranhar que o padrão de relacionamento entre grandes
grupos populacionais seja menos vincado que o obtido com AIMs. Mas também não se
estranha que o nível de diferenciação detetado seja muito semelhante ao encontrado
em trabalhos recentes baseados em outros conjuntos de STRs usados em identificação
forense, nomeadamente 15 do kit Identifiler ou 20 incluindo os do Identifiler mais os 5
novos ESS, trabalhos esses em que também foi avaliada a capacidade desses
marcadores permitirem inferir corretamente a ancestralidade, tendo registado erros de
atribuição de ancestralidade entre 10 e 15 % [81, 82].
Dentro da Europa, o padrão de subestruturação populacional obtido com este
conjunto de 10 marcadores é muito pouco claro, e ao contrário do que tem sido
frequentemente descrito [25, 32, 33], não é evidente a sua associação com a geografia,
o que se explica novamente pelo, reduzido número de marcadores e critérios que
presidiram à sua seleção. Mais a frente, na secção 4.2.3. o nível europeu será discutido
em maior pormenor.
4.2.1.2. Análise com a distância genética (δμ)2
Também se efetuou MDS com a matriz de distância (δμ)2, e a respetiva
representação gráfica aparece na Figura 8. Tal como no gráfico de FSTS, neste observa-
se na mesma o distanciamento claro das duas populações subsarianas, bem como o
posicionamento das populações da Ásia centro-oriental num cluster perto daquele que
inclui as populações Europeias.
Existem, porém, algumas discrepâncias no relacionamento entre populações
que se infere quando se usam distâncias (δμ)2, que têm em conta o stepwise mutation
model (SMM), ou distâncias FST, que assumem o infinite alleles model. Uma das mais
acentuadas é relativamente à Gronelândia que com base em (δμ)2 surge, totalmente
integrada num grande cluster que engloba populações do continente Europeu, onde
também se integram as amostras do Iraque, Turquia e Azerbaijão, que não se observava
com os dados de FST. Outra discrepância que sobressai respeita a população de
Marrocos que aparece bem diferenciada no gráfico baseado em (δμ)2.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
36
Figura 8. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos a partir da comparação das
populações representadas na Figura 5 para os 10 marcadores anteriormente referidos Europa médio oriente
Ásia África Gronelândia (continente americano)
Apesar destas desconformidades, quando se testou a relação entre as matrizes
de (δμ)2 e FST, o valor da regressão linear obtido foi 0,7194, com p=0,01, o que mostra
haver forte correlação entre as duas distâncias, apesar de em ambos os casos serem
inferiores às descritas com base em maior número de marcadores [83].
As diferenças no padrão de relacionamento interpopulacional obtido com as
duas medidas de distância genética, podem explicar-se atendendo às distintas
propriedades e limitações de (δμ)2 e FST. Como o nível de diferenciação em populações
subestruturadas depende muito de acontecimentos de mutação e migração, o FST pode
levar a subestimativas dessa diferenciação por não entrar em linha de conta com o
modelo de mutação mais adequado aos STRs [84]. Apesar desse modelo ser assumido
em (δμ)2, esta medida é, no entanto, muito sensível à taxa de mutação de cada STR,
que como está bem documentado pode variar muito de locus para locus. Já foi
demonstrado que alguns STRs são capazes de produzir distâncias invulgarmente
elevadas, sendo capazes de dominar o valor médio de (δμ)2, muito provavelmente
devido às elevadas taxas de mutação que os caracterizam [58]. A título ilustrativo pode
referir-se o trabalho de Goldstein et al., 1995, que com base no estudo de 30 marcadores
em diferentes populações humanas, encontraram diferenciações interpopulacionais
substancialmente diferentes quando recorreram a (δμ)2 comparativamente às obtidas
com outras distâncias, muito devido à grande variação dos (δμ)2 [58].
Tal como se fez com os valores de FST, na Tabela 4 apresentam-se os intervalos
de variação de (δμ)2 observados nas mesmas regiões consideradas na Tabela 3.
UcrâniaRoménia
Polónia
Lituânia
AlbâniaEslovênia
EslovaquiaHungriaMacedónia
Bósnia e HerzegovinaGrécia
AustriaRepublica ChecaAlemanha
Finlândia
HolandaBélgicaSuiça
Itália PortugalEspanha
Dinamarca
LetóniaEstónia
SérbiaMontenegroCroácia
Noruega
FrançaReino UnidoIrlanda
MoldáviaBielorussia
SuéciaIslândiaRussia (europeia)Gronelândia
Arzebeijão
Casaquistão
Sibéria
China
Africa Sul (bantu)
Marrocos
AngolaIraque
Turquia
-0,36
-0,26
-0,16
-0,06
0,04
0,14
0,24
-0,2 -0,1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
37
Tabela 4. Variação nos valores da distância de (δμ)2 entre 7 regiões definidas (médio oriente, Europa, Ásia (oeste),
Ásia (centro-oriental), Norte de África, África e Gronelândia)
médio oriente Europa Ásia (oeste) Ásia (centro-
oriental) Norte África África Gronelândia
médio oriente 0,053 0,055-0,175 0,032-0,039 0,050 - 0,167 0,227-0,328 0,405-0,705 0,125-0,188
Europa 0,055-0,175 0,004-0,251 0,028-0,205 0,105-0,497 0,100-0,47 0,469-0,911 0,225-0,484
Ásia (oeste) 0,032-0,039 0,028-0,205 - 0,093-0,229 0,210 0,528-0,716 0,188
Ásia (centro-
oriental) 0,050-0,167 0,105-0,497 0,093-0,229 0,039-0,045 0,452-0,643 0,391-0,612 0,179-0,310
Norte África 0,227-0,328 0,100-0,470 0,210 0,452-0,643 - 0,570-0,842 0,394
África 0,405-0,705 0,469-0,911 0,528-0,716 0,391-0,612 0,570-0,842 0,131 0,561-0,809
Gronelândia 0,125-0,188 0,225-0,484 0,188 0,179-0,310 0,394 0,561-0,809 -
Analisando a Tabela 4 consegue-se perceber que, ao contrário do observado
com FST, não existe uma linha muito clara a separar diferenciações intra e
intercontinental, uma vez que alguns dos valores de diferença intracontinentais (linha
diagonal) são superiores aos intercontinentais, como se observa, por exemplo, nas
distâncias da Holanda e Lituânia relativamente aos países Europeus superiores às que
apresentam relativamente ao Cazaquistão.
Ao contrário do observado com FST a diferença entre médio oriente e o Norte de
África é elevada, embora menor do que em relação ao restante continente africano. O
oeste asiático parece estar mais relacionado com o médio oriente do que com as
restantes zonas geográficas, não se observando a proximidade à Europa que se obtinha
com os FST. A diferença entre o norte de África e as restantes zonas mostra um padrão
semelhante ao observado com os dados de FST, apesar do afastamento ser maior.
Os intervalos de variação de (δμ)2 referentes às comparações intercontinentais
(Ásia centro-oriental, África subsariana, Europa), assinalados a vermelho na Tabela 4,
revelam que as maiores diferenciações se encontram entre populações de África
subsariana e populações europeias ou da Ásia centro-oriental, enquanto que que as
menores envolvem pares em que uma população é a Ásia centro-oriental e a outra da
Europa.
Estes valores de diferenciação intercontinental são em média inferiores aos
valores de (δμ)2 obtidos num outro estudo que utilizou um painel de 213 marcadores
(0,481-2,436) [84]. O elevado número de marcadores, em relação aos aqui estudados,
pode em parte explicar a diferença observada, mas a causa principal reside
provavelmente no facto de neste trabalho se terem usado apenas marcadores forenses,
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
38
contribuindo para um certo enviesamento dos resultados, na medida em que estes
marcadores são tipicamente escolhidos para diferenciar indivíduos da mesma
população não sendo os mais adequados para captar a divergência entre indivíduos de
populações distintas, e dai possuírem valores de (δμ)2 inferiores aos obtidos com painéis
de STR selecionados com outros critérios [79].
Numa apreciação global dos resultados obtidos com FST e (δμ)2 na análise
comparativa a nível intercontinental, o panorama de relacionamento populacional
produzido por FSTs parece enquadrar-se melhor com o que se sabe sobre a história
desses grandes grupos populacionais. Apesar de (δμ)2 ter sido desenvolvida entrando
em conta com o modelo de mutação especifico para STRs, nem sempre se comporta
melhor que o convencional FST, especialmente quando se avaliam diferenciações
populacionais que ocorreram em escalas temporais bastantes distintas [84].
4.2.1.3. Testes de Mantel
Aplicou-se o teste de Mantel para avaliar se no conjunto de populações
consideradas havia relação entre as distâncias genéticas obtidas com FST e (δμ)2 e
distâncias geográficas. Os valores de R2 obtidos foram de 0,5956 e 0,562, ambos
associados a p=0,01, para os dados de FST e (δμ)2, respetivamente. Estas correlações
significativas vão ao encontro do descrito na literatura, evidenciando uma clara relação
entre distâncias geográficas e genéticas, mesmo quando se utiliza um reduzido número
de marcadores [83]. Os valores de R2 agora obtidos, apesar de serem ambos
relativamente elevados, mostram que a correlação entre diferenciação medida por FST
e distância geográfica é ligeiramente mais forte, o que também está de acordo com o
que está reportado [83].
4.2.2. Fronteira Europa-Ásia/ fronteira Ucrânia
4.2.2.1. Fronteira Europa-Ásia
De forma a estudar a capacidade dos marcadores contidos no kit NGM SelectTM
para discriminar populações de países localizados na fronteira entre a Europa-
Ásia/fronteira Ucrânia, e perceber se através destes marcadores é possível distinguir a
Ucrânia dos seus países vizinhos, repetiram-se as análises apresentados no ponto
anterior com os mesmos 10 marcadores mencionados, mas restringindo os países aos
que se encontram representados na Figura 9.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
39
Figura 9. Representação geográfica dos 18 países/zonas utilizados (a vermelho) na comparação genética efetuada com
os 10 marcadores descritos no ponto 4.2.1.
CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. RE: Rússia Europeia. AZ: Azerbaijão. SE: Suécia. FI: Finlândia. EE:
Estónia. LV: Letónia. LT: Lituânia. BY: Bielorrússia. UA: Ucrânia. PL: Polônia. SK: Eslováquia. HU: Hungria. RO:
Roménia. MD: Moldávia. MK: Macedónia.
O gráfico de MDS, baseado em FST, encontra-se na Figura 10.
Figura 10. Gráfico de Multidimensional Scaling (MDS) para os valores de FST, obtidos a partir da comparação das
populações representadas na Figura 9 para os 10 marcadores referidos no ponto 4.2.1. Europa Ásia
Ucrânia
RoméniaPolónia
Lituânia
Eslovaquia
HungriaMacedónia
Finlândia
Letónia
Estónia
Moldávia
Bielorrússia
Suécia
Rússia
Cazaquistão
Azerbeijão
Sibéria ("Sul")
China-0,0045
-0,0025
-0,0005
0,0015
0,0035
0,0055
-0,0115 -0,0065 -0,0015 0,0035 0,0085 0,0135 0,0185 0,0235 0,0285
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
40
Como é possível observar através da análise da Figura 10, com os dados de
FST, consegue-se uma clara separação entre populações dos países asiáticos e dos
europeus, sendo, no entanto, visível a relativa proximidade entre sudoeste asiáticos (do
Azerbaijão) e sudeste Europeus (da Roménia). Aliás, as 3 populações asiáticas,
mostram um grau de diferenciação do cluster europeu, que está razoavelmente de
acordo com o respetivo afastamento geográfico.
Os valores de distância de FST entre populações são os mesmos já descritos no
ponto 4.2.1., mas destaca-se agora que as distâncias genéticas entre os países
Europeus variaram entre 0 e 0,8%, enquanto que a distância dos países Europeus em
relação à Ucrânia variou entre 0 e 0,6%. Por outro lado, a distância entre o Azerbaijão
e a Ucrânia foi de 0,7% e a distância entre os países do leste asiático (o Cazaquistão,
a China ou a Sibéria) e a Ucrânia variou entre 1,5, 2,4 e 3,3%, respetivamente. Estes
dados indicam que, independentemente da proximidade geográfica, a Ucrânia
apresenta maior proximidade genética com os países europeus, do que com qualquer
um dos países asiáticos.
A análise de FST locus a locus, revelou um menor número de loci com distâncias
significativas entre a Roménia (Europa) e o Azerbaijão (4 loci significativos, para um
nível de significância de 0,05), do que entre o Azerbaijão e os restantes países da Ásia
(seção 4.2.1.), refletindo o que já tinha sido comentado na seção 4.2.1. sobre a
constatação de que populações de países asiáticos localizados na fronteira com a
Europa apresentarem mais afinidades com populações da Europa do que com as outras
populações localizadas no continente asiático.
Com os valores da diferenciação genética produzidos por (δμ)2, obteve-se um
padrão de relacionamento interpopulacional globalmente semelhante ao observado
através dos dados de FST. Analisando o heatmap (Figura 11) da matriz da distância
genética de (δμ)2 é possível observar a separação dos países asiáticos dos restantes
países europeus e a maior proximidade do Azerbaijão (sudoeste da Ásia) com a
Roménia (Europa) do que com as outras populações asiáticas.
Nesta zona de fronteira entre a Europa e a Ásia, as distâncias genéticas também
se correlacionam bem com a distribuição geográfica dos países. Os valores de R2
obtidos com o teste de Mantel foram 0,9089 e 0,6374 para as distâncias de FST e (δμ)2,
respetivamente, sendo ambos estatisticamente significativos (p = 0,01). Comparando
estes valores com os obtidos anteriormente para o nível geográfico mais global (R2 de
0,5956 e 0,562 e p de 0,01 para FST e (δμ)2, respetivamente), verifica-se que a
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
41
correlação é até mais forte nesta zona da Eurásia, o que significa que a distribuição da
diversidade genética é muito influenciada pelas barreiras geográficas.
CN SS KZ AZ MO RO MK UA BY RE PL HU SK LV EE SE FI LT
CN
SS
KZ
AZ
MO
RO
MK
UA
BY
RE
PL
HU
SK
LV
EE
SE
FI
LT
Figura 11. Heatmap da matriz da distância genética de (δμ)2 para as populações estudadas.
CN: China. SS: “Sul” da Sibéria. KZ: Cazaquistão. AZ. Azerbaijão. MD: Moldávia. RO: Roménia. MK:
Macedónia. UA: Ucrânia. BY: Bielorrússia. RE: Rússia Europeia. PL: Polônia. HU: Hungria. SK: Eslováquia. LV: Letónia.
EE: Estónia. SE: Suécia. FI: Finlândia. LT: Lituânia.
4.2.2.2. Fronteira Ucrânia
Para restringir a análise aos países fronteiros à Ucrânia, foram produzidos novos
gráficos de MDS e PCA tendo apenas em conta os países relevantes.
Na Figura 12 apresentam-se dois gráficos de MDS produzidos a partir das
distâncias genéticas, FST e (δμ)2, e de dois gráficos de PCA construídos, respetivamente,
a partir das frequências alélicas e da heterozigotia para os 10 marcadores. Como se
pode constatar, apesar de algumas diferenças que decorrem dos próprios métodos e
das variáveis utilizadas, os gráficos são bastante coerentes entre si, destacando-se em
especial as semelhanças entre os gráficos c) e d), ambos resultantes de PCA, e o gráfico
a) que se refere ao MDS efetuado com base em distâncias FST.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
42
Figura 12. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráficos de PCA para frequências alélicas e heterozigotia
(a), b), c) e d) respetivamente) obtidos a partir da comparação das populações europeias representadas na Figura 9 que
são fronteiras à Ucrânia, para os 10 marcadores referidos no ponto 4.2.1. este da Europa sudeste da Europa
centro da Europa Norte da Europa
UcrâniaBielorrússia
Rússia
RoméniaMacedónia
Moldávia
Polónia
Lituânia
EslovaquiaHungria
LetóniaEstónia
Finlândia
Suécia
a) MDS FST
UcrâniaBielorrússia
Rússia
RoméniaMacedónia
Moldávia
Polónia
Lituânia
EslovaquiaHungria
Letónia
Estónia
Finlândia
Suécia
b) MDS (δμ)2
UcrâniaBielorrússia
Rússia
Roménia
MacedóniaMoldávia
Polónia
Lituânia
EslovaquiaHungria
Letónia
Estónia
Finlândia
Suécia
15 %
da v
aria
ção e
xplic
ada
12% da variação explicada
c) PCA frequências alélicas
UcrâniaBielorrússia
Rússia
Roménia
Macedónia
Moldávia
Polónia
Lituânia
Eslovaquia
Hungria
Letónia
Estónia
Finlândia
Suécia
39%
da v
aria
ção e
xplic
ada
25% da variação explicada
d) PCA heterozigotia
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
43
Nos gráficos a) e c) é possível observar um gradiente de diversidade desde os
países do sudeste, passando pelos do centro/este, até aos do norte da Europa,
distinguindo-se bem os grupos de populações destas três zonas. Esta observação indica
mais uma vez que a geografia é um fator importante de subestruturação populacional
no território ocupado pela Ucrânia e os países fronteiriços.
Realça-se, por exemplo, que os países bálticos do norte da europa,
nomeadamente a Lituânia, Letónia e Estónia, tendem a posicionar-se nos gráficos a) e
c) próximos dos países escandinavos, Finlândia e Suécia, dando consistência a um
grupo constituído por populações da europa setentrional. Já as populações da Europa
centro/oriental ocupam em geral posições mais centrais nos gráficos, refletindo, assim,
uma certa diferenciação que permite sustentar um grupo formado por populações da
europa de leste.
Tendo em conta os valores de heterozigotia obteve-se o gráfico d), onde os
padrões acima referidos se distinguem, mas com menos clareza, essencialmente devido
à posição da Estónia, que neste gráfico aparece deslocada do grupo da Europa
setentrional.
No gráfico b), resultante da aplicação de MDS à matriz de distâncias (δμ)2, o
padrão de suestruturação populacional é bastante mais irregular que nos restantes 3
gráficos. Observa-se alguma separação entre o norte e o centro/este, mas é estranha a
posição da Ucrânia e da Lituânia que para além de aparecem muito deslocadas dos
restantes países, não revelam as afinidades populacionais que transparecem nos
restantes gráficos. De um modo geral, esta medida parece ter menor capacidade para
captar padrões de diferenciação interpopulacional.
Com este conjunto de marcadores, é possível perceber visualmente alguma
separação geográfica entre as zonas geograficamente definidas dentro da europa e
alguma correlação com a localização geográfica dos países, apesar de haver algumas
incoerências. No entanto, como as distâncias entre os países comparados não são
estatisticamente significativas, não será de esperar observar a mesma visualização
gráfica com outro tipo de softwares de cluster, como por exemplo o STRUCTURE no
qual não é possível perceber a distância gráfica entre os diferentes países estudados.
Este último software não seria útil para este efeito, nem mesmo com um recurso
a um número mais elevado de marcadores. É possível também observar um gradiente
de sul (e sudeste) para norte. A relação entre os diferentes países da Europa será mais
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
44
aprofundada de seguida, usando um maior número de países e de marcadores nas
referidas comparações.
4.2.3. Europa
De forma a aprofundar a análise da distribuição genética europeia, foram
escolhidas populações do continente Europeu que estivessem caracterizadas para a
maioria dos marcadores contidos no kit NGM Select. A comparação incidiu sobre 15 dos
16 marcadores presentes neste kit, tendo sido excluído o marcador SE33 para o qual
havia poucos dados disponíveis. Esses 15 marcadores coincidem com os do painel do
kit NGM (ou seja, a versão anterior do kit NGM Select), que são os seguintes: D3S1358,
vWA, D16S539, D2S1338, D8S1179, D21S11, D18S51, D19S433, TH01, FGA,
D10S1248, D22S1045, D2S441, D1S1656 e D12S391.
Os 31 países considerados estão representados na Figura 13.
Figura 13. Representação geográfica dos 31 países Europeus (a vermelho) utilizados na comparação genética efetuada
com os 15 marcadores descritos anteriormente
NO: Noruega. FI: Finlândia. EE: Estónia. LV: Letónia. LT: Lituânia. UA: Ucrânia. PL: Polônia. DK: Dinamarca.
DE: Alemanha. BE: Bélgica. NL: Holanda. FR: França. CH: Suíça. IT: Itália. AT: Áustria. CZ: Republica Checa. SK:
Eslováquia. HU: Hungria. RO: Roménia. SI: Eslovénia. HR: Croácia. BA: Bósnia e Herzegovina. RS: Sérvia. ME:
Montenegro. AL: Albânia. MK: Macedónia. GR: Grécia. IE: Irlanda. GB: Reino Unido. ES: Espanha. PT: Portugal.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
45
Figura 14. Gráficos de MDS para as distâncias de FST e (δμ)2 e gráfico de PCA para frequências alélicas (a), b) e c)
respetivamente) obtidos a partir da comparação das populações europeias representadas na Figura 13 este da
Europa sudeste da Europa centro da Europa norte da Europa oeste da Europa sul da Europa
Ucrânia
Roménia
Albânia
Macedónia
Bosnia e Herzegovina
Grécia
Montenegro
Sérbia
Polónia
Lituânia
EslovêniaEslovaquiaHungria
Áustria Repub…
AlemanhaSuiça
Croácia
Letónia
Estónia
Finlândia
NoruegaDinamarca
Holanda
Bélgica
França
Reino Unido
Irlanda
Espanha
Portugal
Itália
a) MDS FST
Ucrânia
Roménia
Albânia
MacedóniaBosnia e Herzegovina
Grécia
MontenegroSérbia
Polónia
Lituânia
Eslovênia
Eslovaquia
HungriaÁustria
Republica Checa
Alemanha
Suiça
Croácia
LetóniaEstónia
Finlândia
NoruegaDinamarca
Holanda
BélgicaFrança
Reino Unido
Irlanda
Espanha
Portugal
Itália
b) MDS (δμ)2
Ucrânia
Roménia
Albânia
Macedónia
Bosnia e Herzegovina
Grécia
Montenegro
Sérbia
Polónia
Lituânia
Eslovênia
EslovaquiaHungria
Áustria
Republica Checa
AlemanhaSuiça
Croácia
LetóniaEstónia
Finlândia
NoruegaDinamarca
HolandaBélgica
França
Reino Unido
Irlanda
Espanha Portugal
Itália 9,3
% d
a va
riaç
ão e
xplic
ada
8,2 % da variação explicada
c) PCA frequências alélicas
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
46
Na Figura 14 apresentam-se os gráficos obtidos depois de aplicar o MDS a
matrizes de FST e (δμ)2 e o gráfico de PCA baseado em frequências alélicas. Os gráficos
estão representados.
No gráfico 14 a), o eixo dos Y retém um gradiente de diferenciação com
orientação Norte-Sul, dado que os países do Sul (assinalados por pontos vermelhos e
laranja) dominam a parte inferior do gráfico, enquanto que os restantes países (pontos
verde, azul e lilás) tendem a posicionar-se na parte superior. No eixo dos X também se
observa um gradiente de diferenciação, mas com orientação Este-Oeste, de tal modo
que nas partes esquerda e direita do gráfico predominam países do Oeste e do Este da
Europa, respetivamente. Consegue-se, portanto, separar com aproximação razoável os
países em 4 (quatro) zonas geográficas distintas: sul, oeste/norte, centro/este e sudeste,
cada uma ocupando predominantemente um dos quatro quadrantes do gráfico,
dividindo o gráfico em quatro quadrantes.
No entanto, chama-se a atenção, que este padrão de subestruturação
populacional foi inferido a partir de valores de diferenciação genética que não eram
estatisticamente significativos, ou seja, todos os valores de FST estavam associados a
p>5%.
Por outro lado, a relação entre localização geográfica e clusters de populações
não é de todo absoluta. Alguns clusters contêm populações de regiões que não
correspondem àquela a que estão globalmente associados. Por exemplo, a Bósnia e
Herzegovina, está integrada no grupo dos países de centro/este (verde e azul escuro)
e não no grupo dos países do sudeste da Europa onde foi integrada de acordo com o
critério geográfico, que na realidade também é bastante arbitrário. Neste caso, essa
arbitrariedade é manifesta, pois a Bósnia e Herzegovina é um dos países que está na
fronteira da região que se definiu como sudeste.
Também a Alemanha, a Áustria e a Suíça estão geneticamente agrupados com
os países de oeste/norte (azul claro e roxo), o que não se estranha visto que os 3 países
estão mais próximos do oeste europeu, não só do ponto de vista geográfico, mas
também cultural e histórico, do que com os países leste europeu. A Noruega e a
Dinamarca revelam grande afinidade com os países de oeste (azul claro), o que não
acontece com a Finlândia, que apesar da sua posição de outsider, está mais perto dos
países considerados de centro como a Lituânia, Letónia e Estónia (verde), que por sua
vez se encontram ligeiramente afastados dos restantes países de centro, bem de acordo
com a sua localização geográfica.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
47
A Finlândia sobressai por aparecer muito diferenciada de todos os outros países
incluindo do norte da Europa, mas esta observação vai ao encontro do descrito sobre
os finlandeses no contexto de diversidade europeu [32].
No global, a relação que se encontrou entre a distribuição geográfica e a
distribuição da diversidade genética é até algo surpreendente atendendo ao reduzido
número de marcadores considerado e ao facto de todos fazerem parte de um kit de
rotina forense. Estudos efetuados com um maior número de marcadores, incluindo
STRs, SNPs ou ambos, conduziram a resultados mais satisfatórios, e têm mostrado que
é possível inferir com bastante precisão a origem geográfica na Europa de uma
população e até de indivíduos com base nas suas caraterísticas genéticas [20, 33, 85].
Neste trabalho, baseado em 15 STRs forenses, confirmou-se que a geografia é
um dos principais fatores que contribuem para a distribuição da diversidade genética na
Europa. Ao mesmo tempo, a não deteção de diferenças estatisticamente significativas
entre as populações europeias pode representar uma mais valia em contexto forense,
na medida em que na ausência de uma base de dados especifica de uma certa
população talvez tivesse sentido recorrer a uma base de dados mais abrangente
representativa da sub-região geográfica em que essa população se localizasse.
A Figura 14 b) representa o gráfico de MDS baseado em distâncias (δμ)2, onde
também é possível observar o gradiente de diversidade entre populações do sul e do
norte. De um modo geral os resultados são concordantes com os obtidos com FST
(Figura 14 a)), embora se perca resolução na discriminação de populações do oeste e
do este e se alterem as posições relativas de algumas populações, nomeadamente a
Ucrânia, a Holanda, a Finlândia e a Lituânia.
Para obter uma representação não enviesada por distâncias genéticas foi
produzido o gráfico de PCA com base nas frequências alélicas que se apresenta na
Figura 14 c). O padrão de relacionamento interpopulacional aproxima-se novamente
bastante mais do obtido com MDS baseado em FST (Figura 14 a)) do que com o MDS
efetuado com (δμ)2 (Figura 14 b)).
O gráfico de PCA foi construído usando dois componentes principais da análise
efetuada, um dos quais aparenta estar relacionado com a latitude e o outro com a
longitude. No sentido de confirmar esta perceção, foi feita a análise da relação entre
essas variáveis e as coordenadas dos 3 primeiros componentes principais que
contribuem mais para a variância entre populações. Na Figura 15 mostram-se os
resultados obtidos, que permitem concluir que o componente 1, o que contribui mais
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
48
para a variância total, está significativamente relacionado com a latitude, ao contrário
dos outros componentes, que o componente 2 está significativamente relacionado com
a longitude, e que o componente 3 não está correlacionado nem com latitude nem
longitude. As correlações significativas estavam ambas associadas a valores de R2
muito elevados, e á semelhança do observado em outros estudos, a latitude tem maior
peso que a longitude na variação genética europeia [25, 32, 86], como, aliás o gráfico
de PCA retrata.
Figura 15. Relação entre a latitude/longitude e os componentes principais (1,2 e 3) para o gráfico de PCA das frequências
alélicas das populações europeias
Fazendo a mesma análise com as coordenadas dos gráficos de MDS (Tabela 5)
também se verificou que a latitude estava mais fortemente relacionada com a variável
[,1] do que com a [,2] independentemente da distância genética utilizada, embora a
correlação seja menos forte quando se considera a distância de (δμ)2, como está bem
patenteado nos gráficos a) e b) da Figura 14.
Todos estes resultados indicam que o principal eixo de variação genético
europeu parece ser principalmente influenciado pela distribuição dos países em função
da sua latitude.
y = -0,1396x + 6,7964R² = 0,7468
p = 3,7585E-10
-2,2
-0,2
1,8
37 47 57
PC1 vs latitudey = 0,0295x - 1,4358
R² = 0,0333p= 0,3256
-2,2
-0,2
1,8
37 57
PC2 vs latitudey = -0,0204x + 0,9933
R² = 0,016p = 0,4984
-1,4
-0,4
0,6
1,6
35 45 55
PC3 vs latitude
y = -0,0155x + 0,2233R² = 0,0246p = 0,3990
-2,2
-0,2
1,8
-11
PC1 vs longitudey = -0,0776x + 1,1178
R² = 0,6178p = 1,61E-07
-2,2
-0,2
1,8
-11
PC2 vs longitude
y = 0,006x - 0,0868R² = 0,0037p = 0,74433
-4
-2
0
2
-11 9 29
PC3 vs longitude
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
49
Tabela 5. Relação entre a latitude/longitude e as variáveis [,1] e [,2] para os gráficos de MDS das distâncias genéticas
entre as populações europeias estudadas
Latitude Longitude
Equação R2 p Equação R2 p
FST
[,1] Y = 0,0002x -0,0121 0,6893 7,6E-9 y = -2E-05x + 0,0002 0,0069 0,6578
[,2] Y = 3E-05x - 0,0014 0,0171 0,4829 y = 0,0001x - 0,0016 0,6226 1,3E-7
(δμ)2
[,1] y = -0,0037x + 0,1778 0,439 4,9E-5 y = -0,0011x + 0,0154 0,101 0,0814
[,2] y = 0,0017x - 0,0805 0,1625 0,0245 y = -0,0013x + 0,0183 0,2569 0,0036
Na Tabela 6 apresentam-se as médias das distâncias FST entre populações
pertencentes às diferentes zonas geográficas definidas (abaixo da diagonal) e a gama
de variação das distâncias (acima da diagonal).
Tabela 6. Distâncias de FST médias e desvio padrão entre as zonas europeias definidas no gráfico da Figura 14.
Norte Oeste Centro Este Sul Sudeste
Norte … 0,0006-0,0051 0,0015-0,0056 0,0021-0,0052 0,0030-0,0073 0,0034-0,0079
Oeste 0,0029 … 0,0005-0,0037 0,0013-0,0050 0,0011-0,0036 0,0025-0,0055
Centro 0,0035 0,0021 … 0,0009-0,0025 0,0014-0,0049 0,0014-0,0049
Este 0,0037 0,0032 0,0017 … 0,0031-0,0042 0,0018-0,0039
Sul 0,0051 0,0023 0,0031 0,0037 … 0,0021-0,0052
sudeste 0,0057 0,004 0,0029 0,0029 0,0036 …
Norte Oeste Centro Este Sul Sudeste
0,0024
(0,0006-0,0043)
0,0008
(0-0,0019)
0,0016
(0,0004-0,0027) 0
0,0018
(0,0005-0,0030)
0,0019
(0,0007-0,0031)
Globalmente, as distâncias médias são muito baixas, sempre inferiores a 1% e
variando entre 0,17 e 0,57%, o que se enquadra dentro dos valores descritos na
literatura [32]. Ainda assim, as diferenciações mais acentuadas encontram-se entre
populações do Norte e as do Sul ou sudeste, enquanto que as diferenciações menores
se registam entre populações do centro e as do este ou oeste. Dentro de cada grupo
geográfico as distâncias médias são muito baixas, mesmo no grupo do Norte onde se
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
50
observa a média intra-grupo mais elevada, muito devida à marcada diferenciação da
Finlândia.
Compreende-se que a geografia seja um fator importante de subestruturação
populacional na Europa, pois representa uma barreira ao fluxo genético entre
populações que se estabeleceu com as diversas vagas de migração que se observaram
ao longo dos tempos. Entre as grandes movimentações populacionais que mais
afetaram a distribuição genética europeia, pode-se enumerar, a que resultou na
substituição dos neandertais pelos humanos modernos, que vindos do Médio Oriente
entraram na Europa ainda durante o período paleolítico há cerca de 40 000 anos, a
repopulação da Europa após a última época glaciar a partir dos refúgios localizados a
sul já durante o período mesolítico (18 000 anos), uma migração com origem no Levante
que após o inicio do neolítico (10 000 anos), resultou na introdução e dispersão da
agricultura por todo o continente [27, 87, 88], e já na idade do Bronze.
Para explorar melhor o gradiente de diversidade entre o sul e o norte da Europa,
foi estudada a relação entre distância em graus de latitude relativamente ao “sul
europeu” e heterozigotia média ou distância genética de FST para os 15 marcadores. A
análise foi efetuada considerando a diferença de latitude entre dois pontos (populações),
a diferença de heterozigotias ou distância genética entre os mesmos dois pontos, e
usando como ponto de referência o país com o valor de latitude mais baixa, que neste
caso era a Grécia, relativamente à qual se calculou a diferença de latitude. Da análise
da regressão linear efetuada resultaram os gráficos da Figura 16.
Entre a distância ao “sul europeu” e a diferença na heterozigotia média (Figura
16 a)) observou-se uma correlação negativa significativa (R2=0,3884; p=0,0002), o que
significa que há um decréscimo na heterozigotia média à medida que as populações se
distanciam do sul em direção ao norte. Entre a distância genética e distância ao “sul
europeu” (Figura 16 b)) também se detetou correlação significativa e até mais forte
(R2=0,4196; p=0,00008), mas com declive positivo, o que significa que a distância
genética aumenta segundo o eixo de orientação vertical.
Estes resultados, mostram um gradiente de sul para norte que é consistente com
o descrito na literatura [32], e que tem sido associado aos acontecimentos migratórios
após a última época glaciar [87].
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
51
Figura 16. Relação entre a variação na heterozigotia/ distância genética para os 15 marcadores e a distância em graus
de latitude ao “sul europeu” este da Europa sudeste da Europa centro da Europa norte da Europa
oeste da Europa sul da Europa
Com o intuito de avaliar o gradiente de diversidade em função de um eixo
sudeste-noroeste, efetuou-se análise semelhante à anterior, mas considerando como
novo eixo de referência a linha que atravessa a Turquia (sudeste) e a Islândia
(noroeste). Foram calculadas novas coordenadas em função desse eixo, a partir do qual
se obtiveram os valores de latitude diretamente, e os de longitude através da
perpendicular ao eixo. Considerou-se como referência a Grécia, por ser o país que se
localiza mais a sudeste.
ucraniaRoménia
Polónia
Lituânia
Albânia
Eslovênia
Eslovaquia
HungriaMacedónia
Bósnia e Herzegovina
Grécia
Áustria Republica Checa
Alemanha
Finlândia
Holanda
Bélgica
SuiçaItália
Portugal
Espanha
Dinamarca
Letónia Estónia
SérbiaMontenegro
Croácia
Noruega
França
Reino Unido
Irlanda
y = -0,0004x + 0,0031R² = 0,3884p = 0,0002
-0,015
-0,01
-0,005
0
0,005
0,01
0 5 10 15 20 25
a)
Ucrânia
Roménia
Polónia
Lituânia
Albânia
Eslovênia EslovaquiaHungria
Macedónia
Bósnia e Herzegovina
Grécia
Austria
República Checa
Alemanha
Finlândia
Holanda
BélgicaSuiça
Itália
Portugal
Espanha
Dinamarca
Letónia
Estónia
SérbiaMontenegro
Croácia
Noruega
França
Reino Unido
Irlanda
y = 0,0002x + 0,0014R² = 0,4196p = 0,00008
0
0,001
0,002
0,003
0,004
0,005
0,006
0,007
0,008
0,009
0,01
0 5 10 15 20 25
b)
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
52
Figura 17. Relação entre a variação na heterozigotia/ distância genética para os 15 marcadores e a distância em graus
de latitude ao Levante este da Europa sudeste da Europa centro da Europa norte da Europa oeste
da Europa sul da Europa
Na Figura 17 a) estão apresentados os resultados da análise de correlação entre
heterozigotia média e distância à Grécia, em que se obteve um valor relativamente baixo
de R2 embora estatisticamente significativo (R2=0,18; p=0,0181), de declive negativo, o
que indica que a heterozigotia tende a diminuir um pouco consoante o aumento da
distância ao “sudeste”. O valor de R2 foi substancialmente superior quando na análise
se usaram distâncias FST (Figura 17 b)), sendo da mesma ordem de grandeza do que
se obteve na correlação com o eixo norte-sul (R2 =0,4165, p=0,00009), e estando
igualmente associado a uma reta de declive positivo.
ucraniaRoménia
Polónia
Lituânia
Albânia
Eslovênia
Eslovaquia
HungriaMacedónia
Bósnia e Herzegovina
Grécia
Áustria
República Checa
Alemanha
Finlândia
Holanda
Bélgica
Suiça
Itália
Portugal
Espanha
Dinamarca
Letónia
Estónia
SérbiaMontenegro
Croácia
Noruega
França
Reino Unido
Irlanda
y = -0,0002x + 0,0023R² = 0,1778p = 0,0181
-0,0115
-0,0095
-0,0075
-0,0055
-0,0035
-0,0015
0,0005
0,0025
0,0045
0,0065
0 5 10 15 20 25 30
a)
Ucrânia
Roménia
Polónia
Lituânia
Albânia
EslovêniaEslovaquia
Hungria
MacedóniaBósnia e Herzegovina
Grécia
Áustria
República Checa
Alemanha
Finlândia
Holanda
BélgicaSuiça
Itália
Portugal
Espanha
Dinamarca
Letónia
Estónia
SérbiaMontenegro
Croácia
Noruega
FrançaReino Unido
Irlanda
y = 0,0002x + 0,0009R² = 0,4165p = 0,00009
0
0,001
0,002
0,003
0,004
0,005
0,006
0,007
0,008
0,009
0,01
0 5 10 15 20 25 30
b)
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
53
A presença na Europa de um gradiente de diversidade com orientação sudeste-
noroeste tem sido consistentemente detetado em diversos estudos baseados em
estratégias de análise variadas e grande densidade e tipo de marcadores genéticos [20,
27, 88-91] a maioria dos autores tem interpretado este gradiente como sendo a
assinatura genética deixada pela migração dos agricultores neolíticos que a partir do
Levante entraram na Europa, onde rapidamente a agricultura se difundiria por todo o
lado [30, 31, 88].
Finalmente, para avaliar o gradiente de diversidade entre o oeste e o este da
Europa, que poderia sinalizar a migração durante a Idade do Bronze a partir das estepes
asiáticas, foi estudada a relação entre distância em graus de longitude relativamente ao
“este” e heterozigotia média ou distância genética de FST para os 15 marcadores. A
análise foi conduzida procedendo ao mesmo método utilizado nas duas analises
anteriores, usando neste caso a diferença entre graus de longitude, e considerando
como ponto de referência o país com o valor de longitude mais alto, que neste caso era
a Ucrânia. Obtiveram-se os resultados expostos da Tabela 7.
Tabela 7. Regressão linear para a variação na distância genética FST ou heterozigotia em função da variação na
longitude
FST Heterozigotia
Longitude
Y = -3E-05x + 0,0025
R2 = 0,0337, p = 0,3318
Y = -4E-04x - 0,0007
R2 = 0,2155, p = 0,0098
Ao contrário do observado para os gradientes anteriores, não há relação entre a
distância genética e a distância ao este europeu. Quando se tem em conta os valores
de heterozigotia, a correlação é significativa (p = 0,0098), mas, no entanto, bem menor
que os valores observados nas análises anteriores.
Apesar destes resultados se basearem num escasso número de populações, em
conjunto parece indicar que os gradientes de diversidade europeia mais marcados são
o de orientação sudeste-noroeste, que é coerente com a expansão neolítica dos
agricultores, e o de orientação sul-norte possivelmente resultante da migração pós-
glaciar na Europa. Com a estratégia rudimentar e marcadores que se utilizaram, é pouco
percetível o gradiente este-oeste que previsivelmente poderia resultar das migrações
ocorridas durante a Idade do Bronze (3000 – 1000 a.C.), apesar de um componente
europeu com ancestralidade nas “estepes” ter sido claramente identificado com base na
análise simultânea de ADN antigo e moderno [35].
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
54
4.2.4. Kit NGM Select
De forma a tirar o máximo partido da caracterização genética da população
ucraniana quanto aos marcadores do kit NGM Select, foi ainda feito um estudo
comparativo com as 15 populações apresentadas na Tabela 8 para as quais havia
dados obtidos com o mesmo kit previamente publicados. Nessa tabela também se
apresentam os valores de FST de cada uma dessas outras populações relativamente à
Ucrânia, e os respetivos valores de p no anexo 5.
Nenhum dos países Europeus diferia significativamente da Ucrânia, bem como
o Iraque e Turquia. A Eslovênia é o país europeu com maior proximidade genética com
a Ucrânia, já que no conjunto dos 16 marcadores, só em dois apresentava valores de
FST positivos muitíssimo baixos. As distâncias da Ucrânia relativamente à Turquia e ao
Iraque eram, em média, superiores às registadas com os outros países Europeus, à
exceção da Holanda que apresentava valores semelhantes. Os outros países não
europeus, apresentaram valores de FST superiores e, na sua maioria significativos (p <
0,003 após a correção de Bonferroni), e os valores mais elevados envolviam a
Gronelândia e a África do Sul (população AmaXhosa). Estes resultados atestam a
capacidade satisfatória que este kit possui para discriminação intercontinental, embora
seja pouco eficaz para discriminar populações da Europa ou de regiões nas fronteiras
dos continentes.
Também se calcularam distâncias FST e (δμ)2 entre pares de populações (anexo
3), que foram depois utilizadas para obter os gráficos MDS que se encontram nas
Figuras 18 e 19.
O panorama geral que se obtém com base nos 16 STRs do kit, coincide
essencialmente com o que já se deduziu com o sub-conjunto de 10 desses STRs.
Centrando, porém, a atenção na amostra de ucranianos, a caraterização com o kit NGM
Select permite diferencia-la bem de populações não europeias. Dentro da Europa, onde
é muito baixo o nível de heterogeneidade populacional, a Ucrânia aparece muito bem
integrada no coletivo de populações. Entre elas, não se deteta agora relação entre
padrão de afinidades genéticas e geográfica (resultados não mostrados), provavelmente
pelo facto desta análise ter sido feita com um número de populações europeias muito
reduzido, perdendo-se assim a densidade populacional necessária para captar a
relação que se conseguiu encontrar com mais populações ainda com menos
marcadores.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
55
Tabela 8. Comparação de FST locus a locus entre a Ucrânia e outros países já descritos na literatura
Ucrânia
vs
Lituânia
[75]
Albânia
[75]
Eslovêni
a [75]
Iraque
[75]
Turquia
[75]
Bósnia e
Herzegovi
na [92]
Alemanh
a [92]
Holanda
[93]
Espanh
a [94]
Dinamarc
a [95]
Gronel
ândia
[95]
Cazaquist
ão [96]
África do
Sul a [97]
China b[98]
Somália
[95]
SE33 0,00056 0,00334 -0,00082 0,00147 0,00014 0,00380 0,00027 0,00076 0,00307 -0,00094 0,03344 0,00961 0,00482 0,00679 0,00829
vWA -0,00943 -0,00466 -0,00017 -0,00738 -0,00313 -0,00611 -0,00245 0,03223 0,00742 -0,00425 0,00745 -0,00139 0,01682 0,01666 0,02376
D16S539 -0,00670 -0,00425 -0,00729 0,00373 0,00182 -0,00581 -0,00430 -0,00053 -0,00650 -0,00640 0,03249 0,01876 0,05003 0,02495 -0,00105
D2S1338 0,00740 -0,00000 -0,00147 0,00922 0,00537 -0,00430 -0,00027 0,00374 -0,00457 0,00199 0,08728 0,02528 0,05350 0,03787 0,04141
D8S1179 -0,00196 0,00299 -0,00346 0,00691 0,00189 -0,00446 -0,00377 -0,00419 0,00150 -0,00620 0,04797 0,00096 0,04255 0,02011 0,06793
D21S11 -0,00371 0,00493 -0,00459 -0,00324 -0,00839 -0,00619 -0,00195 -0,00015 0,00169 -0,00263 0,02208 0,01495 0,02483 0,02012 0,01601
D18S51 -0,00048 0,00401 0,00054 0,00372 -0,00338 -0,00258 0,00742 0,00880 0,00664 0,00448 0,01529 0,00827 0,01309 0,00061 0,02916
D19S433 -0,00821 -0,00202 0,00028 -0,00086 -0,00743 0,00471 -0,00326 -0,00041 -0,00416 -0,00182 0,02145 0,00233 0,00946 0,01379 0,00842
TH01 -0,00470 -0,00098 -0,00388 0,00384 0,00251 -0,00500 -0,00581 0,00151 -0,00327 -0,00297 0,23517 0,01831 0,11228 0,12323 0,07796
FGA -0,00538 -0,00209 -0,00561 0,00521 0,00563 -0,00469 -0,00580 -0,00333 -0,00512 -0,00764 0,03590 0,01847 0,00732 0,01457 0,02191
D3S1358 -0,00603 -0,00665 -0,00801 0,00098 0,00136 -0,00741 -0,00697 -0,00663 -0,00800 -0,00691 0,10140 0,01014 0,02624 0,01893 0,00963
D10S124
8 -0,00917 -0,00407 -0,00552 -0,01019 0,01158 -0,00378 0,00121 0,00871 0,00698 0,00364 0,01236 0,01420 0,02023 0,03666 0,00728
D22S104
5 -0,00797 -0,00585 -0,00709 0,00302 -0,00911 -0,00625 -0,00093 -0,00147 0,00837 -0,00244 0,03017 0,00422 0,01973 0,00415 0,01610
D2S441 -0,00784 0,00300 -0,00170 0,01226 0,00117 -0,00489 0,00311 0,00345 -0,00039 0,00479 0,06507 0,01863 0,03781 0,01921 0,02747
D1S1656 -0,00395 -0,00347 -0,00494 -0,00115 -0,00047 -0,00250 -0,00251 -0,00255 -0,00349 -0,00384 0,02350 0,01617 0,03281 0,04033 0,02721
D12S391 0,00143 -0,00219 -0,00657 -0,00416 -0,00283 -0,00401 -0,00093 -0,00028 -0,00168 -0,00343 0,03664 0,00416 0,00363 0,00446 0,01512
Os valores a azul representam valores de FST estatisticamente significativos para uma significância de 0,003 (p<0,003) após a correção de Bonferroni. Nota: os valores de p para estas comparações encontram-se no anexo 5.
a - indivíduos da população AmaXhosa da África do Sul falantes do bantu; b - população Han da província Fujian da China
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
56
Figura 18. Gráfico de Multidimensional scaling (MDS) para os valores de FST, obtidos a partir da comparação das
populações descritas anteriormente para o kit NGM Select. O gráfico a azul corresponde a um zoom in da área rodeada
a azul. Europa África Gronelândia (continente americano) Ásia Médio Oriente
Figura 19. Gráfico de Multidimensional scaling (MDS) para os valores de (δμ)2, obtidos a partir da comparação das
populações descritas anteriormente para o kit NGM Select. O gráfico a azul corresponde a um zoom in da área rodeada
a azul. Europa África Gronelândia (continente americano) Ásia Médio Oriente
Finalmente, e uma vez que o alvo de estudo era a amostra de ucranianos
residentes em Portugal, foi feita uma comparação mais fina com três regiões (Norte,
IraqueTurquia
Gronelândia
Casaquistão
China
Somália
África do Sul
-0,016
-0,011
-0,006
-0,001
0,004
0,009
0,014
0,019
0,024
0,029
-0,01 0 0,01 0,02 0,03 0,04
Ucrânia
Lituânia
Albânia
Eslovênia Bosnia e Herzegovina
Alemanha
Holanda
Espanha
Dinamarca
IraqueTurquia
Gronelândia
Cazaquistão
China
Somália
África do Sul
-0,1
-0,05
0
0,05
0,1
0,15
0,2
0,25
-0,65-0,150,350,851,35
Ucrânia
Lituânia
Albânia
Eslovênia Bósnia e HerzegovinaAlemanha
Holanda
Espanha
Dinamarca
-0,012
-0,01
-0,008
-0,006
-0,004
-0,002
-0,01 -0,008 -0,006 -0,004 -0,002
Ucrânia
Lituânia
Eslovênia
Bósnia e Herzegovina
Alemanha
Holanda
Espanha
Dinamarca
-0,1
-0,09
-0,08
-0,07
-0,06
-0,05
-0,04
-0,03
-0,43-0,33-0,23-0,13-0,030,07
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
57
Centro e Sul) do país, considerando todos os marcadores do kit NGM Select, menos o
SE33, por não haver dados para todas as regiões. Os valores de FST e respetivos valores
de p para as três regiões encontram-se na Tabela 9.
Tabela 9. Valores de FST e respetivos valores de p para a comparação locus a locus entre a Ucrânia e 3 regiões (norte,
centro e sul) de Portugal
Ucrânia vs Norte Portugal [99] Centro Portugal [100] Sul Portugal [101]
FST p FST P FST p
SE33 … … … … … …
vWA -0,00137 0,48649 -0,00155 0,50450 -0,00156 0,54054
D16S539 -0,00435 0,63063 -0,00706 0,87387 -0,00224 0,58559
D2S1338 -0,00454 0,84685 -0,00573 0,84685 -0,00268 0,75676
D8S1179 0,00188 0,36937 -0,00007 0,43243 0,00515 0,14414
D21S11 -0,00009 0,41441 -0,00269 0,58559 -0,0019 0,63063
D18S51 0,00267 0,25225 0,00357 0,17117 0,00100 0,32432
D19S433 -0,00399 0,70270 -0,00614 0,78378 -0,00381 0,77477
TH01 -0,00665 0,89189 -0,00751 0,89189 -0,00408 0,72973
FGA -0,00798 0,99099 -0,00838 0,97297 -0,00537 0,95495
D3S1358 -0,00474 0,71171 -0,00560 0,69369 -0,00687 0,92793
D10S1248 0,00395 0,28829 0,00359 0,20721 0,00288 0,29730
D22S1045 0,00685 0,09009 0,00067 0,27027 -0,00047 0,42342
D2S441 0,00094 0,32432 0,00640 0,18919 0,00673 0,12613
D1S1656 -0,00304 0,67568 -0,00289 0,72973 -0,00127 0,56757
D12S391 0,00134 0,40541 -0,00654 0,93694 -0,00365 0,82883
Como era de esperar atendendo aos resultados já discutidos, os níveis de
divergência genética eram muito baixos, todos sem significância estatística, e o valor
mais elevado foi apenas de 0,7% com o Norte de Portugal no locus D22S1045.
4.3. Marcadores e distâncias genéticas
Para completar este estudo analisou-se a influência do número de marcadores
utilizados nos 2 tipos de distâncias utilizadas e consequentemente na capacidade de
detetar suestruturação populacional.
Começou-se por considerar apenas as 16 populações com dados publicados
para o kit NGM Select já listadas na Tabela 8, e com elas obteve-se matrizes de
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
58
distâncias FST e (δμ)2 mobilizando dados dos 16 STRs do kit mas também de 2
subconjuntos com 10 e 15 marcadores (já anteriormente identificados).
Estas matrizes foram então confrontadas com uma matriz de distâncias
geográfica entre populações, através da aplicação de testes de Mantel de que
resultaram os valores de R2 e p associados, que se mostram na Tabela 10.
Tabela 10. Valores de R2 e p para os testes de Mantel avaliando a relação entre a distância genética (FST ou (δμ)2) e
geográfica para 10, 15 e 16 marcadores
10 15 16
R2 p R2 p R2 p
(δμ)2 x distância geográfica 0,6065 0,01 0,6556 0,01 0,6864 0,01
FST x distância geográfica 0,8832 0,01 0,8898 0,01 0,8951 0,01
Como era de prever pelos resultados apresentados em secções anteriores, a
correlação entre distâncias genéticas e geográfica é mais forte quando a distância é
medida em FST do que em (δμ)2, mas independentemente da medida a correlação
aumenta com o número de marcadores.
De seguida, aplicaram-se testes de Mantel aos pares de matrizes obtidas com
FST ou (δμ)2 com base em 10, 15 e 16 marcadores, que conduziram aos valores
representados na Tabela 11.
Tabela 11. Valores de R2 e p para os testes de Mantel avaliando a relação entre as distâncias genéticas FST e (δμ)2,
para 10, 15 e 16 marcadores genéticos
10 15 (kit NGM) 16 (kit NGM Select)
R2 p R2 p R2 p
(δμ)2 x FST 0,4323 0,04 0,6106 0,02 0,4110 0,03
Verifica-se que a correlação entre matrizes de distâncias aumenta claramente
com o aumento de 10 para 15 marcadores, como é fácil compreender, mas, porém, com
16 marcadores a correlação entre as distâncias (δμ)2 e FST diminui muito, sendo até
inferior à que se observa com 10 marcadores. Para este resultado contribuiu certamente
o marcador SE33, que estava incluído no conjunto com 16 STR mas não nos conjuntos
com 10 ou 15 STRs. Mais à frente regressaremos a este marcador.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
59
Na Tabela 12 encontra-se um quadro resumo dos valores obtidos para a
correlação entre as duas distâncias genéticas, em função do número de populações
analisadas, para cada marcador.
Tabela 12. Valores de R2 para os testes de Mantel entre as distâncias genéticas FST e (δμ)2, consoante o número de
populações estudadas
10 marcadores 15 marcadores (kit NGM) 16 marcadores (kit NGM Select)
16 populações 0,4323 0,6106 0,4110
27 populações - - 0,6560
35 populações - 0,8958 -
46 populações 0,7194 - -
Observando a tabela é possível concluir que, o número de populações parece
influenciar a relação observada entre as distâncias genéticas comparadas, uma vez que
os valores de R2 para o maior número de populações, para determinado número de
marcadores, parecem ser sempre superiores. Sendo assim, não só o número e tipo de
marcadores influência a relação entre as distâncias genéticas, mas também o número
e tipo de populações estudadas.
Por fim, fixando a distância (FST ou (δμ)2) compararam-se pares de matrizes
obtidas com 10 e 15 STRs, 10 e 16 STRs, e 15 e 16 STRs. Os valores de correlação
estão representados na tabela 13.
Tabela 13. Valores de R2 e p para os testes de Mantel avaliando a relação entre o número de marcadores para os
dados de FST e (δμ)2
10 x 15 10 x 16 15 x 16
R2 p R2 p R2 p
(δμ)2 0,9335 0,01 0,7914 0,01 0,8172 0,01
FST 0,9860 0,01 0,9817 0,01 0,9981 0,01
É possível observar que com (δμ)2 há maior correlação entre 10 e 15 marcadores
do que entre 10 e 16 ou 15 e 16, e que para o último par de marcadores a correlação é
menor que entre 10 e 16. Relativamente a FST, a maior correlação registada foi entre 15
e 16 marcadores e a menor entre 10 e 16, sendo esta muito parecida com a observada
entre 10 e 15.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
60
Em conjunto, estes resultados permitem concluir que a introdução do marcador
SE33 influencia muito as alterações nos valores de distância genética especialmente no
caso de (δμ)2. A introdução de SE33 no cálculo de FST não parece induzir grandes
distorções na avaliação de diferenciação populacional. O comportamento diferente de
SE33 quando se utiliza (δμ)2 e FST aponta para a necessidade de interpretar com cautela
os resultados produzidos pelas duas medidas, pois têm propriedades muito diferentes.
O valor de heterozigotia para o SE33 varia entre 94-95%, sendo muito superior
aos 75-83% observados para os outros marcadores. Este pode ser um dos fatores que
contribui para o decréscimo de relação que se observa com a introdução do marcador
SE33, uma vez que a heterozigotia influencia muito as distâncias obtidas por (δμ)2 [84].
No sentido de entender melhor a contribuição de cada marcador para avaliar
diferenças interpopulacionais, foram comparadas as distâncias FST e (δμ)2 produzidas
individualmente por cada STR entre os pares de 16 populações, e calcularam-se os
valores médios conforme se apresenta na Figura 20.
Figura 20. Distribuição das distâncias genéticas médias entre as 16 populações referidas em 4.2.4. por locus
Olhando para os FST, constata-se que o valor produzido pelo marcador SE33
está enquadrado na gama de distribuição, embora seja um dos mais baixos da gama.
Pelo contrário, destaca-se bem o marcador TH01 que revela a diferenciação extrema
entre populações. Quanto a (δμ)2 observa-se uma maior variabilidade de valores,
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
61
havendo marcadores associados a distâncias pequenas e outros a distâncias muito
superiores, em especial o marcador SE33 que retém um nível de diferenciação
excessivamente elevado quando comparado com os restantes.
Como já foi referido anteriormente, alguns marcadores podem produzir valores
de (δμ)2 enviesadamente elevados, acabando por dominar o valor médio da distância
[58]. O marcador SE33 pode ser um desses marcadores, e será importante ponderar se
deve ou não ser excluído em comparações de populações baseadas em (δμ)2, uma vez
que afeta consideravelmente os resultados [84].
Na Figura 21 mostra-se a distribuição da heterozigotia por locus em 16
populações e os respetivos valores encontram-se no anexo 6.
Figura 21. Valores de heterozigotia para as populações analisadas, por locus
Procurando analisar a influência desses valores nos valores médios de FST por
locus, marcadores cujos níveis de heterozigotia variam pouco de população para
população, como a FGA, o SE33 e o vWA, estão associados a FST relativamente baios,
tendência que, no entanto, não se encontra com valores de (δμ)2. Pelo contrário, o TH01,
que apresenta elevada variação na heterozigotia entre populações, tem um valor médio
de FST muito elevado, mas com um (δμ)2 relativamente baixo. Mas já o D2S1338, o locus
com segundo valor mais elevado de FST e um valor intermédio de (δμ)2, carateriza-se
por baixa variação da heterozigotia entre populações. Em suma, não se encontrou
relação aparente entre valores de (δμ)2 produzidos por um dado locus e variação
D1S1656
D2S441
D2S1338
D3S1358
D8S1179
D10S1248
D12S391
D16S539
D18S51
D19S433
D21S11
D22S1045
FGA
SE33
TH01
vWA
0,67
0,72
0,77
0,82
0,87
0,92
0,97
Ucrânia Lituânia Albânia Eslovênia
Iraque Turquia Bósnia e Herzegovina Alemanha
Holanda Espanha Dinamarca Gronelândia
Casaquistão África do Sul China Somália
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
62
interpopulacional da heterozigotia. Esta variação parece exercer alguma influência
sobre o FST, não obstante as mesmas irregularidades detetadas de marcador para
marcador.
Quanto aos níveis de heterozigotia por locus, a relação parece mais regular (δμ)2,
em que os valores mais baixos ou altos se encontram geralmente em loci com valores
baixos ou altos de heterozigotia, respetivamente, do que com FST,
Também se analisou a influência do número de alelos por locus e variação entre
populações (Figura 22) nas medidas de distância.
Figura 22. Valor de número de alelos médio para as populações analisadas em 4.2.4. (exceto Gronelândia) e respetivo
desvio padrão por locus
Não se vislumbrou relação consistente entre número de alelos e distância de FST.
No entanto, os STRs com maior número de alelos e variação interpopulacional, SE33 e
a FGA, possuíam as distâncias de (δμ)2 mais elevadas.
Para reforçar estas observações, efetuou-se a análise de regressão linear
confrontando os valores de heterozigotia média, os desvios padrões respetivos e o
número de alelos com as duas distâncias genéticas, estando os resultados
apresentados na tabela 14.
D1S1656
D2S441
D2S1338
D3S1358
D8S1179D10S1248
D12S391
D16S539
D18S51
D19S433
D21S11
D22S1045
FGA
SE33
TH01
Vwa
5
10
15
20
25
30
35
40
45
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
63
Tabela 14. Regressão linear e o respetivo valor de R2 para a variação dos parâmetros estudados em função de duas
distâncias genéticas
(δμ)2 FST
Heterozigotia média (por marcador) y = 0,0713x + 0,7946
R² = 0,4574, p = 0,0040
y = -1,5925x + 0,8509
R² = 0,1141, p = 0,2007
Variação na heterozigotia (desvio padrão)
y = -0,7475x + 2,2382
R² = 0,1836, p = 0,0977
y = 49,069x + 1,0591
R² = 0,3952, p = 0,0091
Variação no número de alelos (desvio padrão)
y = 3,0625x + 1,0249
R² = 0,7802, p = 5,77E-06
y = -44,545x + 3,0098
R² = 0,0824, p = 0,2809
Confirmou-se que a distância (δμ)2 se correlacionava significativamente com a
variação no número de alelos (R2=0,7802; p<<<0,05), mas não com a variação na
heterozigotia. Com a distância FST acontece o contrário: correlacionava-se com a
variação na heterozigotia (R²=0,3952, p=0,0091), mas não com variação no número de
alelos.
Compreende-se, assim, alguns valores discrepantes entre (δμ)2 e FST,
destacando-se os produzidos pelo marcador SE33. Este marcador alia uma grande
variação no número de alelos (28-59, desvio padrão 8,7) a baixo valor de variação na
heterozigotia (desvio padrão 0,9), dois fatores que contribuíram para inflacionar muito o
valor de (δμ)2. O mesmo pode justificar o que se passa no marcador FGA, em que a
tendência é idêntica à observada em SE33, embora a discrepância entre valores de
(δμ)2 e FST seja menor.
Em oposição, o marcador TH01, caraterizado por elevada variação na
heterozigotia (desvio padrão 3,9) e reduzida variação no número de alelos (5-8, desvio
padrão 1,06), produz um FST muito elevado e um (δμ)2 baixo. De forma menos
acentuada, o mesmo acontece com o marcador D22S1045.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
64
5. Conclusões
• Elevado nível de discriminação entre ucranianos obtido com o kit NGM Select
• Ausência de desvios ao equilíbrio de Hardy-Weinberg na amostra estudada
• Elevados valores de probabilidade de exclusão e poder de discriminação, que
reforçam o grande poder do kit NGM Select em análises de rotina forense, sendo
mais vantajoso que a sua versão anterior, o kit NGM
• Reduzida capacidade dos marcadores D10S1248 e D16S539, e elevada dos
marcadores D1S1556 e SE33 em análises de identificação e averiguações de
parentesco
• Ausência de subestruturação populacional entre a amostra de indivíduos ucranianos
residentes em Portugal e a população portuguesa
• Satisfatória capacidade do kit NGM Select de separação entre grandes grupos
populacionais, nomeadamente Ásia centro-oriental, África subsariana e Europa.
Reduzida capacidade quando se considera zonas fronteiras entre continentes, ou
zonas intracontinentais
• Capacidade satisfatória para diferenciar os indivíduos ucranianos da maior parte das
populações não europeias
• Padrão global de distribuição da diversidade genética na zona da Eurásia
maioritariamente definida pela geografia
• Reduzida heterogeneidade entre populações europeias
• Depois da geografia, os eixos sudeste-noroeste e sul-norte são os que se
correlacionam mais com a diversidade genética dos países europeus, em
consonância com a história demográfica da Europa muito ditada pelos movimentos
migratórios, nomeadamente no neolítico aquando da introdução da agricultura, e
mais tarde, após a última época glaciar, quando se registou importante repovoação
do continente
• Capacidade limitada dos marcadores de rotina forense para inferir ancestralidades
populacionais dentro do contexto europeu
• Conveniência em complementar os 16-STRs do kit NGM Select com marcadores
adicionais de forma a perceber melhor o padrão de distribuição genético na Europa
• Panorama de relacionamento populacional baseado em STRs produzido por FSTs
enquadrando-se melhor com o que se sabe sobre a história dos grandes grupos
populacionais humanos, comparativamente ao produzido por (δμ)2
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
65
6. Referências bibliográficas
1. B. Charlesworth, D. Charlesworth, Population genetics from 1966 to 2016,
Heredity 118(1) (2017) 2-9.
2. J.H. Gillespie, Population Genetics: A Concise Guide, Johns Hopkins
University Press2004.
3. W. Goodwin, A. Linacre, S. Hadi, An Introduction to Forensic Genetics, John
Wiley & Sons, 2007, pp. 2-5, 76, 137-138.
4. J.M. Mullaney, R.E. Mills, W.S. Pittard, S.E. Devine, Small insertions and
deletions (INDELs) in human genomes, Human Molecular Genetics 19(R2) (2010) R131-
R136.
5. R. Pereira, C. Phillips, C. Alves, A. Amorim, A. Carracedo, L. Gusmao, A new
multiplex for human identification using insertion/deletion polymorphisms,
Electrophoresis 30(21) (2009) 3682-90.
6. J.M. Butler, Forensic DNA Typing: Biology, Technology, and Genetics of STR
Markers, 2ªedição, Elsevier Science, 2005, pp. 129, 229-258, 473-496.
7. M.F.T. Pinheiro, Genética Forense Perspectivas da Identificação Genética,
Edições Universidade Fernando Pessoa, Porto, 2010, pp. 80, 96.
8. EU Council, Council Resolution of 30 November 2009 on the exchange of DNA
analysis results
(2009/C 296/01), Official Journal of the European Union 52 (2009) 1-31.
9. P.M. Schneider, Expansion of the European Standard Set of DNA database
loci-the current situation, Profiles in DNA 12(1) (2009) 6-7.
10. R.L. Green, R.E. Lagace, N.J. Oldroyd, L.K. Hennessy, J.J. Mulero,
Developmental validation of the AmpFlSTR(R) NGM SElect PCR Amplification Kit: A
next-generation STR multiplex with the SE33 locus, Forensic science international.
Genetics 7(1) (2013) 41-51.
11. A.S. V, O.P. Balanovsky, A.V. Melnikov, A.Y. Lash-Zavada, V.N. Khar'kov,
T.V. Tyazhelova, V.L. Akhmetova, O.V. Zhukova, Y.V. Shneider, I.N. Shil'nikova, S.A.
Borinskaya, A.V. Marusin, M.G. Spiridonova, K.V. Simonova, I.Y. Khitrinskaya, M.O.
Radzhabov, A.G. Romanov, O.V. Shtygasheva, S.M. Koshel, E.V. Balanovskaya, A.V.
Rybakova, E.K. Khusnutdinova, V.P. Puzyrev, N.K. Yankovsky, Characteristics of
Populations of the Russian Federation over the Panel of Fifteen Loci Used for DNA
Identification and in Forensic Medical Examination, Acta naturae 3(2) (2011) 56-67.
12. M. Delghandi, B.J. Branting, L. Jorgensen, Evaluation of a Quadruplex Short
Tandem Repeat System (HUMVWA31/A, HUMD11S554, HUMAPOI1, and
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
66
HUMACTBP2 loci) for Forensic Identity Testing, Confident Typing of Complex Alleles,
and Population Databases, Croatian Medical Journal 42(1) (2001) 33–44.
13. N.A. Rosenberg, J.K. Pritchard, J.L. Weber, H.M. Cann, K.K. Kidd, L.A.
Zhivotovsky, M.W. Feldman, Genetic structure of human populations, Science (New
York, N.Y.) 298(5602) (2002) 2381-5.
14. M.D. Shriver, E.J. Parra, S. Dios, C. Bonilla, H. Norton, C. Jovel, C. Pfaff, C.
Jones, A. Massac, N. Cameron, A. Baron, T. Jackson, G. Argyropoulos, L. Jin, C.J.
Hoggart, P.M. McKeigue, R.A. Kittles, Skin pigmentation, biogeographical ancestry and
admixture mapping, Human genetics 112(4) (2003) 387-99.
15. B.S. Coates, D.V. Sumerford, N.J. Miller, K.S. Kim, T.W. Sappington, B.D.
Siegfried, L.C. Lewis, Comparative performance of single nucleotide polymorphism and
microsatellite markers for population genetic analysis, The Journal of heredity 100(5)
(2009) 556-64.
16. R. Nassir, R. Kosoy, C. Tian, P.A. White, L.M. Butler, G. Silva, R. Kittles, M.E.
Alarcon-Riquelme, P.K. Gregersen, J.W. Belmont, F.M. De La Vega, M.F. Seldin, An
ancestry informative marker set for determining continental origin: validation and
extension using human genome diversity panels, BMC genetics 10 (2009) 39.
17. M. Fondevila, C. Phillips, C. Santos, A. Freire Aradas, P.M. Vallone, J.M.
Butler, M.V. Lareu, A. Carracedo, Revision of the SNPforID 34-plex forensic ancestry
test: Assay enhancements, standard reference sample genotypes and extended
population studies, Forensic science international. Genetics 7(1) (2013) 63-74.
18. O. Bulbul, G. Filoglu, T. Zorlu, H. Altuncul, A. Freire-Aradas, J. Söchtig, Y.
Ruiz, M. Klintschar, S. Triki-Fendri, A. Rebai, C. Phillips, M.V. Lareu, Á. Carracedo, P.M.
Schneider, Inference of biogeographical ancestry across central regions of Eurasia,
International Journal of Legal Medicine 130(1) (2016) 73-79.
19. C. Phillips, Forensic genetic analysis of bio-geographical ancestry, Forensic
science international. Genetics 18 (2015) 49-65.
20. P. Drineas, J. Lewis, P. Paschou, Inferring geographic coordinates of origin
for Europeans using small panels of ancestry informative markers, PloS one 5(8) (2010)
e11892.
21. P. Kersbergen, K. van Duijn, A.D. Kloosterman, J.T. den Dunnen, M. Kayser,
P. de Knijff, Developing a set of ancestry-sensitive DNA markers reflecting continental
origins of humans, BMC genetics 10(1) (2009) 69.
22. J. Pardo-Seco, F. Martinon-Torres, A. Salas, Evaluating the accuracy of AIM
panels at quantifying genome ancestry, BMC genomics 15 (2014) 543.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
67
23. J.R. Kidd, F.R. Friedlaender, W.C. Speed, A.J. Pakstis, F.M. De La Vega,
K.K. Kidd, Analyses of a set of 128 ancestry informative single-nucleotide polymorphisms
in a global set of 119 population samples, Investigative genetics 2(1) (2011) 1.
24. C. Phillips, L. Fernandez-Formoso, M. Gelabert-Besada, M. Garcia-
Magarinos, C. Santos, M. Fondevila, A. Carracedo, M.V. Lareu, Development of a novel
forensic STR multiplex for ancestry analysis and extended identity testing,
Electrophoresis 34(8) (2013) 1151-62.
25. O. Lao, T.T. Lu, M. Nothnagel, O. Junge, S. Freitag-Wolf, A. Caliebe, M.
Balascakova, J. Bertranpetit, L.A. Bindoff, D. Comas, G. Holmlund, A. Kouvatsi, M.
Macek, I. Mollet, W. Parson, J. Palo, R. Ploski, A. Sajantila, A. Tagliabracci, U. Gether,
T. Werge, F. Rivadeneira, A. Hofman, A.G. Uitterlinden, C. Gieger, H.E. Wichmann, A.
Ruther, S. Schreiber, C. Becker, P. Nurnberg, M.R. Nelson, M. Krawczak, M. Kayser,
Correlation between genetic and geographic structure in Europe, Current biology : CB
18(16) (2008) 1241-8.
26. M. Otte, The history of European populations as seen by archaelogy, in:
Archaeogenetis: DNA and the population prehistory of Europe (ed. C. Renfrew and K.
Boyle), Cambridge, UK: McDonald Institute for Archaeological Research (2000) 41-44.
27. E.M. Belle, P.A. Landry, G. Barbujani, Origins and evolution of the Europeans'
genome: evidence from multiple microsatellite loci, Proceedings. Biological sciences
273(1594) (2006) 1595-602.
28. L. Guy Straus, Age of the modern Europeans, Nature 342(6249) (1989) 476-
477.
29. A.J. Ammerman, L.L. Cavalli-Sforza, The Neolithic Transition and the
Genetics of Populations in Europe, Princeton University Press1984.
30. R.R. Sokal, N.L. Oden, C. Wilson, Genetic evidence for the spread of
agriculture in Europe by demic diffusion, Nature 351(6322) (1991) 143-145.
31. L.L. Cavalli-Sforza, P. Menozzi, A. Piazza, Demic expansions and human
evolution, Science (New York, N.Y.) 259(5095) (1993) 639-46.
32. M.F. Seldin, R. Shigeta, P. Villoslada, C. Selmi, J. Tuomilehto, G. Silva, J.W.
Belmont, L. Klareskog, P.K. Gregersen, European Population Substructure: Clustering
of Northern and Southern Populations, PLoS Genetics 2(9) (2006) e143.
33. J. Novembre, T. Johnson, K. Bryc, Z. Kutalik, A.R. Boyko, A. Auton, A. Indap,
K.S. King, S. Bergmann, M.R. Nelson, M. Stephens, C.D. Bustamante, Genes mirror
geography within Europe, Nature 456(7218) (2008) 98-101.
34. I. Lazaridis, N. Patterson, A. Mittnik, G. Renaud, S. Mallick, K. Kirsanow, P.H.
Sudmant, J.G. Schraiber, S. Castellano, M. Lipson, B. Berger, C. Economou, R.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
68
Bollongino, Q. Fu, K.I. Bos, S. Nordenfelt, H. Li, C. de Filippo, K. Prufer, S. Sawyer, C.
Posth, W. Haak, F. Hallgren, E. Fornander, N. Rohland, D. Delsate, M. Francken, J.M.
Guinet, J. Wahl, G. Ayodo, H.A. Babiker, G. Bailliet, E. Balanovska, O. Balanovsky, R.
Barrantes, G. Bedoya, H. Ben-Ami, J. Bene, F. Berrada, C.M. Bravi, F. Brisighelli, G.B.
Busby, F. Cali, M. Churnosov, D.E. Cole, D. Corach, L. Damba, G. van Driem, S.
Dryomov, J.M. Dugoujon, S.A. Fedorova, I. Gallego Romero, M. Gubina, M. Hammer,
B.M. Henn, T. Hervig, U. Hodoglugil, A.R. Jha, S. Karachanak-Yankova, R. Khusainova,
E. Khusnutdinova, R. Kittles, T. Kivisild, W. Klitz, V. Kucinskas, A. Kushniarevich, L.
Laredj, S. Litvinov, T. Loukidis, R.W. Mahley, B. Melegh, E. Metspalu, J. Molina, J.
Mountain, K. Nakkalajarvi, D. Nesheva, T. Nyambo, L. Osipova, J. Parik, F. Platonov, O.
Posukh, V. Romano, F. Rothhammer, I. Rudan, R. Ruizbakiev, H. Sahakyan, A.
Sajantila, A. Salas, E.B. Starikovskaya, A. Tarekegn, D. Toncheva, S. Turdikulova, I.
Uktveryte, O. Utevska, R. Vasquez, M. Villena, M. Voevoda, C.A. Winkler, L.
Yepiskoposyan, P. Zalloua, T. Zemunik, A. Cooper, C. Capelli, M.G. Thomas, A. Ruiz-
Linares, S.A. Tishkoff, L. Singh, K. Thangaraj, R. Villems, D. Comas, R. Sukernik, M.
Metspalu, M. Meyer, E.E. Eichler, J. Burger, M. Slatkin, S. Paabo, J. Kelso, D. Reich, J.
Krause, Ancient human genomes suggest three ancestral populations for present-day
Europeans, Nature 513(7518) (2014) 409-13.
35. W. Haak, I. Lazaridis, N. Patterson, N. Rohland, S. Mallick, B. Llamas, G.
Brandt, S. Nordenfelt, E. Harney, K. Stewardson, Q. Fu, A. Mittnik, E. Banffy, C.
Economou, M. Francken, S. Friederich, R.G. Pena, F. Hallgren, V. Khartanovich, A.
Khokhlov, M. Kunst, P. Kuznetsov, H. Meller, O. Mochalov, V. Moiseyev, N. Nicklisch,
S.L. Pichler, R. Risch, M.A. Rojo Guerra, C. Roth, A. Szecsenyi-Nagy, J. Wahl, M. Meyer,
J. Krause, D. Brown, D. Anthony, A. Cooper, K.W. Alt, D. Reich, Massive migration from
the steppe was a source for Indo-European languages in Europe, Nature 522(7555)
(2015) 207-211.
36. M.G. Tomas, T. Kivisild, L. Chikhi, J. Burger, Europe and Western Asia:
genetics and population history, in: I. Ness, P. Bellwood (eds.) The Encyclopedia of
Global Human Migration, Wiley-Blackwell: Malden, MA and Oxford (2013) 146-156.
37. Basic Facts about Ukraine, Consulado da Ucrânia em Nova Iorque, 2007
(consultado em 1 Maio 2017), disponível em:
http://www.ukrconsul.org/BASIC_FACTS.htm.
38. The World Factbook - Ucrânia, Central Intelligence Agency, Washington DC,
2013 (consultado em 1 Maio 2017), disponível em:
https://www.cia.gov/library/publications/the-world-factbook/index.html.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
69
39. L. Roewer, P.J. Croucher, S. Willuweit, T.T. Lu, M. Kayser, R. Lessig, P. de
Knijff, M.A. Jobling, C. Tyler-Smith, M. Krawczak, Signature of recent historical events in
the European Y-chromosomal STR haplotype distribution, Human genetics 116(4)
(2005) 279-91.
40. K. Rebala, A.I. Mikulich, I.S. Tsybovsky, D. Sivakova, Z. Dzupinkova, A.
Szczerkowska-Dobosz, Z. Szczerkowska, Y-STR variation among Slavs: evidence for
the Slavic homeland in the middle Dnieper basin, Journal of human genetics 52(5) (2007)
406-14.
41. O. Utevska, L. Atramentova, E. Balanovska, O. Balanovsky, Y-chromosome
STR variation in Ukrainian populations, 2015.
42. A população estrangeira em Portugal - 2011, Instituto Nacional de Estatística,
Statistics Portugal, disponível em: www.ine.pt (2011).
43. S.V. Serga, I.V. Dombrovskyi, O.M. Maistrenko, L.I. Ostapchenko, S.V.
Demydov, R.G. Krivda, I.A. Kozeretska, Allele frequencies for 15 STR loci in the
Ukrainian population, Forensic Science International: Genetics 29 e40-e41.
44. P.S. Walsh, D.A. Metzger, R. Higushi, Chelex 100 as a medium for simple
extraction of DNA for PCR-based typing from forensic material. BioTechniques 10(4):
506-13 (April 1991), BioTechniques 54(3) (2013) 134-9.
45. L. Excoffier, H.E. Lischer, Arlequin suite ver 3.5: a new series of programs to
perform population genetics analyses under Linux and Windows, Molecular ecology
resources 10(3) (2010) 564-7.
46. B.S. Weir, Genetic Data Analysis II: Methods for Discrete Population Genetic
Data, Sinauer Associates, 1996, pp. 150-156.
47. J.E. Wigginton, D.J. Cutler, G.R. Abecasis, A note on exact tests of Hardy-
Weinberg equilibrium, American journal of human genetics 76(5) (2005) 887-93.
48. L. Excoffier, Lischer, H., Arlequin ver 3.5. An Integrated Software Package
for Population Genetics Data Analysis, Swiss Institute of Bioinformatics, Switzerland,
2015.
49. A.K. Huston, Statistical Analysis of STR Data, Promega Corporation, Profiles
in Dna, 1998, pp. 14-15.
50. D. Botstein, R.L. White, M. Skolnick, R.W. Davis, Construction of a genetic
linkage map in man using restriction fragment length polymorphisms, American journal
of human genetics 32(3) (1980) 314-31.
51. R.C. Elston, Polymorphism Information Content, Encyclopedia of
Biostatistics, John Wiley & Sons, Ltd 2005.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
70
52. R.C. Elston, Probability and paternity testing, American journal of human
genetics 39(1) (1986) 112-22.
53. C. Brenner, J.W. Morris, Paternity index calculations in single locus
hypervariable DNA probes: validation and other studies, Proceedings for The
International Symposium on Human Identification, Data Acquisition and Statistical
Analysis for DNA Typing Laboratories, Promega Corporation, Madison WI, 1989, pp. 21-
53.
54. S. Wright, The genetical structure of populations, Annals of eugenics 15(4)
(1951) 323-54.
55. B.S. Weir, C.C. Cockerham, Estimating F-Statistics for the Analysis of
Population Structure, Evolution 38(6) (1984) 1358-1370.
56. K.E. Holsinger, B.S. Weir, Genetics in geographically structured populations:
defining, estimating and interpreting F(ST), Nature reviews. Genetics 10(9) (2009) 639-
50.
57. S. Wright, Evolution in Mendelian Populations, Genetics 16(2) (1931) 97-159.
58. D.B. Goldstein, A. Ruiz Linares, L.L. Cavalli-Sforza, M.W. Feldman, Genetic
absolute dating based on microsatellites and the origin of modern humans, Proceedings
of the National Academy of Sciences of the United States of America 92(15) (1995)
6723-7.
59. T. Ohta, M. Kimura, A model of mutation appropriate to estimate the number
of electrophoretically detectable alleles in a finite population, Genetical research 22(2)
(1973) 201-4.
60. G. Cooper, W. Amos, R. Bellamy, M.R. Siddiqui, A. Frodsham, A.V.S. Hill,
D.C. Rubinsztein, An Empirical Exploration of the (δμ)(2) Genetic Distance for 213
Human Microsatellite Markers, American journal of human genetics 65(4) (1999) 1125-
1133.
61. N. Takezaki, M. Nei, K. Tamura, POPTREEW: web version of POPTREE for
constructing population trees from allele frequency data and computing some other
quantities, Molecular biology and evolution 31(6) (2014) 1622-4.
62. R.C. Team, R: A language and environment for statistical computing, R
Foundation for Statistical Computing, Vienna, Austria, 2013.
63. C. IBM, IBM Statistics for Windows, Version 24.0, Armonk, NY: IBM Corp,
Released 2016.
64. R. Peakall, P.E. Smouse, GenAlEx 6.5: genetic analysis in Excel. Population
genetic software for teaching and research--an update, Bioinformatics (Oxford, England)
28(19) (2012) 2537-9.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
71
65. P.J.F. Groenen, M.v.d. Velden, Multidimensional Scaling, Econometric
Institute Report EL 15 (2004).
66. F.W. Young, Multidimensional scaling, in: S. Kotz, N.L. Johnson (eds.),
Encyclopedia of statistical sciences, Wiley, New York 5 (1985) 649-659.
67. K. Pearson, LIII. On lines and planes of closest fit to systems of points in
space, Philosophical Magazine Series 6 2(11) (1901) 559-572.
68. J.A.F. Diniz-Filho, T.N. Soares, J.S. Lima, R. Dobrovolski, V.L. Landeiro, M.P.
de Campos Telles, T.F. Rangel, L.M. Bini, Mantel test in population genetics, Genetics
and Molecular Biology 36(4) (2013) 475-485.
69. N. Mantel, The detection of disease clustering and a generalized regression
approach, Cancer research 27(2) (1967) 209-20.
70. B.K. Epperson, Geographical Genetics (MPB-38), Princeton University Press
2003, p.357.
71. J.M. Butler, Reeder, D. J., StrBase: Short Tandem Repeat DNA Internet
DataBase, National Institute of Standards and Technology, Estados Unidos da América,
1997 (consultada em 12 Janeiro 2017), disponível em:
http://www.cstl.nist.gov/div831/strbase/.
72. M.J. Farfan, P. Sanz, M.V. Lareu, A. Carracedo, Population data on the
D1S1656 and D12S391 STR loci in Andalusia (south Spain) and the maghreb (north
Africa), Forensic science international 104(1) (1999) 33-6.
73. M. Kimura, Rare variant alleles in the light of the neutral theory, Molecular
biology and evolution 1(1) (1983) 84-93.
74. P.C. Sham, S.M. Purcell, Statistical power and significance testing in large-
scale genetic studies, Nature reviews. Genetics 15(5) (2014) 335-46.
75. L. Poulsen, C. Tomas, K. Drobnic, V. Ivanova, H.S. Mogensen, A. Kondili, P.
Miniati, D. Bunokiene, J. Jankauskiene, V. Pereira, N. Morling, NGMSElect and
Investigator((R)) Argus X-12 analysis in population samples from Albania, Iraq,
Lithuania, Slovenia, and Turkey, Forensic science international. Genetics 22 (2016) 110-
2.
76. AmpFlSTR® NGM SElect™ PCR Amplification Kit User Guide, Applied
biosystems, Life Technologies Corporation, Estados Unidos da América, 2012,
disponível em:
https://www3.appliedbiosystems.com/cms/groups/applied_markets_marketing/docume
nts/generaldocuments/cms_089008.pdf.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
72
77. N.A. Rosenberg, L.M. Li, R. Ward, J.K. Pritchard, Informativeness of genetic
markers for inference of ancestry, American journal of human genetics 73(6) (2003)
1402-22.
78. L. Excoffier, G. Hamilton, Comment on "Genetic structure of human
populations", Science (New York, N.Y.) 300(5627) (2003) 1877; author reply 1877.
79. N.M. Silva, L. Pereira, E.S. Poloni, M. Currat, Human neutral genetic variation
and forensic STR data, PloS one 7(11) (2012) e49666.
80. E.R. Londin, M.A. Keller, C. Maista, G. Smith, L.A. Mamounas, R. Zhang, S.J.
Madore, K. Gwinn, R.A. Corriveau, CoAIMs: a cost-effective panel of ancestry
informative markers for determining continental origins, PloS one 5(10) (2010) e13443.
81. C. Phillips, L. Fernandez-Formoso, M. Garcia-Magarinos, L. Porras, T.
Tvedebrink, J. Amigo, M. Fondevila, A. Gomez-Tato, J. Alvarez-Dios, A. Freire-Aradas,
A. Gomez-Carballa, A. Mosquera-Miguel, A. Carracedo, M.V. Lareu, Analysis of global
variability in 15 established and 5 new European Standard Set (ESS) STRs using the
CEPH human genome diversity panel, Forensic science international. Genetics 5(3)
(2011) 155-69.
82. C.D. Steele, D.S. Court, D.J. Balding, Worldwide F(ST) estimates relative to
five continental-scale populations, Annals of human genetics 78(6) (2014) 468-77.
83. S. Ramachandran, O. Deshpande, C.C. Roseman, N.A. Rosenberg, M.W.
Feldman, L.L. Cavalli-Sforza, Support from the relationship of genetic and geographic
distance in human populations for a serial founder effect originating in Africa,
Proceedings of the National Academy of Sciences of the United States of America
102(44) (2005) 15942-7.
84. G. Cooper, W. Amos, R. Bellamy, M.R. Siddiqui, A. Frodsham, A.V. Hill, D.C.
Rubinsztein, An empirical exploration of the (delta mu)2 genetic distance for 213 human
microsatellite markers, American journal of human genetics 65(4) (1999) 1125-33.
85. S.C. Heath, I.G. Gut, P. Brennan, J.D. McKay, V. Bencko, E. Fabianova, L.
Foretova, M. Georges, V. Janout, M. Kabesch, H.E. Krokan, M.B. Elvestad, J.
Lissowska, D. Mates, P. Rudnai, F. Skorpen, S. Schreiber, J.M. Soria, A.-C. Syvanen,
P. Meneton, S. Hercberg, P. Galan, N. Szeszenia-Dabrowska, D. Zaridze, E. Genin, L.R.
Cardon, M. Lathrop, Investigation of the fine structure of European populations with
applications to disease association studies, Eur J Hum Genet 16(12) (0000) 1413-1429.
86. L.M. Huckins, V. Boraska, C.S. Franklin, J.A. Floyd, L. Southam, P.F.
Sullivan, C.M. Bulik, D.A. Collier, C. Tyler-Smith, E. Zeggini, I. Tachmazidou, Using
ancestry-informative markers to identify fine structure across 15 populations of European
origin, Eur J Hum Genet 22(10) (2014) 1190-200.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
73
87. A. Torroni, H.J. Bandelt, V. Macaulay, M. Richards, F. Cruciani, C. Rengo, V.
Martinez-Cabrera, R. Villems, T. Kivisild, E. Metspalu, J. Parik, H.V. Tolk, K. Tambets,
P. Forster, B. Karger, P. Francalacci, P. Rudan, B. Janicijevic, O. Rickards, M.L.
Savontaus, K. Huoponen, V. Laitinen, S. Koivumaki, B. Sykes, E. Hickey, A. Novelletto,
P. Moral, D. Sellitto, A. Coppa, N. Al-Zaheri, A.S. Santachiara-Benerecetti, O. Semino,
R. Scozzari, A signal, from human mtDNA, of postglacial recolonization in Europe,
American journal of human genetics 69(4) (2001) 844-52.
88. L. Chikhi, R.A. Nichols, G. Barbujani, M.A. Beaumont, Y genetic data support
the Neolithic demic diffusion model, Proceedings of the National Academy of Sciences
of the United States of America 99(17) (2002) 11008-13.
89. L. Chikhi, G. Destro-Bisol, V. Pascali, V. Baravelli, M. Dobosz, G. Barbujani,
Clinal variation in the nuclear DNA of Europeans, Human biology 70(4) (1998) 643-57.
90. L. Chikhi, G. Destro-Bisol, G. Bertorelle, V. Pascali, G. Barbujani, Clines of
nuclear DNA markers suggest a largely neolithic ancestry of the European gene pool,
Proceedings of the National Academy of Sciences of the United States of America 95(15)
(1998) 9053-8.
91. Z.H. Rosser, T. Zerjal, M.E. Hurles, M. Adojaan, D. Alavantic, A. Amorim, W.
Amos, M. Armenteros, E. Arroyo, G. Barbujani, G. Beckman, L. Beckman, J. Bertranpetit,
E. Bosch, D.G. Bradley, G. Brede, G. Cooper, H.B. Corte-Real, P. de Knijff, R. Decorte,
Y.E. Dubrova, O. Evgrafov, A. Gilissen, S. Glisic, M. Golge, E.W. Hill, A. Jeziorowska, L.
Kalaydjieva, M. Kayser, T. Kivisild, S.A. Kravchenko, A. Krumina, V. Kucinskas, J.
Lavinha, L.A. Livshits, P. Malaspina, S. Maria, K. McElreavey, T.A. Meitinger, A.V.
Mikelsaar, R.J. Mitchell, K. Nafa, J. Nicholson, S. Norby, A. Pandya, J. Parik, P.C.
Patsalis, L. Pereira, B. Peterlin, G. Pielberg, M.J. Prata, C. Previdere, L. Roewer, S.
Rootsi, D.C. Rubinsztein, J. Saillard, F.R. Santos, G. Stefanescu, B.C. Sykes, A. Tolun,
R. Villems, C. Tyler-Smith, M.A. Jobling, Y-chromosomal diversity in Europe is clinal and
influenced primarily by geography, rather than by language, American journal of human
genetics 67(6) (2000) 1526-43.
92. L.A. Welch, P. Gill, C. Phillips, R. Ansell, N. Morling, W. Parson, J.U. Palo, I.
Bastisch, European Network of Forensic Science Institutes (ENFSI): Evaluation of new
commercial STR multiplexes that include the European Standard Set (ESS) of markers,
Forensic science international. Genetics 6(6) (2012) 819-26.
93. A.A. Westen, T. Kraaijenbrink, E.A. Robles de Medina, J. Harteveld, P.
Willemse, S.B. Zuniga, K.J. van der Gaag, N.E. Weiler, J. Warnaar, M. Kayser, T. Sijen,
P. de Knijff, Comparing six commercial autosomal STR kits in a large Dutch population
sample, Forensic science international. Genetics 10 (2014) 55-63.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
74
94. O. Garcia, J. Alonso, J.A. Cano, R. Garcia, G.M. Luque, P. Martin, I.M. de
Yuso, S. Maulini, D. Parra, I. Yurrebaso, Population genetic data and concordance study
for the kits Identifiler, NGM, PowerPlex ESX 17 System and Investigator ESSplex in
Spain, Forensic science international. Genetics 6(2) (2012) e78-9.
95. C. Tomas, H.S. Mogensen, S.L. Friis, C. Hallenberg, M.C. Stene, N. Morling,
Concordance study and population frequencies for 16 autosomal STRs analyzed with
PowerPlex(R) ESI 17 and AmpFlSTR(R) NGM SElect in Somalis, Danes and
Greenlanders, Forensic science international. Genetics 11 (2014) e18-21.
96. H. Zhang, S. Yang, W. Guo, B. Ren, L. Pu, T. Ma, M. Xia, L. Jin, L. Li, S. Li,
Population genetic analysis of the GlobalFiler STR loci in 748 individuals from the
Kazakh population of Xinjiang in northwest China, International journal of legal medicine
130(5) (2016) 1187-9.
97. P.G. Ristow, K.W. Cloete, M.E. D'Amato, GlobalFiler((R)) Express DNA
amplification kit in South Africa: Extracting the past from the present, Forensic science
international. Genetics 24 (2016) 194-201.
98. B. Li, J. Ge, F. Wu, L. Ye, B. Budowle, Y. Chen, Population genetic analyses
of the STR loci of the AmpFlSTR NGM SElect kit for Han population in Fujian Province,
China, International journal of legal medicine 127(2) (2013) 345-6.
99. M.F. Pinheiro, L. Caine, L. Pontes, D. Abrantes, G. Lima, M.J. Pereira, P.
Rezende, Allele frequencies of sixteen STRs in the population of Northern Portugal,
Forensic science international 148(2-3) (2005) 221-3.
100. A.M. Bento, A. Semo, V. Lopes, V. Bogas, P. Brito, A. Serra, L. Andrade, L.
Souto, F. Corte-Real, M.J. Anjos, Population data for Central Portugal population with
NGM amplification kit, Forensic Science International: Genetics Supplement Series 4(1)
(2013) e152-e153.
101. T. Ribeiro, P. Dario, N. Vital, S. Sanches, R. Espinheira, H. Geada, J. Costa-
Santos, Population data of the AmpFlSTR(R) NGM loci in South Portuguese population,
Forensic science international. Genetics 7(2) (2013) e37-9.
102. F. Stanciu, S. Vladu, V. Cutar, D. Cocioaba, F. Iancu, A. Cotolea, I.M. Stoian,
Genetic parameters and allele frequencies of five new European Standard Set STR loci
(D10S1248, D22S1045, D2S441, D1S1656, D12S391) in the population of Romania,
Croatian medical journal 54(3) (2013) 232-7.
103. L.E. Barbarii, B. Rolf, C. Constantinescu, C. Hohoff, P. Calistru, D.
Dermengiu, Allele frequencies of 13 short tandem repeat (STR) loci in the Romanian
population, Forensic science international 141(2-3) (2004) 171-4.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
75
104. I. Soltyszewski, W. Pepinski, P. Wolanska-Nowak, A. Maciejewska, R.
Paszkowska, M. Abreu-Glowacka, W. Achrem, A. Jonkisz, A. Lebioda, M. Konarzewska,
R. Ploski, Polish population data on 15 autosomal STRs of AmpFlSTR NGM PCR kit,
Forensic science international. Genetics 9 (2014) 142-9.
105. R. Pawlowski, A. Maciejewska, R. Paszkowska, A. Welz, Frequencies for
five short tandem repeat (STR) systems in a population from north Poland, International
journal of legal medicine 110(1) (1997) 10-3.
106. M. Sotak, E. Petrejcikova, A. Bozikova, J. Bernasovska, I. Bernasovsky, A.
Sovicova, I. Boronova, P. Svickova, D. Gabrikova, S. Macekova, J. Carnogurska, K.
Rebala, D. Vlcek, Population database of 17 autosomal STR loci from the four
predominant Eastern Slovakia regions, Forensic science international. Genetics 5(3)
(2011) 262-3.
107. A. Molnar, A. Zalan, G. Horvath, H. Pamjav, Allele distribution of the new
European Standard Set (ESS) loci in the Hungarian population, Forensic science
international. Genetics 5(5) (2011) 555-6.
108. S.A. Rak, A. Zalan, G. Szabados, H. Pamjav, Population genetic data on 15
STR loci in the Hungarian population, Forensic science international. Genetics 5(5)
(2011) 543-4.
109. Z. Jakovski, K. Nikolova, I. Furac, M. Masic, B. Janeska, M. Kubat, Allele
frequencies for 15 STR loci in a population from the Republic of Macedonia, International
journal of legal medicine 120(1) (2006) 53-5.
110. Z. Jakovski, K. Nikolova, R. Jankova-Ajanovska, B. Janeska, N. Pojskic, D.
Marjanovic, Allele frequencies of the new European Standard Set (ESS) loci plus SE33
locus in a population from the Republic of Macedonia, Forensic science international.
Genetics 6(3) (2012) e90-2.
111. L. Kovatsi, T.J. Parsons, R.S. Just, J.A. Irwin, Genetic variation for 15
autosomal STR loci (PowerPlex 16) in a population sample from northern Greece,
Forensic science international 159(1) (2006) 61-3.
112. Q. GmbH, Base de dados ALLST*R: Database for autosomal short tandem
repeats, Germany, 2011 (consultada em 2016), Disponivel em:
http://allstr.de/allstr/home.seam?cid=211171.
113. P. Hatzer-Grubwieser, B. Berger, D. Niederwieser, M. Steinlechner, Allele
frequencies and concordance study of 16 STR loci--including the new European
Standard Set (ESS) loci--in an Austrian population sample, Forensic science
international. Genetics 6(1) (2012) e50-1.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
76
114. M. Klintschar, F. Neuhuber, A study on the short tandem repeat system
ACTBP2 (SE33) in an Austrian population sample, International journal of legal medicine
111(1) (1998) 46-8.
115. D. Vanek, R. Hradil, B. Budowle, Czech population data on 10 short tandem
repeat loci of SGM Plus STR system kit using DNA purified in FTA cards, Forensic
science international 119(1) (2001) 107-8.
116. I. Rostedt, K. Lalu, M. Lukka, A. Sajantila, Genotyping of five short tandem
repeat loci via triplex and duplex PCR, Forensic science international 82(3) (1996) 217-
26.
117. S. Dognaux, M.H. Larmuseau, L. Jansen, T. Heylen, N. Vanderheyden, B.
Bekaert, F. Noel, R. Decorte, Allele frequencies for the new European Standard Set
(ESS) loci and D1S1677 in the Belgian population, Forensic science international.
Genetics 6(2) (2012) e75-7.
118. R. Decorte, M. Engelen, L. Larno, K. Nelissen, A. Gilissen, J.J. Cassiman,
Belgian population data for 15 STR loci (AmpFlSTR SGM Plus and AmpFlSTR profiler
PCR amplification kit), Forensic science international 139(2-3) (2004) 211-3.
119. G. Mertens, N. Mommers, H. Heylen, M. Gielis, L. Muylle, A. Vandenberghe,
Allele frequencies of nine STR systems in the Flemish population and application in
parentage testing, International journal of legal medicine 110(4) (1997) 177-80.
120. A. Berti, F. Brisighelli, A. Bosetti, E. Pilli, C. Trapani, V. Tullio, C. Franchi, G.
Lago, C. Capelli, Allele frequencies of the new European Standard Set (ESS) loci in the
Italian population, Forensic science international. Genetics 5(5) (2011) 548-9.
121. C. Previdere, P. Grignani, F. Alessandrini, M. Alu, R. Biondo, I. Boschi, L.
Caenazzo, I. Carboni, E. Carnevali, F. De Stefano, R. Domenici, M. Fabbri, E. Giardina,
S. Inturri, S. Pelotti, A. Piccinini, M. Piglionica, N. Resta, S. Turrina, A. Verzeletti, S.
Presciuttini, The 2011 GeFI collaborative exercise. Concordance study, proficiency
testing and Italian population data on the new ENFSI/EDNAP loci D1S1656, D2S441,
D10S1248, D12S391, D22S1045, Forensic science international. Genetics 7(1) (2013)
e15-8.
122. I. Carboni, A.L. Nutini, B. Porfirio, M. Genuardi, U. Ricci, Genetic STRs
variation in a large population from Tuscany (Italy), Forensic science international.
Genetics 1(3-4) (2007) e10-1.
123. M.L. Pontes, M.F. Pinheiro, Population data of the AmpFISTR(R) NGM STR
loci in a North of Portugal sample, Forensic science international. Genetics 6(5) (2012)
e127-8.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
77
124. V. Jemeljanova, O. Gobrusjonoka, O. Bergere, K. Latisheva, E. Podovsovnik
Axelsson, I. Zupanic Pajnic, Population data for 15 autosomal STR loci from Latvia,
International journal of legal medicine 129(4) (2015) 739-40.
125. M. Sadam, G. Tasa, A. Tiidla, A. Lang, E.P. Axelsson, I.Z. Pajnic, Population
data for 22 autosomal STR loci from Estonia, International journal of legal medicine
129(6) (2015) 1219-20.
126. D. Zgonjanin, G. Stojiljkovic, M. Antov, S. Petkovic, D. Draskovic, Population
data of the AmpFlSTR((R)) NGM loci in the population of Vojvodina Province, Serbia,
Forensic science international. Genetics 23 (2016) e12-3.
127. N. Haliti, M. Carapina, M. Masic, D. Strinovic, I.M. Klaric, M. Kubat,
Evaluation of population variation at 17 autosomal STR and 16 Y-STR haplotype loci in
Croatians, Forensic science international. Genetics 3(4) (2009) e137-8.
128. G. Curic, V. Gasic, V. Pluzaric, D. Smiljcic, Genetic parameters of five new
European Standard Set STR loci (D10S1248, D22S1045, D2S441, D1S1656, D12S391)
in the population of eastern Croatia, Croatian medical journal 53(5) (2012) 409-15.
129. I.W. Evett, P.D. Gill, J.A. Lambert, N. Oldroyd, R. Frazier, S. Watson, S.
Panchal, A. Connolly, C. Kimpton, Statistical analysis of data for three British ethnic
groups from a new STR multiplex, International journal of legal medicine 110(1) (1997)
5-9.
130. V.C. Tucker, C. Baumgartner, G.R. Stead, A.J. Hopwood, UK population
data generated with the PowerPlex(R) ESI 16 system, Forensic science international.
Genetics 6(4) (2012) e112-8.
131. C.P. Phillips, C.D. Syndercombe, N. Tamaki, UK Caucasian databases for
the short tandem repeat loci D21S11, HUMFIBRA (FGA) and D8S1179, Progress in
Forensic Genetics 7 (1998) 398-400.
132. F. Stanciu, O.R. Popescu, I.M. Stoian, Allele frequencies of 15 STR loci in
Moldavia region (NE Romania), Forensic science international. Genetics 4(1) (2009)
e39-40.
133. L.A. Zhivotovsky, V.M. Veremeichyk, N.N. Kuzub, L.A. Atramentova, I.G.
Udina, N.A. Kartel, I.S. Tsybovsky, A reference data base on STR allele frequencies in
the Belarus population developed from paternity cases, Forensic science international.
Genetics 3(3) (2009) e107-9.
134. W. Pepinski, A. Niemcunowicz-Janica, M. Skawronska, E. Koc-Zorawska,
J. Janica, I. Soltyszewski, Allele distribution of 15 STR loci in a population sample of
Byelorussian minority residing in the northeastern Poland, Forensic science international
139(2-3) (2004) 265-7.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
78
135. K. Montelius, A.O. Karlsson, G. Holmlund, STR data for the AmpFlSTR
Identifiler loci from Swedish population in comparison to European, as well as with non-
European population, Forensic science international. Genetics 2(3) (2008) e49-52.
136. R. Andreassen, L. Pereira, B.M. Dupuy, B. Mevaag, Icelandic population
data for the STR loci in the AMPFlSTR SGM Plus system and the PowerPlex Y-system,
Forensic science international. Genetics 4(4) (2010) e101-3.
137. E. Nasibov, O. Bulbul, G. Jabrayili, T. Zorlu, M.S. Shahzad, S. Cengiz, G.
Filoglu, H. Altuncul, G. Sadixov, Allele frequencies of 15 STR loci in Azerbaijan
population, Forensic science international. Genetics 7(3) (2013) e99-100.
138. L.A. Zhivotovsky, B.A. Malyarchuk, M.V. Derenko, M. Wozniak, T.
Grzybowski, Developing STR databases on structured populations: the native South
Siberian population versus the Russian population, Forensic science international.
Genetics 3(4) (2009) e111-6.
139. Z. Zhao, J. Zhang, H. Wang, Z.P. Liu, M. Liu, Y. Zhang, L. Sun, H. Zhang,
Mutation rate estimation for 15 autosomal STR loci in a large population from Mainland
China, Meta gene 5 (2015) 150-6.
140. K. Bentayebi, F. Abada, H. Ihzmad, S. Amzazi, Genetic ancestry of a
Moroccan population as inferred from autosomal STRs, Meta gene 2 (2014) 427-38.
141. M.M. Melo, M. Carvalho, V. Lopes, M.J. Anjos, A. Serra, D.N. Vieira, J.
Sequeiros, F. Corte-Real, Genetic study of 15 STRs loci of Identifiler system in Angola
population, Forensic science international. Genetics 4(5) (2010) e153-7.
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
79
Anexos
Anexo 1
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
80
Anexo 2
Tabela 15. Referências bibliográficas, número de indivíduos, loci estudados e regiões geográficas dos dados utilizados
para os diversos países presentes neste estudo
População Região
Número de
indivíduos
v
W
a
D
1
6
S
5
3
9
D
2
S
1
3
3
8
D
8
S
1
1
7
9
D
2
1
S
1
1
D
1
8
S
5
1
D
1
9
S
4
3
3
T
H
0
1
F
G
A
D
3
S
1
3
5
8
D
1
0
S
1
2
4
8
D
2
2
S
1
0
4
5
D
2
S
4
4
1
D
1
S
1
6
5
6
D
1
2
S
3
9
1
S
E
3
3 Ref.
Ucrânia Europa 72 x x x x x x x x x x x x x x x x -
Roménia Europa
1331 x x x x x x x x x x x x x x x [102]
139 x [103]
Polónia Europa
2041 x x x x x x x x x x x x x x x [104]
126 x [105]
Lituânia Europa 110 x x x x x x x x x x x x x x x x [75]
Albânia Europa 170 x x x x x x x x x x x x x x x x [75]
Eslovênia Europa 157 x x x x x x x x x x x x x x x x [75]
Iraque “Médio
Oriente” 96 x x x x x x x x x x x x x x x x [75]
Turquia “Médio
Oriente” 93 x x x x x x x x x x x x x x x x [75]
Eslováquia Europa
247/ 245 (SE33) x x x x x x x x x x x x x x x [92]
558 x [106]
Hungria Europa
531 (D2S1338,
D19S433)/ 254 x x x x x x x [107]
8426/ 1334
(D16S539)/ 1326
(TH01)
x x x x x x x x [108]
223 x [92]
Macedónia Europa
163 x x x x x x x x x x [109]
205 x x x x x x [110]
Bósnia e Herzegovina Europa 171 x x x x x x x x x x x x x x x x [92]
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
81
Grécia Europa
318 x [111]
208 x x x x x x x x x x x x x [92]
585 (TH01)/ 1543
(D3S1358) x x [112]
Áustria Europa
609/ 709/ 609/ 509/
928/ 709/ 1816/
724
x x x x x x x x [112]
219 x x x x x x [113]
932 x x [114]
Republica Checa Europa
202 x x x x x x x x x x [115]
200 x x x x x x [92]
Alemanha Europa 662 x x x x x x x x x x x x x x x x [92]
Finlândia Europa
210 x x x x x x x x [92]
1274 x [116]
180 x x x x x x x [112]
Holanda Europa 2085 x x x x x x x x x x x x x x x x [93]
Bélgica Europa
400 x x x x x x [117]
206 x [92]
222 x x x x x x x x [118]
245 x [119]
Suíça Europa
202 x x x x x [92]
511 (TH01)/ 392
(SE33)/ 206 x x x x x x x x x x x [112]
Itália Europa
209 x x [120]
960 x x x x x [121]
821/ 484/ 155/ 785/
786/ 785/ 785/ 544/
833/ 824
x x x x x x x x x [122]
Portugal (e Portugal
norte) Europa
213 x x x x x x x x x x x x x x x [123]
200 x [99]
Portugal (centro) Europa 150 x x x x x x x x x x x x x x x [100]
Portugal (sul) Europa 452 x x x x x x x x x x x x x x x [101]
Espanha Europa 284 x x x x x x x x x x x x x x x X [94]
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
82
Dinamarca Europa 199 x x x x x x x x x x x x x x x X [95]
Gronelândia América 194 x x x x x x x x x x x x x x x X [95]
Cazaquistão Ásia 748 x x x x x x x x x x x x x x x X [96]
Letónia Europa 500 x x x x x x x x x x x x x x x [124]
Estónia Europa 303 x x x x x x x x x x x x x x x [125]
Sérvia Europa
3304/ 3360/ 1990/
2750/ 2382/ 2404/
1970/ 3492/ 2392
x x x x x x x x x [112]
356 x x x x x x [126]
Montenegro Europa 200 x x x x x x x x x x x x x x x [92]
Croácia Europa
200 x x x x x x x x x x [127]
217 x x x x x [128]
Noruega Europa 202 x x x x x x x x x x x x x x x [92]
França Europa 208 x x x x x x x x x x x x x x x
Reino Unido Europa
370/ 602/ 602/ 900 x x x x [129]
370 x x x x x x x x x x [130]
370 x [131]
Irlanda Europa 304 x x x x x x x x x x x x x x x [92]
Moldávia Europa 1321 x x x x x x x x x x [132]
Bielorrússia Europa
1102/ 1108/ 1005/
1098/ 1110/ 1106/
1090/ 1098
x x x x x x x x [133]
212 x x [134]
Suécia Europa 311 x x x x x x x x x x [135]
Islândia Europa 151 x x x x x x x x x x [136]
Azerbaijão Ásia
283/ 285/ 285/ 285/
284/ 281/ 285/ 285/
284/ 285
x x x x x x x x x x [137]
Rússia (europeia) Europa
340/ 371/ 184/ 371/
371/ 371/ 184/ 371/
369/ 371
x x x x x x x x x x [138]
Sibéria ("região sul") Ásia
515/ 558/ 261/ 558/
558/ 556/ 260/ 558/
558/ 558
x x x x x x x x x x [138]
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
83
China (mainland) Ásia 42416 x x x x x x x x x x [139]
China (população Han,
província de Fujing) Ásia 433 x x x x x x x x x x x x x x x x [98]
África do Sul
(população amaXhosa
falante de bantu)
África 120 x x x x x x x x x x x x x x x x [97]
Marrocos África 320 x x x x x x x x x x [140]
Angola África 480 x x x x x x x x x x [141]
Somália África 597 x x x x x x x x x x x x x x x x [95]
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
84
Anexo 3
Tabela 16. Matriz de distâncias genéticas para as 46 populações (valores de FST acima da diagonal e (δμ)2 abaixo)
Ucrâ
nia
0
0,0
98
0,0
5
0,1
67
0,0
59
0,0
67
0,1
69
0,1
75
0,0
82
0,0
59
0,0
88
0,0
36
0,0
63
0,0
84
0,0
68
0,0
49
0,1
38
0,2
06
0,0
56
0,0
68
0,0
66
0,0
5
0,0
54
0,0
85
0,4
38
0,3
04
0,0
73
0,0
83
0,0
39
0,0
56
0,0
25
0,0
82
0,0
59
0,0
83
0,0
65
0,0
94
0,0
22
0,0
54
0,1
16
0,1
48
0,0
26
0,4
97
0,4
0,6
67
0,1
66
0,9
11
Ro
mé
nia
0,0
04
0
0,0
45
0,0
9
0,0
55
0,0
2
0,0
74
0,0
52
0,0
26
0,0
12
0,0
18
0,0
33
0,0
43
0,0
17
0,0
43
0,0
22
0,0
54
0,0
91
0,0
31
0,0
3
0,0
7
0,0
3
0,0
41
0,0
34
0,2
78
0,1
05
0,0
43
0,0
38
0,0
25
0,0
24
0,0
36
0,0
31
0,0
21
0,0
23
0,0
36
0,0
06
0,0
49
0,0
31
0,0
51
0,0
34
0,0
51
0,2
17
0,1
34
0,4
72
0,2
16
0,6
22
Po
lón
ia
0
0,0
04
0
0,0
51
0,0
91
0,0
15
0,1
51
0,1
16
0,0
25
0,0
16
0,0
42
0,0
29
0,0
85
0,0
29
0,0
08
0,0
25
0,0
41
0,1
38
0,0
33
0,0
51
0,1
08
0,0
42
0,0
69
0,0
32
0,3
94
0,1
85
0,0
04
0,0
18
0,0
34
0,0
31
0,0
14
0,0
34
0,0
33
0,0
26
0,0
38
0,0
34
0,0
09
0,0
23
0,0
5
0,1
23
0,0
19
0,3
15
0,2
42
0,5
94
0,2
7
0,7
86
Lit
uâ
nia
0,0
02
0,0
07
0,0
02
0
0,2
2
0,0
53
0,2
02
0,1
54
0,0
59
0,0
69
0,1
09
0,1
06
0,1
9
0,0
92
0,0
59
0,1
11
0,0
8
0,2
32
0,1
17
0,1
4
0,2
51
0,1
39
0,1
97
0,1
05
0,4
84
0,1
58
0,0
41
0,0
59
0,1
3
0,1
21
0,1
05
0,1
14
0,1
24
0,0
93
0,1
46
0,0
81
0,0
77
0,1
08
0,1
2
0,2
05
0,0
93
0,2
15
0,1
75
0,5
16
0,4
7
0,6
47
Alb
ân
ia
0,0
04
0,0
02
0,0
06
0,0
09
0
0,0
66
0,0
69
0,1
0,1
04
0,0
53
0,0
41
0,0
32
0,0
07
0,0
65
0,1
06
0,0
38
0,1
4
0,1
42
0,0
39
0,0
56
0,0
09
0,0
38
0,0
18
0,0
72
0,2
49
0,2
01
0,1
03
0,0
93
0,0
21
0,0
34
0,0
41
0,0
54
0,0
39
0,0
73
0,0
54
0,0
58
0,0
67
0,0
58
0,0
93
0,0
43
0,0
55
0,3
78
0,2
95
0,5
84
0,1
13
0,8
2
Es
lov
ên
ia
0,0
02
0,0
02
0,0
01
0,0
03
0,0
03
0
0,1
01
0,0
81
0,0
25
0,0
09
0,0
27
0,0
14
0,0
55
0,0
26
0,0
22
0,0
25
0,0
48
0,1
35
0,0
31
0,0
48
0,0
84
0,0
37
0,0
56
0,0
38
0,3
22
0,1
42
0,0
11
0,0
18
0,0
22
0,0
19
0,0
21
0,0
33
0,0
27
0,0
27
0,0
46
0,0
16
0,0
19
0,0
32
0,0
44
0,0
81
0,0
28
0,2
52
0,1
98
0,4
93
0,2
46
0,6
47
Ira
qu
e
0,0
08
0,0
04
0,0
08
0,0
11
0,0
03
0,0
05
0
0,0
53
0,1
57
0,0
95
0,0
74
0,0
99
0,0
47
0,1
15
0,1
73
0,1
06
0,1
67
0,1
91
0,0
78
0,1
37
0,0
96
0,0
96
0,1
13
0,1
16
0,1
25
0,0
67
0,1
5
0,1
06
0,0
91
0,0
91
0,1
17
0,0
97
0,0
99
0,1
14
0,1
29
0,0
91
0,1
46
0,1
17
0,1
2
0,0
39
0,1
24
0,1
67
0,1
45
0,4
05
0,2
27
0,6
54
Tu
rqu
ia
0,0
06
0,0
03
0,0
08
0,0
12
0,0
04
0,0
05
0,0
01
0
0,1
02
0,0
66
0,0
75
0,1
13
0,0
66
0,0
55
0,1
1
0,0
69
0,0
77
0,1
9
0,0
55
0,0
99
0,1
02
0,0
7
0,1
19
0,0
57
0,1
88
0,0
5
0,1
18
0,0
78
0,0
88
0,0
82
0,0
99
0,0
64
0,0
59
0,0
59
0,0
83
0,0
58
0,1
34
0,0
73
0,0
93
0,0
32
0,1
18
0,1
59
0,1
24
0,5
62
0,3
28
0,7
15
Es
lov
áq
uia
0,0
01
0,0
01
0,0
02
0,0
03
0,0
03
0,0
01
0,0
06
0,0
07
0
0,0
17
0,0
49
0,0
42
0,0
9
0,0
21
0,0
2
0,0
27
0,0
39
0,1
3
0,0
5
0,0
22
0,1
22
0,0
54
0,0
77
0,0
33
0,4
47
0,1
76
0,0
28
0,0
41
0,0
49
0,0
39
0,0
37
0,0
41
0,0
38
0,0
25
0,0
48
0,0
21
0,0
34
0,0
26
0,0
56
0,0
97
0,0
46
0,3
02
0,1
93
0,5
67
0,2
89
0,7
1
Hu
ng
ria
0
0,0
01
0,0
01
0,0
03
0,0
03
0,0
01
0,0
05
0,0
05
0
0
0,0
21
0,0
19
0,0
45
0,0
09
0,0
2
0,0
07
0,0
37
0,1
05
0,0
13
0,0
23
0,0
66
0,0
2
0,0
42
0,0
17
0,3
27
0,1
29
0,0
19
0,0
18
0,0
16
0,0
17
0,0
11
0,0
16
0,0
11
0,0
12
0,0
25
0,0
06
0,0
2
0,0
12
0,0
41
0,0
59
0,0
23
0,2
57
0,1
77
0,5
24
0,2
22
0,6
95
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
85
Ma
ce
dó
nia
0,0
04
0,0
04
0,0
05
0,0
07
0,0
02
0,0
04
0,0
05
0,0
06
0,0
04
0,0
04
0
0,0
29
0,0
34
0,0
26
0,0
44
0,0
23
0,0
61
0,1
19
0,0
27
0,0
44
0,0
63
0,0
43
0,0
42
0,0
35
0,2
56
0,1
22
0,0
39
0,0
41
0,0
28
0,0
18
0,0
33
0,0
23
0,0
29
0,0
32
0,0
33
0,0
17
0,0
46
0,0
33
0,0
48
0,0
43
0,0
31
0,2
52
0,1
78
0,5
29
0,2
27
0,7
36
Bo
sn
ia e
Herz
eg
ov
ina
0,0
01
0,0
04
0,0
02
0,0
04
0,0
04
0,0
01
0,0
07
0,0
06
0,0
03
0,0
02
0,0
04
0
0,0
33
0,0
43
0,0
44
0,0
24
0,0
88
0,1
32
0,0
33
0,0
39
0,0
52
0,0
34
0,0
3
0,0
53
0,3
35
0,1
96
0,0
32
0,0
4
0,0
11
0,0
14
0,0
15
0,0
39
0,0
3
0,0
43
0,0
47
0,0
3
0,0
15
0,0
35
0,0
55
0,0
8
0,0
22
0,3
37
0,2
63
0,5
05
0,1
66
0,7
03
Gré
cia
0,0
02
0,0
02
0,0
05
0,0
07
0,0
01
0,0
01
0,0
03
0,0
03
0,0
02
0,0
02
0,0
03
0,0
03
0
0,0
55
0,0
94
0,0
35
0,1
2
0,1
65
0,0
33
0,0
55
0,0
17
0,0
37
0,0
3
0,0
62
0,2
25
0,1
58
0,0
94
0,0
79
0,0
25
0,0
32
0,0
42
0,0
49
0,0
36
0,0
63
0,0
53
0,0
49
0,0
65
0,0
52
0,0
86
0,0
28
0,0
48
0,3
21
0,2
51
0,5
5
0,1
53
0,7
72
Áu
str
ia
0,0
01
0,0
03
0,0
01
0,0
03
0,0
04
0,0
01
0,0
06
0,0
05
0,0
01
0,0
01
0,0
03
0,0
02
0,0
02
0
0,0
23
0,0
06
0,0
26
0,1
05
0,0
18
0,0
2
0,0
7
0,0
26
0,0
5
0,0
07
0,3
33
0,1
31
0,0
34
0,0
34
0,0
29
0,0
26
0,0
23
0,0
13
0,0
11
0,0
09
0,0
18
0,0
08
0,0
43
0,0
11
0,0
46
0,0
52
0,0
41
0,2
72
0,1
8
0,6
26
0,2
6
0,7
86
Rep
ub
lic
a
Ch
ec
a
0
0,0
04
0
0
0,0
06
0,0
01
0,0
08
0,0
07
0,0
02
0,0
01
0,0
04
0,0
02
0,0
04
0,0
01
0
0,0
26
0,0
24
0,1
54
0,0
37
0,0
48
0,1
15
0,0
45
0,0
76
0,0
28
0,4
06
0,1
88
0,0
1
0,0
23
0,0
43
0,0
34
0,0
23
0,0
36
0,0
3
0,0
19
0,0
29
0,0
31
0,0
21
0,0
21
0,0
49
0,1
2
0,0
27
0,3
19
0,2
4
0,6
18
0,3
02
0,7
71
Ale
ma
nh
a
0,0
01
0,0
02
0,0
01
0,0
03
0,0
03
0,0
01
0,0
05
0,0
04
0,0
02
0
0,0
03
0,0
01
0,0
02
0
0,0
01
0
0,0
43
0,1
08
0,0
1
0,0
14
0,0
45
0,0
17
0,0
3
0,0
1
0,3
32
0,1
59
0,0
35
0,0
35
0,0
14
0,0
15
0,0
09
0,0
11
0,0
06
0,0
13
0,0
13
0,0
13
0,0
27
0,0
06
0,0
44
0,0
52
0,0
24
0,3
18
0,2
22
0,6
22
0,2
07
0,8
13
Fin
lân
dia
0,0
06
0,0
08
0,0
06
0,0
07
0,0
11
0,0
07
0,0
12
0,0
08
0,0
06
0,0
06
0,0
08
0,0
07
0,0
09
0,0
05
0,0
05
0,0
06
0
0,1
56
0,0
44
0,0
63
0,1
52
0,0
7
0,1
22
0,0
18
0,3
68
0,1
32
0,0
36
0,0
27
0,0
8
0,0
5
0,0
58
0,0
28
0,0
42
0,0
14
0,0
42
0,0
35
0,0
75
0,0
27
0,0
3
0,1
05
0,0
73
0,2
46
0,1
8
0,6
24
0,3
74
0,7
75
Ho
lan
da
0,0
07
0,0
07
0,0
06
0,0
07
0,0
08
0,0
05
0,0
09
0,0
09
0,0
06
0,0
05
0,0
07
0,0
06
0,0
07
0,0
04
0,0
06
0,0
03
0,0
09
0
0,1
19
0,1
01
0,1
61
0,0
99
0,0
93
0,1
17
0,3
76
0,2
3
0,1
42
0,1
32
0,1
02
0,1
11
0,1
17
0,1
05
0,1
0,1
04
0,1
01
0,0
99
0,1
57
0,1
11
0,1
23
0,1
34
0,1
82
0,3
46
0,2
13
0,5
94
0,1
82
0,8
1
Bélg
ica
0,0
01
0,0
03
0,0
01
0,0
02
0,0
04
0,0
01
0,0
06
0,0
05
0,0
02
0,0
01
0,0
04
0,0
02
0,0
03
0
0,0
01
0,0
01
0,0
04
0,0
04
0
0,0
38
0,0
45
0,0
13
0,0
42
0,0
14
0,2
65
0,1
24
0,0
4
0,0
22
0,0
17
0,0
19
0,0
12
0,0
11
0,0
07
0,0
14
0,0
15
0,0
22
0,0
36
0,0
1
0,0
4
0,0
5
0,0
26
0,2
7
0,2
03
0,5
55
0,1
97
0,7
64
Su
iça
0,0
02
0,0
02
0,0
03
0,0
04
0,0
03
0,0
01
0,0
04
0,0
03
0,0
02
0,0
01
0,0
03
0,0
03
0,0
02
0
0,0
02
0
0,0
07
0,0
03
0,0
01
0
0,0
68
0,0
39
0,0
41
0,0
27
0,4
14
0,2
0,0
63
0,0
66
0,0
34
0,0
29
0,0
31
0,0
29
0,0
25
0,0
28
0,0
31
0,0
25
0,0
49
0,0
18
0,0
57
0,0
61
0,0
52
0,3
67
0,2
33
0,6
28
0,2
02
0,8
14
Itá
lia
0,0
02
0,0
03
0,0
04
0,0
06
0,0
02
0,0
02
0,0
03
0,0
03
0,0
03
0,0
02
0,0
03
0,0
03
0,0
01
0,0
02
0,0
03
0,0
01
0,0
08
0,0
05
0,0
03
0,0
01
0
0,0
33
0,0
2
0,0
82
0,2
58
0,2
27
0,1
23
0,1
11
0,0
27
0,0
52
0,0
49
0,0
7
0,0
39
0,0
83
0,0
54
0,0
73
0,0
81
0,0
68
0,1
21
0,0
54
0,0
7
0,4
18
0,3
33
0,6
51
0,1
17
0,8
51
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
86
Po
rtu
ga
l
0,0
02
0,0
02
0,0
02
0,0
05
0,0
03
0,0
03
0,0
04
0,0
04
0,0
02
0,0
01
0,0
04
0,0
03
0,0
03
0,0
01
0,0
03
0,0
01
0,0
07
0,0
04
0,0
01
0
0,0
02
0
0,0
2
0,0
35
0,2
77
0,1
62
0,0
54
0,0
38
0,0
09
0,0
28
0,0
13
0,0
34
0,0
06
0,0
25
0,0
15
0,0
32
0,0
36
0,0
21
0,0
66
0,0
57
0,0
41
0,3
12
0,2
31
0,5
58
0,1
48
0,7
33
Es
pa
nh
a
0,0
03
0,0
02
0,0
03
0,0
05
0,0
03
0,0
01
0,0
05
0,0
05
0,0
03
0,0
02
0,0
04
0,0
02
0,0
02
0,0
01
0,0
03
0,0
01
0,0
07
0,0
03
0,0
02
0
0,0
01
0,0
01
0
0,0
67
0,2
97
0,2
3
0,0
81
0,0
82
0,0
11
0,0
31
0,0
28
0,0
56
0,0
26
0,0
57
0,0
31
0,0
49
0,0
5
0,0
47
0,0
92
0,0
62
0,0
55
0,4
01
0,2
93
0,5
99
0,1
0,7
93
Din
am
arc
a
0,0
01
0,0
03
0,0
01
0,0
03
0,0
04
0,0
01
0,0
05
0,0
04
0,0
02
0,0
01
0,0
03
0,0
02
0,0
03
0
0,0
01
0
0,0
04
0,0
02
0
0
0,0
02
0,0
01
0,0
02
0
0,3
3
0,1
3
0,0
39
0,0
29
0,0
41
0,0
26
0,0
26
0,0
05
0,0
15
0,0
06
0,0
19
0,0
19
0,0
51
0,0
06
0,0
31
0,0
61
0,0
43
0,2
77
0,1
91
0,6
46
0,2
74
0,8
46
Gro
ne
lân
dia
0,0
61
0,0
52
0,0
58
0,0
61
0,0
53
0,0
55
0,0
46
0,0
46
0,0
54
0,0
55
0,0
51
0,0
58
0,0
54
0,0
54
0,0
55
0,0
54
0,0
5
0,0
53
0,0
53
0,0
49
0,0
5
0,0
52
0,0
51
0,0
52
0
0,1
79
0,3
79
0,2
96
0,2
88
0,2
86
0,3
41
0,2
98
0,2
87
0,3
13
0,3
04
0,3
1
0,4
03
0,3
4
0,3
06
0,1
88
0,3
67
0,2
48
0,3
1
0,5
61
0,3
94
0,8
09
Cas
aq
uis
tão
0,0
15
0,0
11
0,0
16
0,0
19
0,0
11
0,0
15
0,0
06
0,0
05
0,0
13
0,0
13
0,0
14
0,0
16
0,0
12
0,0
12
0,0
15
0,0
13
0,0
12
0,0
17
0,0
13
0,0
12
0,0
12
0,0
12
0,0
13
0,0
12
0,0
42
0
0,1
71
0,1
18
0,1
79
0,1
64
0,1
89
0,1
28
0,1
49
0,1
29
0,1
76
0,1
12
0,2
21
0,1
58
0,1
47
0,0
93
0,1
95
0,0
4
0,0
39
0,4
33
0,4
52
0,6
12
Le
tón
ia
0,0
03
0,0
06
0,0
02
0,0
03
0,0
08
0,0
01
0,0
09
0,0
09
0,0
03
0,0
03
0,0
07
0,0
04
0,0
06
0,0
03
0,0
01
0,0
03
0,0
08
0,0
07
0,0
03
0,0
03
0,0
06
0,0
05
0,0
04
0,0
03
0,0
56
0,0
19
0
0,0
14
0,0
41
0,0
31
0,0
25
0,0
36
0,0
4
0,0
28
0,0
47
0,0
31
0,0
18
0,0
32
0,0
42
0,1
26
0,0
27
0,2
82
0,2
23
0,5
46
0,2
92
0,7
22
Es
tón
ia
0,0
01
0,0
04
0,0
01
0,0
02
0,0
06
0,0
02
0,0
07
0,0
07
0,0
01
0,0
01
0,0
05
0,0
03
0,0
05
0,0
01
0
0,0
02
0,0
04
0,0
05
0,0
01
0,0
02
0,0
03
0,0
02
0,0
03
0,0
01
0,0
56
0,0
13
0,0
01
0
0,0
39
0,0
27
0,0
26
0,0
26
0,0
29
0,0
16
0,0
38
0,0
29
0,0
34
0,0
24
0,0
25
0,0
95
0,0
37
0,2
19
0,1
77
0,4
69
0,2
63
0,6
56
Sé
rbia
0,0
01
0,0
02
0,0
01
0,0
03
0,0
02
0
0,0
05
0,0
05
0,0
01
0
0,0
03
0,0
01
0,0
02
0,0
01
0,0
01
0,0
01
0,0
07
0,0
05
0,0
01
0,0
01
0,0
01
0,0
01
0,0
01
0,0
01
0,0
55
0,0
13
0,0
03
0,0
02
0
0,0
14
0,0
08
0,0
32
0,0
1
0,0
31
0,0
23
0,0
25
0,0
22
0,0
25
0,0
59
0,0
58
0,0
27
0,3
28
0,2
48
0,5
34
0,1
36
0,7
19
Mo
nte
neg
ro
0,0
03
0,0
02
0,0
04
0,0
07
0,0
01
0,0
01
0,0
04
0,0
05
0,0
02
0,0
02
0,0
03
0,0
02
0,0
01
0,0
03
0,0
03
0,0
02
0,0
1
0,0
08
0,0
03
0,0
03
0,0
03
0,0
03
0,0
03
0,0
03
0,0
57
0,0
14
0,0
04
0,0
04
0,0
01
0
0,0
16
0,0
15
0,0
15
0,0
18
0,0
22
0,0
2
0,0
31
0,0
15
0,0
2
0,0
54
0,0
31
0,3
06
0,2
31
0,5
33
0,1
82
0,7
39
Cro
ác
ia
0,0
02
0,0
04
0,0
01
0,0
03
0,0
05
0,0
01
0,0
08
0,0
07
0,0
02
0,0
02
0,0
04
0,0
01
0,0
03
0,0
02
0,0
01
0,0
02
0,0
05
0,0
07
0,0
01
0,0
02
0,0
03
0,0
02
0,0
04
0,0
02
0,0
56
0,0
15
0,0
03
0,0
02
0,0
01
0,0
02
0
0,0
23
0,0
11
0,0
22
0,0
17
0,0
28
0,0
09
0,0
12
0,0
5
0,0
83
0,0
13
0,3
45
0,2
61
0,5
86
0,1
77
0,7
91
No
rue
ga
0,0
03
0,0
04
0,0
03
0,0
04
0,0
04
0,0
02
0,0
06
0,0
05
0,0
03
0,0
02
0,0
03
0,0
03
0,0
03
0,0
01
0,0
01
0,0
01
0,0
04
0,0
03
0,0
01
0,0
01
0,0
02
0,0
03
0,0
03
-0,0
01
0,0
47
0,0
12
0,0
04
0,0
02
0,0
02
0,0
04
0,0
03
0
0,0
15
0,0
09
0,0
2
0,0
17
0,0
49
0,0
09
0,0
2
0,0
53
0,0
39
0,2
72
0,1
93
0,5
96
0,2
39
0,8
15
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
87
Fra
nç
a
0
0,0
02
0,0
01
0,0
03
0,0
03
0
0,0
05
0,0
03
0,0
02
0
0,0
03
0,0
01
0,0
02
0
0,0
01
0
0,0
05
0,0
03
0
0
0
0
0
0
0,0
54
0,0
13
0,0
03
0,0
01
0
0,0
02
0,0
01
0,0
01
0
0,0
1
0,0
07
0,0
16
0,0
35
0,0
09
0,0
41
0,0
47
0,0
35
0,2
98
0,2
15
0,5
78
0,1
84
0,7
49
Rein
o U
nid
o
0,0
03
0,0
03
0,0
02
0,0
04
0,0
05
0,0
02
0,0
06
0,0
05
0,0
02
0,0
01
0,0
04
0,0
03
0,0
04
0
0,0
01
0,0
01
0,0
04
0,0
03
0
0
0,0
03
0,0
01
0,0
02
-0,0
01
0,0
52
0,0
13
0,0
03
0,0
01
0,0
02
0,0
03
0,0
02
0
0
0
0,0
13
0,0
14
0,0
43
0,0
05
0,0
2
0,0
61
0,0
43
0,2
6
0,1
8
0,5
67
0,2
47
0,7
41
Irla
nd
a
0,0
02
0,0
03
0,0
02
0,0
03
0,0
04
0,0
02
0,0
06
0,0
05
0,0
02
0,0
01
0,0
04
0,0
03
0,0
04
0,0
01
0,0
01
0,0
01
0,0
04
0,0
03
0
0
0,0
02
0,0
01
0,0
01
0
0,0
48
0,0
13
0,0
03
0,0
01
0,0
02
0,0
04
0,0
02
0,0
01
0
0
0
0,0
31
0,0
44
0,0
1
0,0
45
0,0
64
0,0
4
0,3
37
0,2
41
0,6
34
0,1
94
0,8
26
Mo
ldá
via
0,0
02
0
0,0
02
0,0
05
0,0
02
0
0,0
03
0,0
03
0,0
01
0
0,0
03
0,0
03
0,0
02
0,0
01
0,0
02
0,0
01
0,0
07
0,0
05
0,0
02
0,0
01
0,0
02
0,0
02
0,0
02
0,0
02
0,0
52
0,0
11
0,0
03
0,0
02
0,0
01
0,0
02
0,0
03
0,0
03
0,0
01
0,0
02
0,0
02
0
0,0
43
0,0
21
0,0
38
0,0
44
0,0
42
0,2
31
0,1
5
0,5
11
0,2
42
0,6
62
Bie
lorr
ús
sia
0,0
01
0,0
04
0
0,0
02
0,0
06
0,0
01
0,0
07
0,0
08
0,0
02
0,0
01
0,0
05
0,0
02
0,0
04
0,0
02
0
0,0
02
0,0
06
0,0
06
0,0
02
0,0
03
0,0
03
0,0
03
0,0
03
0,0
02
0,0
55
0,0
15
0,0
02
0,0
01
0,0
02
0,0
04
0,0
02
0,0
03
0,0
02
0,0
03
0,0
02
0,0
02
0
0,0
32
0,0
72
0,1
23
0,0
09
0,3
67
0,2
87
0,5
74
0,2
15
0,7
68
Su
éc
ia
0,0
02
0,0
06
0,0
02
0,0
04
0,0
06
0,0
02
0,0
08
0,0
07
0,0
04
0,0
02
0,0
05
0,0
03
0,0
05
0,0
01
0,0
02
0,0
01
0,0
04
0,0
03
0
0,0
01
0,0
04
0,0
03
0,0
03
-0,0
01
0,0
56
0,0
14
0,0
03
0,0
02
0,0
03
0,0
05
0,0
03
0,0
01
0,0
01
0
0,0
01
0,0
04
0,0
04
0
0,0
28
0,0
65
0,0
29
0,3
11
0,2
17
0,6
05
0,2
21
0,8
1
Islâ
nd
ia
0,0
07
0,0
05
0,0
06
0,0
08
0,0
06
0,0
05
0,0
07
0,0
07
0,0
04
0,0
04
0,0
06
0,0
06
0,0
06
0,0
03
0,0
05
0,0
04
0,0
07
0,0
07
0,0
02
0,0
03
0,0
05
0,0
04
0,0
04
0,0
02
0,0
48
0,0
14
0,0
07
0,0
04
0,0
05
0,0
05
0,0
06
0,0
03
0,0
03
0,0
01
0,0
03
0,0
05
0,0
07
0,0
03
0
0,0
85
0,0
71
0,2
63
0,2
03
0,5
15
0,2
63
0,7
29
Azerb
eij
ão
0,0
07
0,0
04
0,0
08
0,0
1
0,0
03
0,0
05
0,0
01
0,0
02
0,0
05
0,0
05
0,0
06
0,0
07
0,0
03
0,0
06
0,0
07
0,0
05
0,0
1
0,0
1
0,0
07
0,0
05
0,0
03
0,0
04
0,0
05
0,0
06
0,0
52
0,0
08
0,0
11
0,0
07
0,0
05
0,0
05
0,0
06
0,0
07
0,0
05
0,0
07
0,0
06
0,0
04
0,0
07
0,0
1
0,0
08
0
0,1
03
0,2
29
0,1
51
0,5
28
0,2
1
0,7
16
Rú
ss
ia
0
0,0
04
0
0,0
01
0,0
06
0,0
01
0,0
07
0,0
06
0,0
02
0,0
01
0,0
04
0,0
01
0,0
03
0,0
01
0
0,0
01
0,0
06
0,0
05
0,0
02
0,0
02
0,0
03
0,0
03
0,0
02
0,0
01
0,0
53
0,0
13
0,0
01
0,0
01
0,0
01
0,0
03
0,0
01
0,0
02
0,0
01
0,0
02
0,0
02
0,0
02
0,0
01
0,0
02
0,0
06
0,0
08
0
0,3
52
0,2
76
0,5
86
0,2
31
0,8
06
Sib
éri
a
0,0
24
0,0
19
0,0
26
0,0
28
0,0
19
0,0
24
0,0
14
0,0
11
0,0
21
0,0
21
0,0
23
0,0
27
0,0
2
0,0
21
0,0
24
0,0
22
0,0
17
0,0
24
0,0
22
0,0
21
0,0
2
0,0
19
0,0
21
0,0
2
0,0
42
0,0
03
0,0
29
0,0
22
0,0
22
0,0
25
0,0
24
0,0
2
0,0
21
0,0
21
0,0
2
0,0
19
0,0
24
0,0
23
0,0
22
0,0
14
0,0
23
0
0,0
45
0,3
55
0,6
43
0,4
89
Ch
ina
0,0
33
0,0
25
0,0
33
0,0
4
0,0
27
0,0
34
0,0
2
0,0
17
0,0
29
0,0
3
0,0
32
0,0
34
0,0
27
0,0
31
0,0
33
0,0
3
0,0
31
0,0
36
0,0
33
0,0
29
0,0
27
0,0
28
0,0
29
0,0
31
0,0
56
0,0
08
0,0
38
0,0
31
0,0
3
0,0
31
0,0
33
0,0
32
0,0
31
0,0
32
0,0
32
0,0
27
0,0
32
0,0
36
0,0
31
0,0
2
0,0
31
0,0
1
0
0,3
91
0,5
17
0,5
39
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
88
Áfr
ica
do
Su
l
0,0
4
0,0
35
0,0
42
0,0
45
0,0
36
0,0
42
0,0
29
0,0
31
0,0
38
0,0
38
0,0
33
0,0
43
0,0
39
0,0
41
0,0
42
0,0
39
0,0
43
0,0
39
0,0
41
0,0
37
0,0
35
0,0
35
0,0
39
0,0
41
0,0
55
0,0
35
0,0
48
0,0
39
0,0
39
0,0
39
0,0
43
0,0
41
0,0
37
0,0
4
0,0
39
0,0
36
0,0
42
0,0
47
0,0
36
0,0
32
0,0
41
0,0
38
0,0
43
0
0,5
7
0,1
31
Ma
rro
co
s
0,0
1
0,0
08
0,0
11
0,0
15
0,0
09
0,0
1
0,0
08
0,0
07
0,0
1
0,0
09
0,0
1
0,0
09
0,0
08
0,0
09
0,0
11
0,0
08
0,0
16
0,0
11
0,0
1
0,0
07
0,0
05
0,0
06
0,0
05
0,0
1
0,0
51
0,0
15
0,0
14
0,0
1
0,0
08
0,0
1
0,0
11
0,0
11
0,0
07
0,0
1
0,0
09
0,0
08
0,0
11
0,0
12
0,0
1
0,0
09
0,0
1
0,0
22
0,0
26
0,0
3
0
0,8
42
An
go
la
0,0
38
0,0
31
0,0
38
0,0
39
0,0
32
0,0
38
0,0
26
0,0
28
0,0
34
0,0
34
0,0
3
0,0
38
0,0
36
0,0
36
0,0
38
0,0
34
0,0
38
0,0
34
0,0
36
0,0
32
0,0
31
0,0
3
0,0
33
0,0
35
0,0
46
0,0
29
0,0
42
0,0
34
0,0
35
0,0
37
0,0
39
0,0
35
0,0
33
0,0
35
0,0
34
0,0
33
0,0
36
0,0
41
0,0
31
0,0
28
0,0
37
0,0
31
0,0
39
0,0
06
0,0
25
0
Ucrâ
nia
Ro
mé
nia
Po
lón
ia
Lit
uâ
nia
Alb
ân
ia
Es
lov
ên
ia
Ira
qu
e
Tu
rqu
ia
Es
lov
áq
uia
Hu
ng
ria
Ma
ce
dó
nia
Bo
sn
ia e
Herz
eg
ov
ina
Gré
cia
Áu
str
ia
Rep
ub
lic
a
Ch
ec
a
Ale
ma
nh
a
Fin
lân
dia
Ho
lan
da
Bélg
ica
Su
iça
Itá
lia
Po
rtu
ga
l
Es
pa
nh
a
Din
am
arc
a
Gro
ne
lân
dia
Cas
aq
uis
tão
Le
tón
ia
Es
tón
ia
Sé
rbia
Mo
nte
neg
ro
Cro
ác
ia
No
rue
ga
Fra
nç
a
Re
ino
Un
ido
Irla
nd
a
Mo
ldá
via
Bie
lorr
ús
sia
Su
éc
ia
Islâ
nd
ia
Azerb
eij
ão
Rú
ss
ia
Sib
éri
a
Ch
ina
Áfr
ica
do
Su
l
Ma
rro
co
s
An
go
la
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
89
Anexo 4
Tabela 17. Valor de p locus a locus para a distância de FST (intracontinental)
Dentro da África Dentro da Ásia (este) Dentro
do
médio
oriente
Norte de
África vs
Sudoeste
de Ásia
Norte de África vs
Médio Oriente
Norte
de
África
vs
Europa
Médio Oriente vs
sudoeste asiático Sudoeste asiático vs este asiático
Somália
vs África
Sul
(bantu)
Somália
vs
Marrocos
Marrocos
vs África
Sul
(bantu)
Cazaquistão
vs Sibéria Cazaquistão
vs China Sibéria
vs China
Iraque
vs
Turquia
Marrocos
vs
Azerbaijão
Marrocos
vs Iraque
Marrocos
vs
Turquia
Marrocos
vs
Ucrânia
Iraque vs
Azerbaijão Turquia vs
Azerbaijão Sibéria vs
Azerbaijão China vs
Azerbaijão Cazaquistão
vs Azerbaijão
SE33 0,07207 … … … … … 0,63063 … … … … … … … … …
vWA 0,00000 0,06306 0,00000 0,30631 0,00000 0,00000 0,76577 0,00000 0,16216 0,01802 0,02703 0,26126 0,26126 0,00000 0,00000 0,00000
D16S539 0,00000 0,01802 0,00000 0,74775 0,00000 0,07207 0,69369 0,01802 0,12613 0,07207 0,75676 0,82883 0,92793 0,00000 0,00000 0,00000
D2S1338 0,00000 0,00000 0,00000 0,90090 0,00000 0,27027 0,20721 0,00000 0,00000 0,02703 0,73874 0,68468 0,31532 0,00000 0,00000 0,00000
D8S1179 0,01802 0,00901 0,00000 0,02703 0,00000 0,00000 0,61261 0,00000 0,48649 0,09910 0,00000 0,48649 0,49550 0,36937 0,00000 0,84685
D21S11 0,00000 0,00901 0,00000 0,00000 0,06306 0,00000 0,90090 0,07207 0,28829 0,33333 0,06306 0,87387 0,91892 0,00000 0,00000 0,00000
D18S51 0,01802 0,00000 0,00000 0,05405 0,00000 0,00000 0,96396 0,00000 0,12613 0,79279 0,11712 0,00000 0,00000 0,00000 0,00000 0,00000
D19S433 0,00000 0,02703 0,00000 0,00901 0,00000 0,11712 0,76577 0,00000 0,07207 0,29730 0,46847 0,18919 0,46847 0,09910 0,00000 0,00000
TH01 0,00000 0,00000 0,00000 0,08108 0,00000 0,00000 0,97297 0,00000 0,23423 0,04505 0,00000 0,93694 0,71171 0,00000 0,00000 0,00000
FGA 0,01802 0,00000 0,00000 0,14414 0,02703 0,00000 0,20721 0,00000 0,00000 0,00000 0,01802 0,36937 0,64865 0,00000 0,00000 0,00000
D3S1358 0,00000 0,03604 0,00000 0,03604 0,11712 0,09009 0,83784 0,90991 0,84685 0,49550 0,50450 0,83784 0,27928 0,00000 0,00000 0,01802
D10S1248 0,00901 … … … … … 0,07207 … … … … … … … … …
D22S1045 0,00000 … … … … … 0,16216 … … … … … … … … …
D2S441 0,00000 … … … … … 0,88288 … … … … … … … … …
D1S1656 0,00000 … … … … … 0,93694 … … … … … … … … …
D12S391 0,00901 … … … … … 0,81982 … … … … … … … … …
Valor de significância para 95% (valores significativos a azul; p<0,003 após a correção de Bonferroni)
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
90
Anexo 5
Tabela 18. Valor de p para a comparação de FST locus a locus entre a Ucrânia e os outros países já descritos na literatura
Ucrânia
vs
Lituânia
[75]
Albânia
[75]
Eslovêni
a [75]
Iraque
[75]
Turquia
[75]
Bósnia e
Herzegovi
na [92]
Alemanh
a [92]
Holanda
[93]
Espanh
a [94]
Dinamarc
a [95]
Gronelâ
ndia [95]
Cazaquist
ão [96]
África do
Sul a [97]
China b[98]
Somália
[95]
SE33 0,39640 0,19820 0,56757 0,32432 0,49550 0,09910 0,54955 0,37838 0,12613 0,55856 0,00000 0,02703 0,09009 0,02703 0,00901
vWA 0,97297 0,78378 0,42342 0,84685 0,43243 0,83784 0,54955 0,00000 0,09009 0,74775 0,10811 0,52252 0,00901 0,01802 0,00000
D16S539 0,71171 0,73874 0,89189 0,24324 0,34234 0,80180 0,74775 0,43243 0,90090 0,87387 0,00901 0,00000 0,00000 0,00000 0,47748
D2S1338 0,13514 0,43243 0,52252 0,10811 0,17117 0,79279 0,40541 0,20721 0,82883 0,27928 0,00000 0,00000 0,00000 0,00000 0,00000
D8S1179 0,49550 0,25225 0,60360 0,21622 0,30631 0,75676 0,79279 0,89189 0,29730 0,90090 0,00000 0,27928 0,00000 0,00000 0,00000
D21S11 0,71171 0,11712 0,78378 0,58559 0,90090 0,89189 0,63063 0,42342 0,26126 0,58559 0,00000 0,02703 0,00000 0,00000 0,00901
D18S51 0,40541 0,19820 0,33333 0,19820 0,63063 0,64865 0,02703 0,04505 0,07207 0,23423 0,00901 0,03604 0,00901 0,42342 0,00000
D19S433 0,92793 0,52252 0,40541 0,48649 0,89189 0,15315 0,78378 0,46847 0,81982 0,54955 0,01802 0,27027 0,05405 0,03604 0,08108
TH01 0,63964 0,39640 0,61261 0,29730 0,33333 0,74775 0,89189 0,28829 0,66667 0,52252 0,00000 0,01802 0,00000 0,00000 0,00000
FGA 0,81982 0,54054 0,88288 0,15315 0,24324 0,88288 0,97297 0,79279 0,88288 0,98198 0,00000 0,00000 0,07207 0,00901 0,00000
D3S1358 0,80180 0,89189 0,89189 0,35135 0,26126 0,90090 0,99099 0,98198 0,99099 0,87387 0,00000 0,04505 0,00901 0,01802 0,05405
D10S124
8 0,94595 0,58559 0,81982 0,95495 0,09009 0,63063 0,32432 0,07207 0,13514 0,20721 0,08108 0,01802 0,01802 0,00000 0,09910
D22S104
5 0,86486 0,82883 0,89189 0,26126 0,88288 0,81081 0,39640 0,37838 0,09910 0,51351 0,00901 0,16216 0,00000 0,14414 0,01802
D2S441 0,86486 0,22523 0,44144 0,11712 0,25225 0,73874 0,19820 0,18919 0,41441 0,21622 0,00000 0,01802 0,00000 0,00000 0,00901
D1S1656 0,72973 0,74775 0,80180 0,51351 0,35135 0,68468 0,74775 0,72973 0,75676 0,80180 0,00000 0,00000 0,00000 0,00000 0,00000
D12S391 0,36937 0,65766 0,92793 0,72072 0,63964 0,81081 0,54054 0,38739 0,56757 0,75676 0,00000 0,13514 0,23423 0,17117 0,00000
Valor de significância para 95% (valores significativos a azul; p<0,003 após a correção de Bonferroni)
FCUP Caraterização de uma amostra de emigrantes ucranianos residentes em Portugal com recurso ao kit NGM Select
91
Anexo 6
Tabela 19. Valores de heterozigotia e desvio padrão para cada um dos marcadores do kit NGM Select para 16 populações
Ucrâni
a
Lituânia
[75]
Albâni
a [75]
Eslovênia
[75]
Iraque
[75]
Turquia
[75]
Bósnia e
Herzegov
ina [92]
Aleman
ha [92]
Holan
da
[93]
Espan
ha [94]
Dina
marc
a [95]
Gronelâ
ndia [95]
Cazaquist
ão [96]
África
do Sul a [97]
Chi
na b[98]
Somá
lia
[95]
desvi
o
padr
ão
(%)
D1S1656 0,89 0,89 0,90 0,90 0,88 0,90 0,89 0,90 0,90 0,89 0,90 0,82 0,86 0,84 0,82 0,87 2,6
D2S441 0,78 0,75 0,77 0,78 0,76 0,76 0,77 0,75 0,75 0,76 0,75 0,66 0,74 0,76 0,78 0,79 1,5
D2S1338 0,85 0,86 0,87 0,88 0,89 0,87 0,86 0,87 0,88 0,86 0,88 0,77 0,87 0,88 0,86 0,85 1,2
D3S1358 0,80 0,79 0,78 0,78 0,76 0,76 0,79 0,80 0,80 0,79 0,79 0,59 0,74 0,72 0,72 0,75 2,8
D8S1179 0,79 0,75 0,80 0,80 0,83 0,83 0,79 0,81 0,81 0,82 0,81 0,73 0,81 0,77 0,85 0,78 2,6
D10S1248 0,75 0,76 0,77 0,77 0,77 0,78 0,78 0,77 0,75 0,77 0,75 0,66 0,78 0,79 0,74 0,79 1,5
D12S391 0,87 0,89 0,89 0,87 0,87 0,89 0,90 0,89 0,90 0,90 0,90 0,83 0,86 0,86 0,85 0,84 2,1
D16S539 0,76 0,74 0,79 0,75 0,80 0,78 0,74 0,78 0,77 0,76 0,77 0,70 0,81 0,76 0,79 0,80 2,1
D18S51 0,86 0,88 0,87 0,88 0,89 0,88 0,88 0,88 0,88 0,87 0,88 0,85 0,86 0,88 0,86 0,90 1,2
D19S433 0,81 0,80 0,83 0,77 0,84 0,80 0,78 0,78 0,78 0,79 0,79 0,83 0,83 0,82 0,82 0,81 2,1
D21S11 0,86 0,86 0,84 0,85 0,86 0,87 0,86 0,86 0,84 0,84 0,84 0,81 0,82 0,84 0,82 0,84 1,4
D22S1045 0,77 0,73 0,73 0,75 0,71 0,76 0,74 0,72 0,73 0,68 0,73 0,69 0,77 0,84 0,77 0,73 3,7
FGA 0,86 0,84 0,87 0,87 0,86 0,85 0,84 0,86 0,87 0,86 0,87 0,85 0,85 0,88 0,87 0,85 1,1
SE33 0,95 0,95 0,94 0,94 0,95 0,95 0,94 0,95 0,95 0,95 0,95 0,85 0,95 0,92 0,95 0,93 0,9
TH01 0,78 0,75 0,79 0,77 0,79 0,80 0,79 0,79 0,77 0,79 0,78 0,52 0,79 0,71 0,66 0,75 3,9
Vwa 0,82 0,82 0,81 0,81 0,80 0,81 0,82 0,81 0,81 0,81 0,81 0,78 0,80 0,80 0,80 0,80 0,6
Top Related