Hidden Markov Model approach for the Assignment of Genome-wide Copy Number Alterations

11
Hidden Markov Model approach for the Assignment of Genome-wide Copy Number Alterations 1. Genetic Background 2. Expectation – Maximization 3. Hidden Markov Models Genome Contains entire heredity information of a cell Build up of the four bases A, C, G, T Human genome contains 3 billion bases. Copy Number Aberrations Genome is present in two copies in each cell One or both copies can get lost (deletion) Additional copies can emerge (gain, amplification) Size of deletions/amplifications: 1 bp - few Mbp, even a whole chromosome can be aberrated Array CGH •Comparative Genomic Hybridization Comparison of two genomes Compare the genomes of two individuals or of two different tissues of the same individual Metaphase-CGH and Microarray-CGH (CGH = comparative genomic hybridization) Labeling Normal Case Deletion Duplication Ratio = = > 1,5 Red Green Ratio = = = 0.5 Red Green Red Ratio = = =1 Green n green n red Tumour DNA Normal reference DNA Tumour DNA Normal reference DNA Tumour DNA Normal reference DNA Measurement point n green n red Ratio = = = 1.5 n green n red

Transcript of Hidden Markov Model approach for the Assignment of Genome-wide Copy Number Alterations

Hidden Markov Model approach for the

Assignment of Genome-wide Copy

Number Alterations

1. Genetic Background

2. Expectation – Maximization

3. Hidden Markov Models

Genome

• Contains entire heredity information of a cell

• Build up of the four bases A, C, G, T

• Human genome contains 3 billion bases.

Copy Number Aberrations

• Genome is present in two copies in each cell

• One or both copies can get lost (deletion)

• Additional copies can emerge (gain,

amplification)

• Size of deletions/amplifications: 1 bp - few

Mbp, even a whole chromosome can be

aberrated

Array CGH

• Comparative Genomic Hybridization

• Comparison of two genomes

• Compare the genomes of two individuals

or of two different tissues of the same

individual

Metaphase-CGH and Microarray-CGH(CGH = comparative genomic hybridization)

Labeling

Normal Case Deletion Duplication

Ratio = = > 1,5

RedGreen

Ratio = = = 0.5RedGreen

RedRatio = = =1

Green ngreen

nred

Tumour DNA

Normal reference DNA

Tumour DNA

Normal reference DNA

Tumour DNA

Normal reference DNA

Measurement point

ngreen

nredRatio = = = 1.5ngreen

nred

���������������� ���� ���� ���������

� ������� ������� �� ��� �� �� ������ ��� �� ����� � �� ��� ��������� ��� �� � ����������

� ������������� ��� ���� ����� ������� ��� ��� ������ ����� ���� ������������� �������� ������ ����� ��� ��������

�����

� �� ������� ��� � ������ � �������� ��� �� ���� ����� ��

� ����������� �� �� �� ����� ��� ������ ��� ���� �� !"##�

� �������� ����� � ��$� ��% �$� ���

� �� �� � �� ���� � ������ ������ �� �� �� ��

���������� �� �� �� ��� ��� �� ��� ��������������� ����

������� ��� ��� �� �� �������� � ����� ���� �� ��� ���� ����

��������� ��������� �� � ���� �� ����� � �� �������������

����������� ���������� � � ������ �� � �� �������

�(� |θ) =�∑�=�

α� � (� |ϑ�)∑�

α� = � θ = (α� , ϑ�)

��� �������

�(� |θ) = α · � (� |µ�, σ

)+ (�− α) · � (

� |µ�, σ�

)���� ���� ���� �� ��� ��� �θ = (α, µ�, σ�, µ�, σ�)

�� ��������� ����� �� �� ��� ������ ���

�(θ) =�∏�=�

�∑�=�

α� � (�� |ϑ�) � ����������� �����

�� �(θ) =�∑�=�

��

[�∑�=�

α� � (�� |ϑ�)]

���������� ��� � ���� ���� �� � ��� � ���������

������ �� ����� � � ���������� �� ���

� ������������ � ��� ���� ������ � � �� �� ���

� � = ������ � �������� ����� (� , �) = ���� � ����

������������ � ����� ������� �� ��� ������� ����

�������� �� ����� �� � �� ������� � � ����� �� ���

� ≤ �� ≤ � � � ≤ � ≤ �

������� ��� �� ��� ��� � �����

������������ � �� � ���� � �� ����� ����� �������� ����� �� �� � � ������

������� ��� � ��� ��������� θ� = (α� , ϑ�)

� (�� = �|�� , θ�) =�(�� = �|θ�) · �(�� |�� = �, θ�)

�(�� |θ�)

=α� · � (�� |ϑ�)∑�α� · � (�� |ϑ�)

= ω�� ���������� ���������� � �� � �� ���� ��

�� ����� ������ � �������� ���� ��� ��� �� ���� ��

�� =∑

ω��

∑�

�� = �

���������� ������� �� �� � ������������� �

ω�� =α��

(�� |µ� , σ

)�

(�� |µ�, σ�

)+ �

(�� |µ�, σ�

) � = (�, �)

������������ � ��� �� ����� � � ���������������

������ ��� ������ �������� ω�� �

α� =��

�=

∑�ω��

µ� =

∑�ω����∑�ω��

σ�

�=

∑�ω��(�� − µ�)

�∑�ω��

��������� �������������� �� ω�� ��� (µ� , σ�

�, α�) ���� � ����

���������� ���������

������� ������ �� �� �

�������� ���� � ������ ���� � ��������� �� ��� ����� θ

�(θ) = �(� |θ) =�(� , � |θ)�(� |� , θ)

��� �(� |θ) = ��� �(� , � |θ) − ��� �(� |� , θ) ���

��������� ��� ����� �� �������� ���� ��� ��� �� � |� , θ� ��� ����

����� θ�

��������� � ��������� �� ��� ������������ �(� |� , θ�) ��� ��������

�������� ���� � �����������

��� �(� |θ) = ��� �(� , � |θ) − ��� �(� |� , θ)

��� �(� |θ) =

∫�

��� �(� , � |θ) · �(� |� , θ�) ��︸ ︷︷ ︸�(θ,θ�)

−∫�

��� �(� |� , θ) · �(� |� , θ�) ��︸ ︷︷ ︸�(θ,θ�)

��� �(� |θ) = �(θ, θ�) − �(θ, θ�)

���������� � ��� ���������

���� � ��� ���� � θ � �� ∆� = �(θ) − �(θ�) ≥ �

∆� = �� �(� |θ) − ����(� |θ�)

= �(θ, θ�) − �(θ� , θ�) + �(θ� , θ�) − �(θ, θ�)︸ ︷︷ ︸������ ≥�

≥ �

�(θ, θ�) ≤ �(θ� , θ�) ��� ����

θ�+� = ������θ

�(θ, θ�) ������ ��������

�� � �������

θ� → θ�

�(θ, θ�) =

∫�

��� �(� , � |θ) · �(� |� , θ�) �� �����

θ�+� = ������θ

�(θ, θ�) ����

θ�+� → θ�

�� � ������� ��� �������� ����� ��������������� �����

�(θ, θ�) =∑�

��� �(� , � |θ) · �(� |� , θ�) �������

�(θ) =�∏�=�

�(�� |θ) ������

�(θ, θ�) =∑�

∑�

��� �(� , �� |θ) · �(� |�� , θ�)

����� ����� �

��������� �� ��� ������ ��

�(θ, θ�) =

∫�

�� �(� |� , θ) · �(� |� , θ�) ��

�� �� ��� ���� �(θ, θ�) �� �������

�(θ, θ�) ≤ �(θ� , θ�)

Φ[∑ ]

≤∑

Φ ( )∑

=

��� ����� ���� � �(θ, θ�)

�(θ� , θ�) − �(θ, θ�)

=

∫�

��� �(� |� , θ�) · �(� |� , θ�) �� −∫�

��� �(� |� , θ) · �(� |� , θ�) ��

=

∫�

− ���

[�(� |� , θ)

�(� |� , θ�)

]· �(� |� , θ�) �� ����� ���� ���

≥ − ���

{∫�

�(� |� , θ)

������(� |� , θ�)

·������(� |� , θ�) ��

}

= �

�� � ���� ���� � ��

�(θ) = �(� |θ) �������� �� θ

�(θ, θ�) =

∫�

��� �(� , � |θ) · �(� |� , θ�) � �� ����

�� ���� ���� ����� ���� ����� � �����

��������� ��������� �� � ���� �� ����� � ��������������

������ ������� �� ���� ��� ��� ������ � �������

� ≤ �� ≤ � � � ≤ � ≤ �

������ � �������� �� �

��� ��������� �� ������� �� �

�(�� |θ) =�∑

�=�

α� · � (�� |ϑ�) θ = (α� ; ϑ�) ϑ� = (µ� ; σ��)

�� �� �� ��� �� ���� � �������

�(θ, θ�) =�∑�=�

�∑�=�

�� �(�� = �, �� |θ) · �(�� = � |�� , θ�)

����� ���� �� �� ��� � �= � ����������

������ � �������� �� �

��������� ����� ������� �� � ��

�(θ, θ�) =�∑�=�

�∑�=�

��� �(�� = �, �� |θ) · �(�� = � |�� , θ�)

��� ��� � ������� � � ���� ��� �����

�(�� = �, �� |θ) = α� · � (�� |ϑ�)

��� ���� � ��� ��� �� ��� ��� �����

�∑�=�

�(�� = � , �� |θ) = �(�� |θ) =�∑

�=�

α� · � (�� |ϑ�)

������ � �������� �� �

��������� ���������� ������� �� � � ��

�(θ, θ�) =�∑�=�

�∑�=�

��� �(�� = �, �� |θ) · �(�� = � |�� , θ�)

����� ����

�(�� = �|�� , θ�) =�(�� , �� = �|θ�)

�(�� |θ�) =α� · � (�� |ϑ�)

� (�� |θ�)︸ ︷︷ ︸�� ���� �

= ω��

������ � �������� �� �

�(θ, θ�) =�∑�=�

�∑�=�

��� �(�� = �, �� |θ) · �(�� = � |�� , θ�)

�(θ, θ�) =�∑�=�

�∑�=�

���

[α� · � (�� |ϑ�)

]· ω��

=�∑�=�

�∑�=�

ω�� ���α�︸ ︷︷ ︸��

+�∑�=�

�∑�=�

ω�� ��� � (�� |ϑ�)︸ ︷︷ ︸��

���� ����� �� � �� ������ ����������

������ � ���������� � ��

�� =�∑�=�

�∑�=�

ω�� ���α� =∑�

�� ���α� ����∑�

α� = �

α� =��

�=

∑�ω���

�����

������ � ���������� � ��

�� =�∑�=�

�∑�=�

ω�� ��� � (�� |ϑ�)

=�∑�=�

ω�� ��� � (�� |ϑ�) +�∑�=�

ω�� ��� � (�� |ϑ�) + . . .

�∑�=�

ω�� ��� � (�� |ϑ�) �������� � ��� � ���� �� �� �� ϑ�

������ ��� ��� �� �� � �����

µ� =

∑�ω����∑�ω��

σ�

�=

∑�ω��(�� − µ�)

�∑�ω��

α� =

∑�ω��

�=

��

����� ��� ��� ������� � ���� �� ����� � � � ������� ���

�� � ���������

� ���� �������� ������ �� ���� ����� ��� �� �������

� ������� �� � ����� ������� �� ����� ����

� �������� ������ ������ �������� ������

��� � ��

�������� ��� ������ � � ������

�(θ|�) =�(� |θ) · �(θ)

�(�)

�(θ) = �� �(� |θ) + �� �(θ) ������� � ���� � �� ���� ���

= �� �(� , � |θ) − �� �(� |� , θ) + �� �(θ) ����� ���� ���

= �(θ, θ�) − �(θ, θ�) + �� �(θ) ������� � ����� �� �(θ)

������� ������

θ� → θ�

�(θ, θ�) =

∫�

��� �(� , � |θ) · �(� |� , θ�) �� �����

θ�+� = ������θ

[�(θ, θ�) + ��� �(θ)] ����

θ�+� → θ�

������ � ���� ���� ���� ������ �� ������ ��� ����

Hidden Markov Model

t=1 t=2 t=3

4,3a 2,4a

z1=3 Z3=2Z2=4

T

i

zziz

zzzzzz

iiiaxbzpzxP

axbaxbzpzzxxP

1

,1

,2,112121

1

322211

)()()|,(

...)()()()|,...,,...,,(

)( 13 xb )( 24 xb )( 32 xb

Hidden: zt

Visible: xt

Occasionelly dishonest casino

Observations x are visible: 3 1 2 4 5 4 6 3 4 6 6 3 6 6 3 4 6 6 1 4 6 3 6 6

State z is hidden: F F F F F F F F F L L L L L L L L L L L L L L L

LoadedFair

P=0,05P(1)=1/6

P(2)=1/6

P(3)=1/6

P(4)=1/6

P(5)=1/6

P(6)=1/6

P(1)=1/10

P(2)=1/10

P(3)=1/10

P(4)=1/10

P(5)=1/10

P(6)=1/2

P=0,95 P=0,9

P=0.1

0 2000 4000 6000 8000

−1.

5−

1.0

−0.

50.

00.

51.

01.

5

Chromosome 22

Index

Tumor5...Normal5.Log2.Rsub.Rref.

���������� �� �� ����� ��� ��� ���� ����������

θ = (��� , �� , π� )

π� = �(�� = �) ������� ������ � ≤ � ≤ �

��� = � (��+� = � |�� = �) ���������� � ≤ � , � ≤ �

�� (��) = � (�� |�� = �) ������� � ≤ � ≤ �

��� �� ���������� �� ��� ����� �� ��� ���� �� �����

���� ��� ����� ��� ���� ��� � ���������� ��� ��������

�(� , � |θ) = �(� |� , θ) · �(� |θ)

�� = ��������...��

� (�� . . . �� |�� . . . �� , θ)

�� = ��������...��

� (�� . . . �� , �� . . . �� |θ)

� ���� �� ��� ������ �� �������� ��� ��� ��� ��

� ���� ���� �� ������ �� � � ����

� �� ���� → � · � · �� �������� � ���� ��� � ����

���� ��� ����� ��� ���� �� ����� � ��� θ � ������

�� = ����

�(� |� , θ) = ����

�(� , � |θ)

� ������� δ�(�) �� �� ��� � ����

δ�(�) = �����,...,��−�

� (��, . . . , ��−�, �� = � , ��, . . . , �� |θ)

��� ��� � ���� ���� �������� ��� �����

δ�+�(�) = ����

[δ�(�)��� ] · ��(��+�)

��� ������� �������

�� = ����

�(� |� , θ) = ����

�(� , � |θ)

δ�(�) = π� · �� (��); ψ�(�) = � � ≤ � ≤ �

δ�(�) = ���� [δ�−�(�)��� ] · ��(��) � ≤ � ≤ ; � ≤ � ≤ �

ψ�(�) = ������� [δ�−�(�)��� ] � ≤ � ≤ ; � ≤ � ≤ �

�� = ���� δ� (�) ���� ���

��� = ������� δ� (�)

��� = ψ�+�(�

��+�

) �������������

� · �� �����������

Viterbi - Trellis

i = 0

B

i = 1

x1

i = 2

x2

i = 3

x3

i = 4

x4

i = 5

B 1 - - - - -

z1 0

z2 0

z3 0

z4 0

z5 0

��������������

������ �� �������� �(� |θ) ��� �� ��� ���� �������

�� α�(�) = �(��, ��, . . . , �� , �� = � |θ)

��� α�+�(�) =

⎡⎣ �∑

�=�

α�(�)���

⎤⎦ ��(��+�)

α�(�) = π� · �� (��) � ≤ � ≤ �

α�+�(�) =[∑�

�=�α�(�)���

]��(��+�) � ≤ � ≤ − �; � ≤ � ≤ �

�(� |θ) =∑�

�=�α� (�)

���������������

β�(�) = �(��+�, ��+�, . . . , �� |�� = � , θ) ���������

β� (�) = � � ≤ � ≤ � �����������

β�(�) =�∑�=�

�����(��+�)β�+�(�) � = − �, − �, . . . �

����� ������� ������� � γ�(�)

����������� � ���� �� ��� � �� �� ����� �� ���� �� �� �������

��� �� �����

γ�(�) = �(�� = � |� , θ) ��������

��� � ��� � �� ��� � �� ��������������� ������� �

γ�(�) =α�(�)β�(�

�(� |θ) =α�(�)β�(�)∑�

�=�α�(�)β�(�)

�∑�=�

γ�(�) = �

������������ �� � ����� ��� �� �� ����� ��

�� = �������

γ�(�) = �������

�(�� = � |� , θ)

����� ������� ������� � ξ�(� , �)

����������� � ���� �� ��� � �� �� ����� � ��� �� ��� � �� �� �����

� + �� ���� �� �� ������� ��� �� �����

ξ�(� , �) = �(�� = � , ��+� = � |� , θ) ��������

ξ�(� , �) =α�(�)�����(��+�)β�+�(�)

�(� |θ) =α�(�)�����(��+�)β�+�(�)∑�

�=�

∑��=�

α�(�)�����(��+�)β�+�(�)

�������

� �� �� ���� ��� ����� ��� ��� ��������� θ ���� ��������

�� �� � ���

� ��� �������� ���� ��� ����� ��������� ��� ��� ��

���� ��� ���� ����� ���������

��������

θ� = ������θ

�(� |θ)

� ���� θ � �� � ���������� �� � �� �� � �� ��

� ��� �������

� �� ��� �� � ���

� �� ��� ��� �� ������� ��� ��������

������� ������� �� ��� ������� � ���� �

�(θ, θ�) =∑�

��� �(� , � |θ) · �(� |� , θ�)

���������� � ��� �������� ���� ����� ��� ����� θ�

�(� , � |θ) = π(��) · ���(��) · ���,�� · ���(��) · ���,�� · . . . · ��� (�� )

�(� , � |θ) = �(��)�∏�=�

�(�� |��−�)�∏�=�

�(�� |��)

��� �(� , � |θ) = ��� �(��) +�∑�=�

��� �(�� |��−�) +�∑�=�

��� �(�� |��)

������� � �������� ��� ����

�(θ, θ�) =∑�

��� �(��)�(� |� , θ�)

+∑�

�∑�=�

��� �(�� |��−�)�(� |� , θ�)

+∑�

�∑�=�

��� �(�� |��)�(� |� , θ�)

= �� + �� + ��

��� � ����� � �� �� ������ ����������

������� ������ � � ��

�� =∑�

��� �(��|θ)�(� |� , θ�)

=∑

��,...,��

��� �(��|θ)�(��, . . . , �� |��, . . . , �� , θ�)

= . . .

=�∑�=�

��� �(�� = � |θ)�(�� = � |� , θ�)

=�∑�=�

��� π� · γ�(�)

������� ����������� � ��� ������ ������������ π�

�������� �� =�∑�=�

�� π� ·γ�(�) ��� � π� ����������∑�

π� = �

�� ������ ������ ��� ������ ���

∂π�

{�∑�=�

�� π� · γ�(�) + λ

(∑�

π� − �

)}= �

����� ��� ��� ������� ��� �� ��� ��� ������ �����∑

�γ�(�) = ��

π� = γ�(�)

������� ������ � � ��

�� =∑�

�∑�=�

��� �(�� |��−�)�(� |� , θ�)

= . . .

=�∑�=�

�∑�=�

�∑�=�

��� �(�� = � |��−� = �)�(�� = � , ��−� = � |� , θ�)

=�∑�=�

�∑�=�

��� ���

(∑�

ξ�(� , �)

)

������� ����������� � ��� ��������� ���������������

�� �������� �� ��� �� � ��� �

�� =�∑�=�

�∑�=�

(∑�

ξ�(� , �)

)��� ���

��������� ∑�

��� = �

���� �� �������� ���� ������

��� =

∑� ξ�(� , �)∑� γ�(�)

������������ ���� � �� ��� �������� ������� ������������������

��� =

∑� ξ�(� , �)∑� γ�(�)

��� =

∑� �(�� = � , ��+� = � |� , θ)∑

� �(�� = � |� , θ)

��� =�������� ���� �� � → � � ��������

�������� ���� �� � �������� � � ��� �

������ � �������� �� ��� �� � ������ � ��� ������ �� ���

������ �� � �������� �� �������� � �� ���������

������� ������ � � ��

�� =∑�

�∑�=�

��� �(�� |��)�(� |� , θ�)

�(�� |�� , θ) = �(�� |�� , µ�� , σ�� ) =�√

�πσ���

���

[− (�� − µ�� )

��

]

�� =∑�

�∑�=�

[−(�� − µ�� )�

��

− ��� σ��

]�(� |� , θ�)

=�∑�=�

�∑�=�

[−(�� − µ� )�

�σ�

− ��� σ�

]�(�� = � |� , θ�)

=�∑�=�

�∑�=�

[−(�� − µ� )�

�σ�

− ��� σ�

]γ�(�)

������� ����������� � ��� ������� �� ���������� ����������

�������� �� =�∑�=�

�∑�=�

[−(�� − µ� )�

�σ�

− � σ�

]γ�(�) �� � �� µ� , σ�

������� ������� ���������

∂µ�

= �∂

∂σ�= �

µ� =

∑�γ�(�)��∑�γ�(�)

σ�

� =γ�(�)(�� − µ� )

�∑�γ�(�)

������������ � ��� � ��� ����� ���������� �������������� ������� �����������

π� = γ�(�) ������� ����� ����������

��� =∑

�ξ�(� ,�)∑�γ�(�)

��������� ����������

µ� =∑

�γ�(�)��∑�γ�(�)

���� � � � ������� ����������

σ�

� =∑

�γ�(�)(��−µ� )

�∑�γ�(�)

�������� � � � ������� ������

��� �������� � ��� ����

�������� ��� ������ � � ������

�(θ|�) =�(� |θ) · �(θ)

�(�)������� � ��������

θ�+� = ������θ

[�(θ, θ�) + �� �(θ)] � ��

���� ��� � ���� ��� � ���� � � ��� � ��������� ����������

�(θ) ∝�∏

�=�

⎡⎣πη�−�

� �(τ� , ν� , α� , β� )�∏

�=�

�η��−�

��

⎤⎦

��� ����������� � ��� ����� ����������� �� ���������� ������� ����������

π� =(η� − �) + γ�(�)∑�

�=�(η� − �) + �

��� =(η�� − �) +

∑� ξ�(� , �)∑�

�=�(η�� − �) +

∑� γ�(�)

µ� =τ�ν� +

∑� γ�(�)��

τ� +∑

� γ�(�)

σ�

� =�β� + τ� (ν� − µ� )

� +∑

� γ�(�)(�� − µ� )�

(�α� − �) +∑

� γ�(�)

������������� ����� η� = �, τ� = �, ν� = �, α� = �/�, β� = �

��������� �

�(θ, � |�) = �(�,θ,�)�(�) = �(�,� |θ)·�(θ)

�(�)

���� � θ ���� ������� �(θ, � |�)�

θ = � ����θ

����

�(θ, � |�) = � ����θ

����

�(� , � |θ) · �(θ)

��� ��� ����������� �� � ��� θ ����� � ����� ��

������ ����� �(θ, � |�)�

��+� = � �����

�(� , � |θ�) ��� ��

θ�+� = � ����θ

�(� , ��+�|θ) · �(θ)

SMAP - ResultSix meningiomas analyzed on chr. 1 array

Deletions on

1q have not

been

described so

far in

meningioma

Analysis of 1p

will allow to

define a small

overlapping

region of

deletions

Thanks