Fala disfarçada e imitada: uma análise da capacidade de identificação de falante

46
Fala disfarçada e imitada: uma análise da capacidade de identificação de falante Maria Lúcia Gomes (UTFPR) [email protected] Denise Cristina Kluge (UFPR) [email protected] LINGUAGEM E DIREITO CONSTRUINDO PONTES

Transcript of Fala disfarçada e imitada: uma análise da capacidade de identificação de falante

Fala disfarçada e imitada: uma análise da capacidade de identificação de falante

Maria Lúcia Gomes (UTFPR) [email protected]

Denise Cristina Kluge (UFPR) [email protected]

LINGUAGEM E DIREITO – CONSTRUINDO PONTES

Grupo de pesquisa interdisciplinar

Estudo dos sons da fala – CNPq

Linha de pesquisa – fonética forense

Grupo

Professores UTFPR e UFPR

Peritas – ICR

Alunos – UTFPR, UFPR, Tuiuti

Áreas

Linguística

Fonoaudiologia

Engenharia

Sistema de Informação

Música

Pesquisas - disfarce

Análise perceptual e acústica das vogais em voz normal e disfarçada(Gillier, 2008; Künzel, 2000; Eriksson, 2010).

Participantes: 50 adultos

5 grupos de 10 pessoas cada

GH: 10 homens de 30-55 anos

GM: 10 mulheres de 30-55 anos

GR: 10 rapazes de 18-25 anos

GG: 10 garotas de 18-25 anos

CG: 10 mulheres pesquisadoras de 25-55 anos

Objetivos

O principal objetivo foi iniciar uma série de pesquisas em fonética forense.

Objetivos da pesquisa de produção: Analisar a qualidade vocal e a estratégia de disfarce de

acordo com o VPAS (Laver, 1980) – VPAS PB (Camargo & Madureira, 2008)

Examinar quatro correlatos acústicos de identificação da vogal no português brasileiro (Boersma et al, 2009) em voz normal e disfarçada.

Duração

Frequência fundamental– F0

Primeiro formante – F1

Segundo formante – F2

Análise de Voz

(Laver, 1980; Camargo & Madureira, 2008)

Objetivo da pesquisa de percepção

O objetivo é verificar se um grupo de ouvintes consegue identificar falantes ao produzirem fala normal, disfarçada e imitada.

Estratégias escolhidas: protrusão labial, mandíbula aberta, voz áspera.

Grupo de ouvintes

10 mulheres Idade entre 19-46 anos, média 26,8 Estudantes de Letras Falantes de PB e inglês

Imitação

Foi gravado um imitador profissional de Curitiba produzindo dados de fala copiados de duas personalidades famosas (retirados do youtube). Para este trabalho vamos usar apenas um deles.

Tratamento dos dados do imitador

Espectrogramas originais

Tratamento dos dados do imitador

Corte de frequências do arquivo do imitador: Adobe audition 3.0

effecfts\filter and qp\scientific filters (butterworth) - band pass - 5 a 5000Hz

effects\reverb\convolution reverb - ok

Juntados os dois arquivos em um terceiro

Não dando certo o normalize, foi aplicado em separado, diminuindo a amplitude do INRI:

effects\amplify\ -10dB (em cada canal)

Tratamento dos dados do imitador

transformado em mono e modificada a taxa de amostragem:

edit\convert sample type<sample rate: 32KHz, mono, 8 bits>

resultado final:

Gravação dos estímulos: Testes fala original e imitada

Fala original: Inri Cristo

Fala imitada: Imitador profissional

Os estímulos foram gravados em um estúdio com tratamento acústico, usando o software Audacity.

Gravação dos estímulos: Testes fala normal e disfarçada

Corpus: Leitura de um texto de telefonema pedindo resgate em uma simulação de sequestro, em fala normal e fala disfarçada

Falantes: 4 homens (2 do GH e 2 do GR) e 4 mulheres (2 do GM e 2 do GG)

(Usamos o H4, H5, M5 e M6 para voz áspera; M1 e M3 para Protrusão labial e H1, H2 para mandíbula aberta.

Os estímulos foram gravados em um estúdio com tratamento acústico, usando o software Audacity.

Teste de Discriminação: Fala Normal x Fala Disfarçada (Voz Áspera)

Frase: Alô, quero falar com a Dona Teca.

Falantes: 2 homens (H4, H5) e 2 mulheres (M5, M6)

16 sequências x 2 sexos de falantes= 32 itens

H4N H4N H4N H4D H4N H5N H4N H5D

H4D H4D H4D H4N H5N H4N H5D H4N

H5N H5N H5N H5D H4D H5D H5N H4D

H5D H5D H5N H5D H5D H4D H4D H5N

Participantes tinham que indicar se as duas frases que eles ouviam eram faladas pela mesma pessoa ou por pessoas diferentes.

Teste de Discriminação: Fala Normal x Fala Disfarçada (Protrusão Labial)

Frase: Alô, quero falar com a Dona Teca.

Falantes: 2 mulheres (M1, M3)

16 sequências x 2 repetições= 32 itens

M1N M1N M1N M1D M1N M3N M1N M3D

M1D M1D M1D M1N M3N M1N M3D M1N

M3N M3N M3N M3D M1D M3D M3N M1D

M3D M3D M3N M3D M3D M1D M1D M3N

Participantes tinham que indicar se as duas frases que eles ouviam eram faladas pela mesma pessoa ou por pessoas diferentes.

Teste de Discriminação: Fala Normal x Fala Disfarçada (Mandíbula Aberta)

Frase: Alô, quero falar com a Dona Teca.

Falantes: 2 homens (H1, H2)

16 sequências x 2 repetições = 32 itens

H2N H2N H2N H2D H2N H1N H2N H1D

H2D H2D H2D H2N H1N H2N H1D H2N

H1N H1N H5N H1D H2D H1D H1N H2D

H1D H1D H5N H1D H1D H2D H2D H1N

Participantes tinham que indicar se as duas frases que eles ouviam eram faladas pela mesma pessoa ou por pessoas diferentes.

Teste de Discriminação: Fala Original x Fala Imitada

Corpus: (1) e a delinquência será extinta; (2) Deus, nosso pai; (3) Graças Senhor

Falantes: Inri Cristo (IC) e Imitador (Im)

8 sequências x 3 frases = 24 itens

Im_IC_IC IC_IC_Im Im_IC_Im IC_IC_IC

IC_Im_IC IC_Im_Im Im_Im_IC Im_Im_Im

Participantes ouviam sequências de 3 frases e tinham que indicar qual frase era falada por um falante diferente (1, 2 ou 3); ou se todas eram do mesmo falante. Tinham possibilidade de ouvir a sequência 2 vezes antes de responder.

Teste de Identificação: Fala Original x Fala Imitada

Corpus: (1) único Senhor do Céu e da Terra; (2) Deus, nosso pai; (3) um só Senhor no Céu e na Terra.

Falantes: Inri Cristo (IC) e Imitador (Im)

4 sequências x 3 frases x 2 repetições = 24 itens

Im_IC_IC IC_IC_Im Im_IC_Im IC_IC_IC

IC_Im_IC IC_Im_Im Im_Im_IC Im_Im_Im

Participantes ouviam sequências de 2 frases e tinham que indicar qual frase era falada pelo falante original (Inri Cristo): “1” se a primeira; “2” se a segunda; “ambas” se as duas; e “nenhuma”, se nenhuma das duas.

Coleta de dados

A coleta de dados ocorreu em novembro de 2013 em uma sala isolada.

Os dados foram coletados individualmente pelas pesquisadoras em um laptop utilizando o programa TP versão 3 (Rato, Rauber, Kluge & Santos).

As participantes levaram de 20-25minutos para fazerem os testes.

Instruções foram dadas oralmente em português.

Procedimento

1. Instruções e teste de familiarização

2. Teste de Discriminação Voz áspera x Fala normal

3. Instruções e teste de familiarização

4. Teste de Discriminação Protrusão Labial x Fala normal

5. Instruções e teste de familiarização

6. Teste de Discriminação Mandíbula aberta x Fala normal

7. Instruções e teste de familiarização

8. Teste de Discriminação Fala original e imitada

9. Instruções e teste de familiarização

10. Teste de Identificação: fala original x fala imitada

Análise de dados

Discriminação Fala disfarçada x Fala normal: 32 itens x 10 participantes= 320 respostas por estratégia x 3 estratégias= 960 respostas

Discriminação Fala original e imitada: 24 itens x 10 participantes= 240 respostas

Identificação: fala original x fala imitada: 24 itens x 10 participantes= 240 respostas

Análise estatística

Dados não paramétricos

Design intra sujeito

Testes utilizados :

(1) Wilcoxon (2 momentos);

(2) Friedman (3 momentos)

SPSS versão 18.0.

Nível de significância (p): .05

Resultados: Fala Original x Fala Imitada (%)

Teste Identificação Teste Discriminação

Contraste Sem

Contraste

Tot Contraste Sem

Contraste

Tot

1 83 75 79 100 100 100

2 83 75 79 100 100 100

3 50 58 54 100 100 100

4 75 58 66 94 83 88

5 67 50 58 83 100 91

6 58 67 62 89 83 86

7 100 92 96 94 100 97

8 67 58 62 39 50 69

9 42 50 46 100 100 100

10 92 75 83 100 100 100

TO 72 66 68 90 92 91

DP 18 13 15 19 16 17

Resultados: Fala Original x Fala Imitada (%)

Teste de Identificação

Com contraste x Sem contraste: não significativo

Teste de Discriminação

Com contraste x Sem contraste: não significativo

Resultados: Fala Original x Fala Imitada (%)

Teste de Identificação x Teste de Discriminação: significativo

(Z=-2,499, p=,012)

Os resultados indicam que os participantes deste estudo têm mais dificuldade em identificar a fala original (68%) do que discriminar a fala original da imitada (93%).

Resultados Testes Fala Normal x Fala Disfarçada (%)

VOZ ASPERA x VOZ NORMAL

Mesma pessoa Pessoas Diferentes Total

1 81 94 87

2 81 81 81

3 87 87 87

4 87 75 81

5 50 87 68

6 94 94 94

7 87 81 84

8 37 100 68

9 81 75 78

10 87 56 71

TO 77 83 80

DP 18 13 9

Resultados Fala Normal x Fala Disfarçada: Voz Áspera

Mesma pessoa x Pessoa diferente:

não significativo

Resultados Testes Fala Normal x Fala Disfarçada (%)

MANDÍBULA ABERTA x VOZ NORMAL

Mesma pessoa Pessoas Diferentes Total

1 69 94 81

2 50 81 65

3 75 69 72

4 87 81 84

5 87 100 93

6 100 87 93

7 100 94 97

8 75 87 81

9 81 87 84

10 75 87 81

TO 80 87 83

DP 15 9 10

Resultados Fala Normal x Fala Disfarçada: Mandíbula Aberta

Mesma pessoa x Pessoa diferente:

não significativo

Resultados Testes Fala Normal x Fala Disfarçada (%)

PROTRUSÃO LABIAL x VOZ NORMAL

Mesma pessoa Pessoas Diferentes Total

1 69 75 72

2 62 87 74

3 69 75 72

4 100 62 81

5 94 87 90

6 87 62 74

7 69 87 78

8 50 75 62

9 56 50 53

10 100 50 75

TO 76 71 73

DP 18 14 10

Resultados Fala Normal x Fala Disfarçada: Protrusão Labial

Mesma pessoa x Pessoa diferente:

não significativo

Resultados Testes Fala Normal x Fala Disfarçada (%)

FALA DISFARÇADA x VOZ NORMAL

Voz Áspera Mandíbula Aberta Protrusão

Labial

1 87 81 72

2 81 65 74

3 87 72 72

4 81 84 81

5 68 93 90

6 94 93 74

7 84 97 78

8 68 81 62

9 78 84 53

10 71 81 75

TO 80 83 73

DP 9 10 10

Resultados Fala Normal x Fala Disfarçada

Voz Áspera x Mandíbula Aberta x

Protrusão Labial: significativo

Friedman (χ2(2, N=10)= 6,158 , p= ,046)

Mandíbula Aberta x Protrusão Labial: significativo

Voz Áspera x Mandíbula Aberta e Voz Áspera x Protrusão Labial: não significativo

Resultados Fala Normal x Fala Disfarçada

Mandíbula Aberta x Protrusão Labial: significativo (Z=-2,144, p=,032) (Wilcoxon)

Voz Áspera x Mandíbula Aberta e Voz Áspera x Protrusão Labial: não significativo

Resultados Fala Normal x Fala Disfarçada

Para este estudo, o disfarce com a mandíbula aberta foi a estratégia em que os participantes discriminaram o falante com mais facilidade , mas somente se comparado com o disfarce de protrusão labial.

Ou, disfarce com protrusão labial foi a estratégia em que os participantes discriminaram o falante com menos facilidade, mas somente se comparado com a estratégia de mandíbula aberta.

Conclusão: Percepção de falante comparando fala original e imitada

Os resultados estatísticos indicam que os participantes deste estudo têm mais dificuldade em identificar a fala original do que discriminar a fala original da imitada.

Conclusão: Percepção de falante comparando fala normal e disfarçada

Das três estratégias, disfarce com protrusão labial foi a estratégia em que os participantes discriminaram o falante com mais dificuldade, mas somente se comparado com a estratégia de mandíbula aberta.

Limitações e Sugestões

Poucos participantes ouvintes.

Apenas uma voz original e imitada.

Grupos de participantes ouvintes com outras características.

Analisar separadamente a percepção de voz feminina e masculina (estímulos).

Analisar grupos de ouvintes de homens e mulheres.

Limitações e Sugestões

Investigar outras estratégias na fala disfarçada.

Agradecimentos

Denise Carneiro – tratamento dos áudios

Joice – dados do imitador

Carolina, Daniel, Maria Ligia, Robinson, Woryk – etiquetagem

Referências

Camargo, Z. & Madureira, S. (2008). Voice quality analysis from a phonetic perspective: Voice Profile Analysis Scheme Profile for Brazilian Portuguese (BP-VPAS). Proceedings of the Fourth Conference on Speech Prosody. Eriksson, A. (2010). The Disguised Voice: Imitating Accents or Speech

Styles and Inpersonating Individuals. Language and Identities., 80-86.

Edinburgh: Kapitel.

Escudero, P, Boersma, P., Rauber, A-S & Bion, R-A. (2009). A cross-

dialect acoustic description of vowels: Brazilian and European Portuguese.

J. Acoust. Soc. Am., 126, 1379–1393.

Gillier, R. (2011). O Disfarce de Voz em Fonética Forense. Master Thesis,

Departamento de Linguística Geral e Românica, Faculdade de Letras,

Universidade de Lisboa.

Laver, J. (1980). The Phonetic Description of Voice Quality. Cambridge

University Press.