MIT •
Sons So ns Voc ocai ais s do In Ingl glês ês Am Ame eri rica cano no
Existem mais de 40 sons vocais no inglês americano que podem ser classificados de acordo com a forma básica em que são produzidos. Class Classe e quanto quanto á forma forma
Número
Vogais
18
Fricativas
8
Oclusivas
6
Nasais
3
Semi vogais
4
Não fricativas
2
Aspiradas
1
•
Vogais e consoantes diferem no grau de contrição
•
Consoantes Sonoras não tem pressão na contrição
•
Consoantes Nasais permitem fluxo de ar na cavidade nasal
•
Consoantes contínuas não bloqueiam o fluxo de ar na cavidade oral
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
1
MIT
Produção das Vogais
•
Pouca contrição no trato vocal
•
Gera Geralm lmen ente te prod produz uzid ida a com com exci excita taçã ção o per perió iódi dica ca
•
Cara Caract cter erís ísti tica cas s Acús Acústi tica cas s depe depend ndem em da da posi posiçã ção o do max maxila ilar, r, lín língu gua ae lábios.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
2
MIT
Produção das Vogais
•
Pouca contrição no trato vocal
•
Gera Geralm lmen ente te prod produz uzid ida a com com exci excita taçã ção o per perió iódi dica ca
•
Cara Caract cter erís ísti tica cas s Acús Acústi tica cas s depe depend ndem em da da posi posiçã ção o do max maxila ilar, r, lín língu gua ae lábios.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
2
MIT
Vogais do Inglês Americano
•
Exist Existem em apr aprox oxim imad adam amen ente te 18 18 voga vogais is no no ingl inglês ês ame ameri rica cano no fei feito tos s de monotongos, monotongos, ditongos e vogais reduzidas.
•
Elas Elas são são freq freqüe üent ntem emen ente te des descr crit itas as med media iant nte e cara caract cter erís ísti tica cas s da articulação: Altas/Baixas Altas/Baixas,, Anteriores/Posteriore Anteriores/Posteriores s, Retroflexas Retroflexas,, Arredondadas,, e Tensas/Relaxadas Arredondadas Tensas/Relaxadas..
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
3
MIT Espectrograma das Principais Vogais
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
4
MIT
Médias dos Formantes de Vogais
•
Vogais são freqüentemente caracterizadas pelos três formantes mais baixos.
•
Alto/Baixo é correlacionado com o primeiro formante, F1.
•
Anterior/Posterior é correlacionado com o segundo formante, F2.
•
Retroflexão é marcada pelo terceiro formante, F3.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
5
MIT
Duração das Vogais
•
Cada vogal tem uma duração intrínseca diferente
•
As vogais reduzidas tem uma menor duração (50ms)
•
/I, E,
•
O contexto pode influenciar fortemente a duração das vogais
Λ,
U/ são os monotongos mais curtos
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
6
MIT
’ s b R o
Quadro de Vogais Pequeno e Feliz “Impreciso, mas mesmo assim útil.”
Anterior
Posterior Simples Anterior Reflexão
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
7
MIT
Produção de Fricativas
•
Turbulência produzida na contrição estreita.
•
A posição da contrição determina as características acústicas.
•
Pode ser produzida com excitação periódica.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
8
MIT
Fricativas do Inglês Americano
•
Existem 8 fricativas no inglês americano.
•
Quatro posições de articulação: Lábio-Dental (Labial), Inter-dental (Dental), Alveolar , e Palato-Alveolar (Palatal).
•
São freqüentemente descritas pelas características Sonoras/Surdas, ou Agudas/Não Agudas (contrição atrás da saliência alveolar).
Tipo
Surdas
6.345 Sistema de Reconhecimento de Voz
Sonora
Teoria Acústica da Produção de Voz
9
MITEspectrograma das Fricativas Surdas
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
10
MIT
Energia das Fricativas
Fricativas agudas tendem a ser mais fortes que as fricativas não agudas. 6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
11
MIT
Duração das Fricativas Surda Sonora
Fricativas sonoras tendem a ser mais curtas que as fricativas não sonoras. 6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
12
MIT Exemplos do Contraste das Fricativas Sonoras
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
13
MIT s b ’ o R
Um pequeno quadro amigável de Consoantes "Um pouco mais preciso, mas um pouco menos útil"
extremo extremo a v i s u l c O
extremo extremo
a v i t a c i r F
Surda, Sonora
6.345 Sistema de Reconhecimento de Voz
As africativas
Teoria Acústica da Produção de Voz
14
MIT
Qual é a palavra?
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
15
MIT
Produção de Oclusivas
•
Fechamento completo to trato vocal, aumento da pressão
•
Abandono repentino da contrição, ruído de turbulência
•
Pode ter excitação periódica durante o fechamento
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
16
MIT
Oclusivas do Inglês Americano
•
Existem 6 consoantes oclusivas no inglês americano.
•
Três posições de articulação: Labial, Alveolar , e Velar .
•
Cada posição de articulação tem uma oclusiva sonora e surda. Tipo
Sonoro
Não Sonoro
•
Oclusivas surdas são tipicamente aspirados.
•
Oclusivas sonoras geralmente exibem uma “voice-bar’’ durante o fechamento.
•
Informação acerca da transição e abandono dos formantes é útil para a classificação.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
17
MIT Espectrograma de Oclusivas Surdas
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
18
Exemplos do contraste na sonorização da oclusiva MIT
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
19
MITDuração da oclusiva de um único tom
•
Duração dos sonoros (Voice Onset Times - VOTs) são maiores que as oclusivas surdas.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
20
MITFormas de Sonorização para oclusivas Amplitude da rajada
a i c n ê ü q e r F
Duração
Duração da Vogal
Antes da emissão da voz
Energia nas freqüências baixas Tempo Freqüência Fundamental
Existem várias formas de sonorização para um stop. 6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
21
MIT
/s/-Durações das Oclusivas
Oclusivas surdas não são aspiradas em seqüências /s/ stop. 6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
22
MIT Exemplos de Velar Anterior/Posterior
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
23
MIT
Qual é a palavra?
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
24
MIT
Produção Nasal
•
Fluxo de ar através da cavidade nasal.
•
Consoantes produzidas mediante fechamento da cavidade oral.
•
Sons (murmúrios) semelhantes.
nasais
6.345 Sistema de Reconhecimento de Voz
tem
características
espectrais
Teoria Acústica da Produção de Voz
25
MIT •
Nasais do Inglês Americano
Três posições de articulação: Labial, Alveolar , e Velar .
Tipo
•
Consoantes nasais sempre acompanham uma vogal, e podem formar uma sílaba inteira ([ ņ], [m], [ŋ]).
•
/ ŋ / esta sempre após uma vogal em inglês.
•
A posição é identificada pelas transições dos formantes vizinhos.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
26
MIT
Espectrograma dos Nasais
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
27
MIT
Qual é a palavra?
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
28
MIT
Produção de semivogais
•
Constrição no trato vocal, não turbulência.
•
Movimento da articulação mais lento que os das outras consoantes.
•
Formas Laterais completo fechamento com a ponta da língua e fluxo de ar saindo pelos lados da contrição.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
29
MIT
Semivogais do Inglês Americano
•
Existem 4 semivogais no Inglês Americano
•
As vezes referidas como Líquidas ou Deslizante Tipo
Semivogal
Vogal mais próxima
Deslizante
Líquida
•
As deslizantes tem uma articulação maior que a de uma vogal; – Similar posição dos formantes, muito embora mais extrema; – Geralmente mais fraca devido á contrição mais estreita.
•
Semivogais estão sempre acompanhadas por vogais, muito embora /l/ pode formar uma silaba inteira ([ ļ])
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
30
MIT
Espectrograma de Semivogais
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
31
MITPropriedades acústicas das Semivogais •
/w/ e /l/ são as semi vogais que mais se confundem.
•
/w/ é caracterizado por F1 e F2 bem baixos. – Tipicamente um rápida caída acima de F2.
•
/l/ é caracterizado por um baixo F1 e F2. – Freqüentemente há presença de alta energia. – /l/ após vogal é caracterizado por uma mínima descontinuidade. espectral, movimento gradual dos formantes.
•
/y/ caracterizado por um F1 muito baixo, e um F2 muito alto. – /y/somente ocorre em uma sílaba quando antes de vogal.
•
/r/ é caracterizado por um F3 muito baixo. – F3 Pré-vocálico
<
F3 mediano
6.345 Sistema de Reconhecimento de Voz
<
F3 Pós-vocálico.
Teoria Acústica da Produção de Voz
32
MIT
Qual é a palavra?
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
33
MIT •
Produção de Não fricativas
Existem duas não fricativas no Inglês Americano: Sonoro
Surda
•
Pares Alveolar-oclusiva palatal-fricativa.
•
Abandono repentino da contrição, ruído de turbulência.
•
Pode haver excitação periódica durante o fechamento.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
34
MIT
Produção Aspirante
•
Existe um aspirante no Inglês Americano: /h/ (ex., “hat’’).
•
Produzido mediante geração de excitação turbulenta na glote.
•
Não há contrição no trato vocal, excitação normal do formante.
•
Acoplamento Subglotal resulta em pequena energia na região F1.
•
Excitação Periódica pode estar presente na posição mediana.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
35
MIT Espectrograma de Não Fricativas e Aspirantes
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
36
MIT
Qual é a palavra?
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
37
MIT
Limitações Fonotáticas
•
Fonotática é o estudo da seqüência permitida de sons
•
Análise da palavra inicial e final de aglomerados (clusters) revela: – 73 aglomerados iniciais distintos (cerca de 10 aglomerados “estrangeiros’’); – 208 aglomerados finais.
•
Podem ser usados para eliminar seqüências impossíveis de fonemas: – /tk/ não pode terminar uma palavra, e – /kt/ não pode iniciar uma palavra, – Portanto, */: : : t k t : : :/é uma seqüência impossível.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
38
MIT
Consoantes Iniciais de Palavras a Partir do Dicionário MWP
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
39
MIT •
A sílaba
A estrutura das sílabas captura muitas generalizações úteis. – A realização de fonemas depende muitas vezes das sílabas. – Muitas regras fonológicas dependem da estrutura das sílabas.
•
A estrutura das sílabas se baseia na noção do posicionamento dos sons da voz em termos de seus valores de sonoridade. Sons Vogais Baixas
Valores de Sonoridade
Exemplos
Vogais Médias Vogais Altas Flaps Lateral Nasais Fricativas sonoras Fricativas surdas Oclusivas sonoras Oclusivas surdas 6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
40
MIT
Sílabas e Sonoridade
•
Expressões podem ser divididas em sílabas.
•
O número de sílabas é igual ao número de picos de sonoridade.
•
Dentro de qualquer sílaba, existe um segmento constituindo um pico de sonoridade que é precedido e/ou seguido por uma seqüência de segmentos com valores de sonoridade que decrescem progressivamente.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
41
MIT
Representação Silábica
•
Ramos marcados por _ são opcionais.
•
Núcleos devem conter um não ocluisva.
•
A sonoridade decresce a partir do núcleo.
•
Um _x contém somente: /s, z, t, d, T, D, C, J/.
•
Somente a última sílaba de uma palavra pode ter um _x.
•
/sp/, /st/, e /sk/ são tratados como únicos obstruente.
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
42
MIT
Alguns Exemplos
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
43
MIT
Palavras contendo /r/ e /l/
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
44
MIT
Realização Acústica do /r/
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
45
MIT
Realização Acústica do /l/
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
46
MIT Variações alofônicas nos contornos silábicos
6.345 Sistema de Reconhecimento de Voz
Teoria Acústica da Produção de Voz
47