Download - Análisis oscilográfico

Análisis oscilográfico

Juan Byron

Resumen

En principio se indican algunos de los programas que permiten llevar a cabo el análisis

oscilográfico. A continuación se caracteriza el oscilograma. Posteriormente, se señala

qué clase de información presentan los oscilogramas y la utilidad de este tipo de

análisis. Finalmente, se presentan muestras de oscilogramas o formas de onda

obtenidas mediante los programas Speech Analyzer, Speech Filing System (SFS),

WaveSurfer y Praat.

Palabras clave: programas de análisis del habla, presión del aire, sonoridad,

intensidad, cruces por cero positivos o negativos.

El oscilográfico es uno de los análisis que pueden realizarse utilizando

programas de análisis del habla como el Speech Analyzer, el WaveSurfer, el

Praat, el Speech Filing System o cualquier otro que pueda conseguirse en

internet. Estos programas permiten la obtención de oscilogramas a partir de

muestras de habla, grabadas con un micrófono u obtenidas de un disco

compacto, DVD, memoria USB, grabadora digital, disco duro interno o externo,

o tarjeta de televisión integrada a la computadora mediante una ranura PCI.

El oscilograma es una representación de las desviaciones (positivas y negativas)

del promedio de la presión del aire en puntos sucesivos del tiempo. En la

dimensión horizontal (de izquierda a derecha) se representa el tiempo y en la

dimensión vertical (de abajo arriba) se representa la presión del aire.

Los oscilogramas o formas de onda (waveform) proporcionan información sobre

la sonoridad relativa de los sonidos del habla, de su intensidad y de su duración.

La utilidad del oscilograma radica en la posibilidad de una delimitación más o

menos precisa de los segmentos consonánticos y vocálicos, sobre todo si se

toma en cuenta los cruces por cero positivos o cruces por cero negativos de las

ondas lingüísticas.

Si bien se dice que es sumamente difícil “leer” un oscilograma, lo cierto es que,

con cierto entrenamiento, es posible distinguir los sonidos periódicos de los

aperiódicos y los interruptos de los continuos.

La figura 1 muestra un oscilograma o forma de onda de la secuencia cuántas

casas [kwáņtas kásas], obtenido con el programa de análisis del habla Speech

Analyzer. Lo que, en principio, se nota es que hay ondas caracterizadas por

líneas verticales, que corresponden a pulsos de energía asociados con sonidos

periódicos, que presentan un patrón repetitivo. Estos sonidos son generados por

la vibración de las cuerdas vocales.

Por el contrario, las ondas que no presentan líneas verticales son ondas

aleatorias, que carecen de estructura repetitiva, y se consideran sonidos

aperiódicos. Como se puede notar son ondas más oscuras que las periódicas.

Entre estas ondas oscuras hay diferencias. Hay algunas que presentan una

duración muy breve y una baja intensidad. Estas son las ondas que corresponden

a la fase explosiva de las consonantes [k] y [t].

En tanto, otras ondas oscuras poseen una duración mayor y una intensidad más

grande. Estas son las ondas que corresponden a la consonante [s]. Un segmento

correspondiente a la segunda [s], que es la primera de casas, se señala mediante

líneas verticales, que marcan los límites de este segmento consonántico.

De modo que, pese a la dificultad, es posible la identificación de determinados

sonidos en un oscilograma. Además, mediante la ampliación (zoom) que

permiten los programas, es mucho más fácil el establecimiento de los límites de

los segmentos vocálicos y consonánticos, y la determinación prima facie de la

intensidad de estos sonidos.

Fig.1 Oscilograma de la secuencia cuántas casas.

En la figura 2 mostramos el oscilograma de la secuencia era sencillamente [éra

sensíyaméņte]. En este caso, para lograr el oscilograma, se ha utilizado el

programa Speech Filing System (SFS). De nuevo se han empleado las líneas

verticales para marcar los límites de un sonido aperiódico. Se trata de la primera

consonante [s] de la palabra sencillamente. La otra [s] aparece transcrita

ortográficamente con el grafema o letra “c”, ya que se trata de un informante

dominicano, que, al igual que la mayoría de los hispanoamericanos y los

hablantes del Sur de España, no realizan la consonante fricativa interdental oral

sorda o áfona [θ], sino solo la fricativa alveolar oral sorda [s], fenómeno que se

conoce como “seseo”.

Fig. 2 Oscilograma de la secuencia era sencillamente.ç

En la figura 3 se muestra un oscilograma de la secuencia como lo(s) metale(s)

[komo lo metáleh]. Como se puede observar, en el gráfico no aparece la onda

aperiódica que se veía en los oscilogramas anteriores. La razón es que el

informante dominicano no ha realizado la primera fricativa dorsoalveolar de la

secuencia, fenómeno que se conoce como elisión de la [s] en posición implosiva

en el español dominicano, en tanto que ha realizado la fricativa dorsoalveolar

sorda final como una débil aspiración [h]. En esta ocasión, para lograr el

oscilograma, se ha empleado el programa WaveSurfer.

Fig. 3 Oscilograma de la secuencia como lo(s) metale(s).

En la figura 4 se muestra el oscilograma de la palabra dantesco [daņtésko]. El

programa usado en este caso para obtener el oscilograma es el Praat. El

informante es un hablante hispanoamericano de sexo femenino.

En el gráfico es posible notar la onda periódica correspondiente a la barra de

sonoridad de la [d], consonante que es muy breve en su fase de explosión.

Apenas se nota en el oscilograma.

El segmento siguiente es el sonido periódico [a], seguido por el sonido nasal

alveolar [n]. Luego aparece una ausencia de energía (gap) o ventana silente, que

corresponde a la fase oclusiva de la consonante [t], cuya fase explosiva se

observa en el oscilograma como una onda oscura.

A esta consonante sigue el sonido periódico [e], que se distingue claramente por

encontrarse en el centro del oscilograma, entre la aperiódica interrupta [t] y la

aperiódica continua [s], que aparece sombreada. La intensidad y duración de

esta última consonante son visibles, en comparación con la aperiódica [t] y la

aperiódica [k].

La onda de la [k] aparece detrás de la [s]. Lo primero que se distingue es su fase

oclusiva o ausencia de energía (gap), señalada en cada caso con una flecha. Esta

fase oclusiva es seguida por la fase de explosión, que aparece como una onda

oscura de breve duración y poca intensidad.

Finalmente, se observa la onda periódica de la vocal posterior media [o].

Fig. 4 Oscilograma de la palabra dantesco

En la figura 5 se observan unas líneas verticales que corresponden a los pulsos.

Estas líneas solo se sitúan sobre los sonidos periódicos del oscilograma (barra de

sonoridad de la [d], vocal [a], nasal dental [ņ], vocal [e] y vocal [o]. No se

colocan sobre los sonidos aperiódicos (consonantes [t], [s] y [k]).

Fig. 5. Oscilograma que muestra los pulsos situados sobre los sonidos periódicos de la

palabra dantesco.

Fig. 6. Oscilograma de la palabra acto.

Un oscilograma de la palabra acto [ákto] se presenta en la figura 6. En el gráfico

se observan dos sonidos periódicos: el primero es la central baja [a], y el final, la

posterior media [o]. Como se puede apreciar en el gráfico, hay dos fases de

oclusión: la primera corresponde a la consonante velar sorda [k] en posición

posnuclear, en tanto que la segunda corresponde a la dental sorda o áfona en

posición prenuclear.

Otro oscilograma se presenta en la figura 7. En este caso, el gráfico presenta la

secuencia el chubasco [el ĉuβásko], realizada por un hablante hispanoamericano

de sexo femenino. La banda vertical gris señala la africada sorda [ĉ], sonido

compuesto por una oclusión y una fricación.

Fig. 7. Oscilograma de la secuencia el chubasco.

En la figura 8 se presenta otro oscilograma. En este caso, es la representación de

la secuencia [(komp)aňeɾítos] (comp)añeritos, realizada por una comunicadora

puertorriqueña. Como es posible apreciar la secuencia consta de ocho

segmentos: cuatro vocales y cuatro consonantes. En el gráfico, cabe destacar la

fase oclusiva de la interrupta dental áfona [t], que dura 52 milisegundos, así

como la fricativa predorsoalveolar áfona, que dura 140 milisegundos. Esta

consonante, que aparece señalada con una banda vertical gris, es el segmento de

mayor duración.

Fig. 8. Oscilograma de la secuencia (comp)añeritos.

Conclusión

Los oscilogramas son visualizaciones de las variaciones positivas y negativas de

las ondas lingüísticas a lo largo del tiempo. En la dimensión horizontal (de

izquierda a derecha) se representa el tiempo y en la dimensión vertical (de abajo

arriba) se representa la presión del aire.

Los oscilogramas permiten mediciones más o menos precisas de los segmentos

vocálicos y consonánticos, y también permiten prima facie apreciar la intensidad

de los sonidos.

Referncias

Baart, Joan. 2010. A Field Manual of Acoustic Phonetic. SIL International, Dal-

las, Texas.

Byron, J. 2012. Manual de fonética acústica. Ed. Somos Literatura, Santo Do-

mingo.

Denes, P. y Pinson, E. 1973. The Speech Chain: The Physics and Biology of

Spoken Language. Anchor Books, New York.

Malmberg, B. 1964. La fonética. EUDEBA, Buenos Aires.

Malmberg, Bertil. 1974. Lingüística estructural y comunicación humana. Gre-

dos, Madrid.

Martínez, E. 2007. Análisis espectrográfico de los sonidos del habla. Ariel, Bar-

celona.

Quilis, A. 1981. Fonética acústica de la lengua española. Ed. Gredos, Madrid