Análisis oscilográfico
Juan Byron
Resumen
En principio se indican algunos de los programas que permiten llevar a cabo el análisis
oscilográfico. A continuación se caracteriza el oscilograma. Posteriormente, se señala
qué clase de información presentan los oscilogramas y la utilidad de este tipo de
análisis. Finalmente, se presentan muestras de oscilogramas o formas de onda
obtenidas mediante los programas Speech Analyzer, Speech Filing System (SFS),
WaveSurfer y Praat.
Palabras clave: programas de análisis del habla, presión del aire, sonoridad,
intensidad, cruces por cero positivos o negativos.
El oscilográfico es uno de los análisis que pueden realizarse utilizando
programas de análisis del habla como el Speech Analyzer, el WaveSurfer, el
Praat, el Speech Filing System o cualquier otro que pueda conseguirse en
internet. Estos programas permiten la obtención de oscilogramas a partir de
muestras de habla, grabadas con un micrófono u obtenidas de un disco
compacto, DVD, memoria USB, grabadora digital, disco duro interno o externo,
o tarjeta de televisión integrada a la computadora mediante una ranura PCI.
El oscilograma es una representación de las desviaciones (positivas y negativas)
del promedio de la presión del aire en puntos sucesivos del tiempo. En la
dimensión horizontal (de izquierda a derecha) se representa el tiempo y en la
dimensión vertical (de abajo arriba) se representa la presión del aire.
Los oscilogramas o formas de onda (waveform) proporcionan información sobre
la sonoridad relativa de los sonidos del habla, de su intensidad y de su duración.
La utilidad del oscilograma radica en la posibilidad de una delimitación más o
menos precisa de los segmentos consonánticos y vocálicos, sobre todo si se
toma en cuenta los cruces por cero positivos o cruces por cero negativos de las
ondas lingüísticas.
Si bien se dice que es sumamente difícil “leer” un oscilograma, lo cierto es que,
con cierto entrenamiento, es posible distinguir los sonidos periódicos de los
aperiódicos y los interruptos de los continuos.
La figura 1 muestra un oscilograma o forma de onda de la secuencia cuántas
casas [kwáņtas kásas], obtenido con el programa de análisis del habla Speech
Analyzer. Lo que, en principio, se nota es que hay ondas caracterizadas por
líneas verticales, que corresponden a pulsos de energía asociados con sonidos
periódicos, que presentan un patrón repetitivo. Estos sonidos son generados por
la vibración de las cuerdas vocales.
Por el contrario, las ondas que no presentan líneas verticales son ondas
aleatorias, que carecen de estructura repetitiva, y se consideran sonidos
aperiódicos. Como se puede notar son ondas más oscuras que las periódicas.
Entre estas ondas oscuras hay diferencias. Hay algunas que presentan una
duración muy breve y una baja intensidad. Estas son las ondas que corresponden
a la fase explosiva de las consonantes [k] y [t].
En tanto, otras ondas oscuras poseen una duración mayor y una intensidad más
grande. Estas son las ondas que corresponden a la consonante [s]. Un segmento
correspondiente a la segunda [s], que es la primera de casas, se señala mediante
líneas verticales, que marcan los límites de este segmento consonántico.
De modo que, pese a la dificultad, es posible la identificación de determinados
sonidos en un oscilograma. Además, mediante la ampliación (zoom) que
permiten los programas, es mucho más fácil el establecimiento de los límites de
los segmentos vocálicos y consonánticos, y la determinación prima facie de la
intensidad de estos sonidos.
Fig.1 Oscilograma de la secuencia cuántas casas.
En la figura 2 mostramos el oscilograma de la secuencia era sencillamente [éra
sensíyaméņte]. En este caso, para lograr el oscilograma, se ha utilizado el
programa Speech Filing System (SFS). De nuevo se han empleado las líneas
verticales para marcar los límites de un sonido aperiódico. Se trata de la primera
consonante [s] de la palabra sencillamente. La otra [s] aparece transcrita
ortográficamente con el grafema o letra “c”, ya que se trata de un informante
dominicano, que, al igual que la mayoría de los hispanoamericanos y los
hablantes del Sur de España, no realizan la consonante fricativa interdental oral
sorda o áfona [θ], sino solo la fricativa alveolar oral sorda [s], fenómeno que se
conoce como “seseo”.
Fig. 2 Oscilograma de la secuencia era sencillamente.ç
En la figura 3 se muestra un oscilograma de la secuencia como lo(s) metale(s)
[komo lo metáleh]. Como se puede observar, en el gráfico no aparece la onda
aperiódica que se veía en los oscilogramas anteriores. La razón es que el
informante dominicano no ha realizado la primera fricativa dorsoalveolar de la
secuencia, fenómeno que se conoce como elisión de la [s] en posición implosiva
en el español dominicano, en tanto que ha realizado la fricativa dorsoalveolar
sorda final como una débil aspiración [h]. En esta ocasión, para lograr el
oscilograma, se ha empleado el programa WaveSurfer.
Fig. 3 Oscilograma de la secuencia como lo(s) metale(s).
En la figura 4 se muestra el oscilograma de la palabra dantesco [daņtésko]. El
programa usado en este caso para obtener el oscilograma es el Praat. El
informante es un hablante hispanoamericano de sexo femenino.
En el gráfico es posible notar la onda periódica correspondiente a la barra de
sonoridad de la [d], consonante que es muy breve en su fase de explosión.
Apenas se nota en el oscilograma.
El segmento siguiente es el sonido periódico [a], seguido por el sonido nasal
alveolar [n]. Luego aparece una ausencia de energía (gap) o ventana silente, que
corresponde a la fase oclusiva de la consonante [t], cuya fase explosiva se
observa en el oscilograma como una onda oscura.
A esta consonante sigue el sonido periódico [e], que se distingue claramente por
encontrarse en el centro del oscilograma, entre la aperiódica interrupta [t] y la
aperiódica continua [s], que aparece sombreada. La intensidad y duración de
esta última consonante son visibles, en comparación con la aperiódica [t] y la
aperiódica [k].
La onda de la [k] aparece detrás de la [s]. Lo primero que se distingue es su fase
oclusiva o ausencia de energía (gap), señalada en cada caso con una flecha. Esta
fase oclusiva es seguida por la fase de explosión, que aparece como una onda
oscura de breve duración y poca intensidad.
Finalmente, se observa la onda periódica de la vocal posterior media [o].
Fig. 4 Oscilograma de la palabra dantesco
En la figura 5 se observan unas líneas verticales que corresponden a los pulsos.
Estas líneas solo se sitúan sobre los sonidos periódicos del oscilograma (barra de
sonoridad de la [d], vocal [a], nasal dental [ņ], vocal [e] y vocal [o]. No se
colocan sobre los sonidos aperiódicos (consonantes [t], [s] y [k]).
Fig. 5. Oscilograma que muestra los pulsos situados sobre los sonidos periódicos de la
palabra dantesco.
Fig. 6. Oscilograma de la palabra acto.
Un oscilograma de la palabra acto [ákto] se presenta en la figura 6. En el gráfico
se observan dos sonidos periódicos: el primero es la central baja [a], y el final, la
posterior media [o]. Como se puede apreciar en el gráfico, hay dos fases de
oclusión: la primera corresponde a la consonante velar sorda [k] en posición
posnuclear, en tanto que la segunda corresponde a la dental sorda o áfona en
posición prenuclear.
Otro oscilograma se presenta en la figura 7. En este caso, el gráfico presenta la
secuencia el chubasco [el ĉuβásko], realizada por un hablante hispanoamericano
de sexo femenino. La banda vertical gris señala la africada sorda [ĉ], sonido
compuesto por una oclusión y una fricación.
Fig. 7. Oscilograma de la secuencia el chubasco.
En la figura 8 se presenta otro oscilograma. En este caso, es la representación de
la secuencia [(komp)aňeɾítos] (comp)añeritos, realizada por una comunicadora
puertorriqueña. Como es posible apreciar la secuencia consta de ocho
segmentos: cuatro vocales y cuatro consonantes. En el gráfico, cabe destacar la
fase oclusiva de la interrupta dental áfona [t], que dura 52 milisegundos, así
como la fricativa predorsoalveolar áfona, que dura 140 milisegundos. Esta
consonante, que aparece señalada con una banda vertical gris, es el segmento de
mayor duración.
Fig. 8. Oscilograma de la secuencia (comp)añeritos.
Conclusión
Los oscilogramas son visualizaciones de las variaciones positivas y negativas de
las ondas lingüísticas a lo largo del tiempo. En la dimensión horizontal (de
izquierda a derecha) se representa el tiempo y en la dimensión vertical (de abajo
arriba) se representa la presión del aire.
Los oscilogramas permiten mediciones más o menos precisas de los segmentos
vocálicos y consonánticos, y también permiten prima facie apreciar la intensidad
de los sonidos.
Referncias
Baart, Joan. 2010. A Field Manual of Acoustic Phonetic. SIL International, Dal-
las, Texas.
Byron, J. 2012. Manual de fonética acústica. Ed. Somos Literatura, Santo Do-
mingo.
Denes, P. y Pinson, E. 1973. The Speech Chain: The Physics and Biology of
Spoken Language. Anchor Books, New York.
Malmberg, B. 1964. La fonética. EUDEBA, Buenos Aires.
Malmberg, Bertil. 1974. Lingüística estructural y comunicación humana. Gre-
dos, Madrid.
Martínez, E. 2007. Análisis espectrográfico de los sonidos del habla. Ariel, Bar-
celona.
Quilis, A. 1981. Fonética acústica de la lengua española. Ed. Gredos, Madrid