Fizikai Szemle nyitólap

Tartalomjegyzék

Fizikai Szemle 1995/3. 90.o.

A BESZÉDÉRTHETŐSÉG MINT PSZICHOFIZIKAI FOGALOM

Tarnóczy Tamás
MTA Természettudományi
Kutatólaboratórium

Tudománytörténeti előzmények

A megismerés felé különféle utak vezetnek. A spekuláció mellett már a káldeusok, egyiptomiak és görögök is megjárták az érzékszervi felfogás és a fizikai mérés lehetőségének útjait, de az utóbbinak a fogalmak meghatározásában való elsőbbségét csak a humanizmus úttörői hangoztatták. Talán Occan angliai ferences szerzetes (1300 körül) volt az első, aki ezt a tézist - elsősorban a természettudományokra érvényes alapelvként - tanította is. Csak jóval később (1600 körül) igazolta a kísérletek fontosságát Galilei (szabadesés) és Mersenne (rezgésszám), azonban még a felvilágosodás után is hosszú idő telt el addig, amíg Henri Poincaré kimondta (1900 körül), hogy a fogalmak definíciója csak úgy helyes, ha a mérésre ad utasítást [1].

Az első nehézség, egyben ütközés az érzékszervi és a méréssel megvalósított megismerés között az volt, hogy vajon lehet-e fizikai jelenséget pszichológiai úton mérni. Erre a gondolatra a tudomány mintegy 150 éve tért rá. Az úttörőmunkát a legkisebb észrevehető ingerkülönbség érzékelésének vizsgálatával E.H. Weber német fiziológus végezte el. Az általa megindított gondolatmenet helyessége és következményei ma újra a kutatások homlokterében állnak.

Az új úton - a szubjektív ítéletek számszerű adatainak fölhasználásával - mind több eredményt lehetett elérni olyan fogalmak és mennyiségek meghatározásában, amelyek fizikai mérőeszközökkel hozzáférhetetlenek voltak. Kiderült, hogy az érzékszervi észleletek is alkalmasak minőségi és mennyiségi skálák készítésére és ezek számszerű adatainak a fizikailag mérhető inger-adatokkal való egyeztetésére [2]. Érdekes módon, leginkább a hallás területén sikerült elfogadható megoldásokat találni. Így készültek például a hangossági és hangmagassági skálák és ezek összefüggései a fizikai hangintenzitás és a frekvencia mérhető adataival [3]. Ilyen vizsgálatokkal jutottak el számos idegfiziológiai jelenség pontosabb megértéséhez, mint amilyen a “minden vagy semmi" törvény, a hatványkitevős pszichofizikai összefüggés, vagy számos más törvényszerű kapcsolat, amint arról a század közepén megjelent számos kézikönyv beszámol [4].

A mai tudományos szemlélet szerint az ember maga is alkalmas mérőműszer, ha jól választjuk meg a mérési körülményeket, jól tesszük föl a megválaszolandó kérdést, és figyelembe vesszük a statisztikai földolgozás szabályait.

Mi az érthetőség?

A megértés fogalma nehezen választható el valamilyen emberi képességtől; az emberi “érthetőség" szoros kapcsolatban van fiziológiai és pszichológiai adottságainkkal. Az első pontban fölvázolt eljárások alkalmazása erre a fogalomra csak akkor mérlegelhető, ha tisztában vagyunk pontos jelentésével. Ebben található az első nehézség.

Először is a fogalmat szűkítenünk kell. Nem kívánunk foglalkozni természeti jelenségek, logikai lépések, vagy matematikai összefüggések megértésével, hanem kizárólag az egyik ember által a másik ember számára föladott “rejtvények" megejtésével. A rejtvény mindig valamilyen megállapodásszerű jelrendszer közvetítése, amely jelrendszer kulcsát mindkét fél pontosan ismeri. Nem a formáról, hanem a jelentéstartalomról van szó. Az elemi gesztustól kezdve a jelbeszéden keresztül a valóságos beszédközlésig számos kapcsolattartó és közlésváltó lehetőség állhat rendelkezésünkre.

Próbáljuk először klasszikus módon, szavakkal meghatározni a fogalom jelentését. A helyzetet három sarkalatos tényező foglalja egységbe: két személy és a köztük fennálló információs kapcsolat. Az üzenő személy saját gondolatát valamilyen fizikai formában (gesztus, jelölés, beszéd) fejezi ki. Ez a híranyag valamilyen fizikai közvetítőközeggel (hang, elektromágneses rezgés) eljut a másik személyhez, aki az üzenetet érzékszervi úton fölfogja és megérti, azaz a közlő szándékával azonosan értelmezi.

A két személy szerepe megcserélhető, a gyakorlatban folytonosan meg is cserélődik. Maga az érthetőség mindkettőjük közlési és felfogási képességétől, valamint az átvitel módjától és az átvivő közeg tulajdonságaitól függ. A fizikai közeg által szállított híranyag akkor válik számunkra érthetővé, ha azt a fölvevő rendszerünk élettani fokozatain keresztül tökéletesen megismerjük. Az észlelő oldal ezen fokozatai: a) az érzékszervi fölfogás, b) az idegi elemzés és földolgozás, végül c) a pontos jelentéstartalmi azonosítás, azaz a megfejtés. Ugyanez a folyamat fordított sorrendben végbement a közlő oldalán is, ott azonban az érzékszervi fölfogás helyett a motoros megvalósítás indította el a hírközlés fizikai folyamatát.

Az információelmélet szerint a híranyag, az információ nem azonos a fizikai szállító anyaggal, de jelen van benne, mégpedig kódolt formában (optikai kép, beszédhangok sora stb.). A fizikai közeg érzékszervi észlelése nélkül nem juthatnánk hozzá a (kódolt) információhoz, a szállító energiaáram azonban nem lényege, hanem csak hordozója a hírnek. A hírfölvétel említett első fokozata az érzékszervi fölfogás - még csak a szállított jelek bizonyos “átkódolása". A második fokozatként említett idegi földolgozás már több földerítő lépést tartalmaz, mint például az előzetes elemzés, a fontossági sorrendbe állítás, a zavarok kiküszöbölése stb. Végül a megfejtést képviselő legbonyolultabb fokozatban térbeli és időbeli rendezés, emlékképi összehasonlítások, számítástechnikai lépések és logikai megfontolások bonyolítódnak le. Mindez az agykéregben folyik le, és ennek részleteiről nagyon kevés az ismeretünk.

1. ábra.Hasonló írásjegy alakok különböző elhelyezésének értelmezési lehetőségei. Részletezése a szövegben.

A fölfogott jelek fölismerésére, helyesebben asszociációs megfejtésére, tehát valószínű azonosítására álljon itt egy elemi optikai példa (1. ábra.) Emlékképeink szerint az első jel római “u" és “v", esetleg ötös szám, de más szemlélet szerint egy arab hetes. Ugyanez a jel fekvő helyzetben kisebb-nagyobb jelentésű, fölfelé fordítva pedig görög lambda, ószláv “l", ómagyar rovásjelként “s", vagy éppen arab nyolcas. A többi jel is több lehetőséget képvisel. Pontosabb megfejtéshez jutunk, ha nem egy jelet, hanem jelsort értelmezünk. Az első és harmadik jel együttes felbukkanása inkább arab számokra, az első és utolsó jelé latin szövegtöredékre utal. Az úgynevezett kontextus mindig szűkíti a jelentéstartalmat. Ez fontos tapasztalat. Az elemi jelek megfejtése más agyi folyamat, mint a jelsoroké. Jól hasznosítható megállapítás a beszédérthetőség további értelmezésében.

Az értelmezés folyamatának egy másik jellemzője a híranyag valamilyen tulajdonságára irányított figyelem elterelő hatása. Ismét optikai példákra hivatkozhatunk, amelyekből minden pszichológia könyv számos példát közöl. Meyer-Eppler információelméleti könyvéből [5] vett példánkban (2. ábra.) fekete foltok nem tartalmaznak értelmes hírt, ha azonban a fehér kimaradt helyekre figyelünk, kirajzolódik egy ITA jellegű értesítés. Hasonlóképpen más lehet az értelmezésünk, ha a beszédben a hangsúlyra vagy a személyi hangszínre figyelünk.

Jelen meggondolásainkban a beszédérthetőség - a továbbiakban: érthetőség - tárgyalására szorítkozunk, éspedig két fontos ok miatt.

Az első ok szerint az emberi kapcsolatok legfontosabbika, a közvetlen érintkezés elsődleges módja a ma gyakran “kommunikáció" szóval jellemzett párbeszéd. Tudjuk ugyan, hogy az emberi kapcsolatteremtésnek léteznek más, primitívebb formái is, de a gondolatok, szellemi értékek közvetlen és gyors kicserélésére ez a legjobb és legtermészetesebb megoldásunk. A divatos kommunikáció szóban elrejtett communitas (közösség, társadalom) fogalom is arra mutat, hogy a társadalmi együttélés alapfeltételéről van szó. A kommunikáció kétirányúságát a magyar társalgás szó még erőteljesebben kifejezi.

2. ábra. Optikai példa a szemlélet szerinti különböző értelmezésre. A számos ismert példa közül egyik legmeglepőbb [5]. A kihagyott fehér foltokra kell figyelni.

A második ok sokkal kevésbé filozófiai, sokkal inkább biológiai és természettudományi jellegű. A gondolat megformázása és egy másik személy részére felfoghatóvá tétele első sorban agyi folyamat, amelynek a beszéd csak formai kivitelezése. Ugyanez az agyi folyamat megfordítva végbemegy az érzékszerveken át a megfigyelő agyába jutó információk földolgozása során. A motoros parancs és a szenzorosan beérkező anyag földolgozási folyamata a két agyi rendszer alkotó és értékelő idegközpontjait foglalja le. Az agykutatás már sok mindent földerített a két rendszer kapcsolatáról.

Természetesnek látszik, hogy a kivitelező és földolgozó folyamatoknak megfelelően összehangoltnak kell lenniük. Mindkét oldal egyaránt szakosodott az időben gyorsan változó, de hosszan tartó akusztikai folyamatok gerjesztésére és nyomon követésére, vagyis az igen rövid (~ 1 ms) és a meglehetősen hosszú (~ 10 s) akusztikai változások összerendezésére, keltésére, közlésére, fölismerésére, azonosítására és tárolására. Erre más szerveink - ilyen mértékig - nem alkalmasak. Egyik példa az adóvevő rendszer összehangolódásra a hangképző szervek gyors átalakításának lehetősége a rezonanciás és a zörejjellegű hangformák között. A rezonátoros gerjesztésű magánhangzók logaritmikus dekrementuma egység körüli érték, tehát 30-100 ms közötti gyors áthangolást tesz lehetővé, ami 1 s alatt 5 szótagot, vagyis 10-12 hangot jelent. Ennek megfelelően a hallás időállandója 20-50 ms, vagyis a később érkező - kisebb intenzitású - jel elfedésének határideje nagyjából azonos érték. Mindez arra is utal, hogy az adási tempó túlsiettetése (a hadarás) a hallgató agyának földolgozási mechanizmusát terheli, fárasztja, ezért érthetőségi hibákat eredményez.

Ha továbbá átgondoljuk az agynak a beszéddel kapcsolódó bonyolult tevékenységét, meg kell állapítanunk, hogy teljesítménye mindkét oldalon jóval nagyobb, mint az egyszerű hangképzés és kibocsátás, illetve az egyszerű fölfogás és fölismerés.

Tudni kell hozzá a nyelvi kódolás részleteit, a hangoknak a fonetikai elemekkel, a szavaknak a fogalmakkal való kapcsolatait, és áttekintéssel bírni a jelentéstani és mondattani rendszerek fölött. Mindeközben a legmagasabb agyi szinten állandó kapcsolatot kell tartani az elraktározott adatokkal, asszociációs képekkel. Ezek egy-egy nyelven belül annyira jelentősek lehetnek, hogy a meg nem értett akusztikai jegyek fölismerését is pótolhatják [6].

Ez a rövid megjegyzés is arra mutat, hogy a fölismerés menetében messze nem azonos folyamatok játszódnak le egy-egy beszédhang, szó, vagy egy egész mondat értelmezésekor. Erre már az 1. ábra kapcsán is utaltunk.

Az érthetőség eddigi meggondolásaink szerint három összetevő, a közlő, az átvitel és a fölvevő függvényében vizsgálható. A három közül általában vagy az elsőt, vagy a másodikat rögzítjük, s akkor a független változó hatását a mérőeszköznek tekintett fölvevő (megfigyelő, lehallgató) százalékos értékelési adatával jellemezzük. Kivételes esetben az első kettő egyidejű rögzítésével a fölvevő képességeit is ellenőrizhetjük. Méréstechnikailag nagyon sok függ attól, hogy a vizsgálatok nyersanyagát (értékelendő szöveganyagot) hogyan állítottuk össze. Az imént mondottak szerint az agy másként reagál a hallott anyagra, ha vannak arra vonatkozólag emlékképei vagy ismeretei, vagy pedig először hall életében valamilyen ismeretlen hangkapcsolatot. A magyar megfigyelő nehezen azonosít olyan hangsorokat, mint “smrt" vagy “srdce" (szláv szavak: halál, szív). Cseh érthetőségi vizsgálatokban ezek a szavak viszont elfogadhatók.

3. ábra. Az általános beszédérthetőségi összefüggés görbéi a beszédhangosság és a környezeti zajszint függvényében. A Fletcher-Galt-féle görbesereg [7] egy részlete, kiemelve az előadótermi, a nyilvános helyi, az utcai közlekedési és az ipari zavaró zaj hatását. A hasznos hang és a zajszint különbségeinek hatása is leolvasható.

Mivel a vizsgálati szövegminta nem szakadhat el a nyelvtől, nehezen képzelhető el nemzetközileg használható vizsgálati szövegek készítése, amit egyes amerikai szerzők a nemzetközi szabványosításban elképzeltek. Viszont kétségtelen, hogy gyakorlati okokból szabványosítani kell a vizsgálati módszereket. De az ellentmondás csak látszólagos. Tekintsük át először kissé részletesebben a három alapösszetevőnket.

1) A gyakorlatban a szövegközlő (az adó oldal) érthetetlen is lehet. Szélsőséges esetektől eltekintve azonban ezt csak a műszerként használt megfigyelő állapíthatja meg. Mérési módszerünk erre nincs. Nyelvészeti okokból mégis szükség lehet rá, hogy a beszélő beszédének egyes paramétereit minősítsék. A szöveg megértése például jelentős mértékben függ a beszéd hangosságától és sebességétől; de függhet a hangsúlyozástól, a kiejtéstől, a hanghordozás modorosságától és egyéb hibáktól is. Minderre sok példát találunk a tömegkommunikációs eszközök megszólalóinak szövegközlésében.

A hangosságtól való függést régi amerikai mérések alapján [7] a 3. ábrán szemléltetjük. Az érthetőség később meghatározandó formái közül a hangossággal egy darabig mindegyik növekszik, bizonyos hangosság fölött azonban csökkenni kezd. Az emberi hangban, de főként az átvivő rendszerekben torzítások keletkeznek. A hangosság meghatározásánál nem a beszélő saját hangteljesítményét, hanem a hallgató fülénél jelentkező hangosságot kell figyelembe vennünk. Ebbe a hangterjedés, a csillapítás, az átviteli torzítások és a lehallgatás körülményei is beszámítanak. Nem tudjuk jól mérni a beszéd átlagos hangosságát. Erre sem a stúdiótechnikában alkalmazott VU-méterek, sem más átlagoló mérések nem alkalmasak. Figyelembe kell vennünk, hogy a beszédhangok akusztikai teljesítménye a leghangosabb magánhangzóktól (ó, á, é) a leghalkabb mássalhangzókig (h, f, angol th) 30 dB-t fog át. Valamilyen középértékhez csak statisztikai módszerekkel lehet eljutni. Ehhez azonban ismét az egyes nyelvek sajátos tulajdonságait kell figyelembe venni.

Nem mindegy az sem, hogy a közlés hallgatása közben mekkora az alapzaj a megfigyelő fülénél. A 3. ábrán 1 a kiválasztott három érthetőségi görbe közül a 40 jelzésű előadóteremben, a 60 társalgási körülmények között, a 80-nal jelölt utcai zajban, végül a 100 jelzésű a zajos ipari üzemekben lebonyolított párbeszéd érthetőségére vonatkozik. A nehezebb esetekben mind nagyobb hangerő kell a jól érthető beszédhez, viszont a nagy hangerő miatt az érthetőség csökken. Mivel az esetenkénti háttérzaj színképi eloszlása maga is változó paraméter, az ábra csak általános tájékozódásra alkalmas, pontosabb érthetőségi számításokhoz további színképi vizsgálatok szükségesek.

Fizikai mérték helyett a legtöbb esetben minőségi megítélésekre kell szorítkoznunk. Nehéz számszerű eredmény feltételeinek egzaktságát biztosítanunk. Nem mindegy, hogy zajmentes környezetben a hangosság hatását azonos távolságban, az emelt vagy halkított hangú beszéd függvényében vizsgáljuk, vagy pedig a kívánt hangosságot szabadban, a távolság függvényében halkított vagy éppen kiabált hanghordozás segítségével érjük-e el.

Még nehezebb a beszédsebességtől függő érthetőség vizsgálata. A sebesség növekedhet a szóközi szünetek csökkentésével, a hangok arányos rövidítésével (például mesterséges úton), vagy akár sajátságos egyéni hanghordozással (a hosszú magánhangzók rövid ejtése, szótaggyorsítás, hangkihagyások). Ezek meghatározásában a “hadarás" ítéletén túl kevés objektív lehetőségünk van.

2) A második feladat az átviteli rendszer hatásának vizsgálata. Ez a leggyakoribb kísérleti eljárás. Ilyenkor föltételezzük, hogy a beszélő ideálisan jó szövegkiejtésű személy, a megfigyelők pedig kitűnően hallanak, és mindkét oldal megfelelően gyakorlott a kísérleti technikában. Változhatnak azonban az átvivő közeg vagy a műszaki lánc paraméterei, például a frekvenciaátvitel, torzítás, alapzaj, vagy a teremben a visszhang, utózengés stb.

A frekvenciaátvitel érthetőségcsökkentő hatására korai ismereteink vannak. Erről később majd szó esik a telefonnal kapcsolatban. A 4. ábrán azt mutatjuk be, hogy az átvitel alsó és fölső határfrekvenciájának korlátozása hogyan rontja az átlagos szóérthetőséget. Ha 3000 Hz fölött minden összetevőt levágunk, elsősorban a zár- és réshangok érthetősége vész el, így az átlagos szóérthetőség mintegy 78-82 %-ra esik vissza. Persze, ugyanez a baj akkor is bekövetkezik, ha az említett fölső összetevőket maga a hallás vágja le (öregkori hallásveszteség!). A közölthöz hasonló ábrákban azért nem bízhatunk feltétlenül, mert nem mindig ismert, hogy milyen mintaszavak mérésén alapulnak.

4. ábra. Az általános szóérthetőség hozzávetőleges alakulása F: alulvágó = fölüláteresztő (high pass) és A: fölülvágó = aluláteresztő (low pass) frekvenciaszűrés függvényében. Fletcher eredeti görbéi némi módosítással. A határfrekvenciák az összes fölé-, illetve aláeső összetevő áteresztését jelentik [11, 15].

Az átviteli sávkorlátozásoknál is fontosabb a zavaró zajok érthetőségcsökkentő hatásának ismerete. Súlyosabb esetekre fölkészülve nem az érthetőség szabványos vizsgálatával kell törődnünk, hanem eleve olyan emberi megoldásokat kell választanunk, amelyekkel jobb érthetőséget érhetünk el. Legegyszerűbb módszer a hangosabb és tagoltabb beszéd, a szavak megismétlése, betűzése. Közlekedési zajban, rossz légköri körülmények, elektromos zavarok közepette az információ pontossága helyett a redundancia fokozására kell törekednünk. Ebből a szempontból például a többszótagú szavak érthetőbbek, mint a rövidek. A repülőgépek zajában a rádiós üzenetek “yes" és “no" egytagú szavai helyett az “affirmative" és “negative" kifejezéseket tették kötelezővé.

A fölsorolt okok ma is a legfontosabb érthetőségvizsgálati feladatok. Ezekre fejlesztették ki a szokásos eljárásokat, méréseket és számításokat. A gyakorlati cél eleinte a telefonfejlesztés, később az elektroakusztikai átvivő láncok tökéletesítése, ma pedig ezek mellett a teremakusztikai ellenőrző mérések egyszerűsítése.

Az átvitel ellenőrzéséhez az adó és vevő oldal sajátságait szabványosítani kell. Szövegmondó, megfelelő beszédsebességű, tiszta kiejtésű férfi vagy női (mély vagy magashangú) személy lehet. Akár közvetlen beszédről, akár fölvett szövegmintáról van szó, a bemondást előzőleg gyakorolni kell [8]. Logatomhoz több idő, esetleg néhány óra kell, szavak vagy mondatok begyakorlásához kevesebb elegendő. Az értelmetlen szótagok, szavak vagy szókapcsolatok közlését rendszerint bevezető figyelemfölkeltő - szöveggel indítják, a hallott anyag lejegyzésére megfelelő időt kell hagyni. A szövegmintákat - különleges célú kísérletek kivételével - csak anyanyelvű személy olvashatja be.

A megfigyelő (hallgató) oldal szabványosítása a szövegmondóénál kényesebb. Lehet egyetlen személy is, de leginkább valamilyen szempont szerint válogatott csoport, ami statisztikai értékű vizsgálatot tesz lehetővé. A lehallgató csoportot ilyenkor mérőműszerként használjuk [3]. “Hitelesítésük" azonban nagyon nehéz. A szabványos érthetőségi kísérletekhez általában 18-35 év közötti - audiometriailag megvizsgált - személyek választandók ki. Begyakoroltatásukra több időt kell szánni: nemzetközi szabványajánlásokban 24 órát javasolnak a közönséges hangkapcsolatok és 12 órát a szavak fölismerésének technikai elsajátítására. A gyakorlat szerint a készség általában 6-8 óra alatt kialakul. Azért is fontos sok hasonló fölépítésű, de nem azonos tartalmú példatár összeállítása, nehogy a begyakorolt szövegeket a lehallgatók később fölismerjék. Ugyancsak előírás, hogy a valóságos vizsgálati terhelés a 120-200 órát ne haladja meg és, hogy naponta csak 2 x 2 óra fordítható kísérletezésre (kifáradás!). Egy-egy vizsgálati sorozat ezért sokszor több hónapot is igénybe vehet.

3) Rátérve a harmadik feladatra, magukat a lehallgatókat is megvizsgálhatjuk az érthetőségi mechanizmus működése szempontjából. Ilyen mérésekkel a készségen kívül a hallásképességet, esetleg a hallásveszteséget tehetjük vizsgálat tárgyává. Az egyetlen személy kivizsgálása (például beszéd-audiometriás hallásmérés) megkülönböztetendő a csoportos képességvizsgálattól, mint amilyen a gyermekek kortól függő hallásfejlődése. A megfigyelőképesség kifáradásának ellenőrzésére is ezt a módszert használják, sőt legújabban az agyi megismerés folyamatát vizsgálják vele [9].

A méréseknek ezt a fajtáját éppúgy különleges kísérletnek kell tekintenünk, mint a szövegmondók érthető beszédének ellenőrzését. Mégis fontos mindkét oldal tökéletes ellenőrzése a valóságos érthetőségvizsgálatok megbízható lebonyolításához. A két végpont hitelesítéséhez azonban az átviteli láncot torzításmentesnek kell választani: kis alapzajú süketszoba, a fölhasznált elektroakusztikai lánc zajmentes és torzításmentes (lineáris) átvitele. Az utóbbiban csak közelítő megoldásokra számíthatunk. A 100-8000 Hz között lineáris átvitelű mikrofon és erősítő jó tulajdonságait rendszerint lerontja a hangszóró jelleggörbéje és torzítása. A fejhallgatós mérés sem tökéletes, mert hangosságának frekvenciafüggő bizonytalanságait nehéz ellenőrizni [10].

Ez is oka annak, hogy a valóságos mérések alkalmával 100 % érthetőség nem érhető el. Megkísérelhetjük, hogy az érthetőségre elfogadható definíciót fogalmazhassunk meg: a közölt szöveganyagban helyesen azonosított beszédelemek száma ( j) osztva az összes elhangzott beszédelemek számával (k). Százalékosan

(1)

A képlet éppúgy vonatkozhat hangokra, mint szótagokra, szavakra vagy akár rövid szövegekre is.

Vizsgálati módszerek

A fő kérdések: mit és milyen célból igyekszünk kikutatni, milyen legyen a vizsgálati szöveganyag, és hogyan mérjük vagy számítsuk ki az eredményeket? Az 1920-as évek kísérleti törekvései (Bell, Siemens, Western Electric stb.) a telefonvonalak érthetőségének javítására irányultak [11]. Az első egyszerű kísérletek úgynevezett logatom 2 szótagokkal folytak, amelyeket a CCIF 3 nemzetközi szervezet egyetemlegesen akart szabványosítani. Az első próbaszótagok összetétele CV, VC és CVC kapcsolat 4 volt, de hamarosan kiderült, hogy ezek érthetősége nem határozza meg a különféle nyelvek szövegérthetőségét.

1. táblázat

Különböző nyelvek alapszavainak szótagszám szerinti eloszlása W. Fucks [13], és a magyar szépirodalmi nyelvre vonatkozólag a szerző alapján [14]

Nyelv

egytagú

kéttagú

háromtagú

Angol

63 %

26 %

6 %

Német

54 %

30 %

10 %

Eszperantó

40 %

36 %

18 %

Magyar

36 %

32 %

19 %

Orosz

33 %

30 %

20 %

Latin

20 %

37 %

26 %

Török

23 %

32 %

28 %

A telefonbeszélgetés ma is 300-3400 Hz sávszélességű (!) vonalon folyik, amit alapzaj és mikrofontorzítás is terhel. Egy elképzelt beszélgetés során a hívó fél elkapkodott bemutatkozása nemcsak azért nem érthető, mert felületes az artikulációja, hanem azért sem, mert a figyelem fölkeltéséhez bizonyos időre, semleges bevezető szavakra - például köszönésre - van szükség. A gyorsan mondott szöveg azért marad kevéssé érthető, mert a beszélőt sem azonosítottuk és a témát sem ismerjük előre. Ha ezeket a körülményeket egy kulcsszó megvilágosítja, a tartalom hirtelen érthetővé válik. Agyi feldolgozás szempontjából teljesen más az egyes hangok vagy szavak fölismerése és a mondandó szöveg megértése. Az 50-60 %-os logatomérthetőség akár 90-95 %-os beszédérthetőséget jelenthet. Ennek oka, hogy a téma ismeretében a megfigyelő agyműködése az elvesző részinformációk nagy százalékát pótolja vagy korrigálja.

Egan [12] 1943-ban kimutatta, hogy az érthetőség az egy szóban lévő hangok számával növekszik. Ha egy három hangból álló (angol) szó érthetősége 50 %, egy hat hangból állóé 90 %. Ehhez azonban hozzá kell tennünk, hogy az angol szavak 63 %-a egyszótagú! Az 1. táblázatban közölt összeállítást az irodalomból [13] vettük kölcsön, kivéve a magyarra vonatkozó adatokat, amelyek saját eredményeink [14]. A táblázatból kitűnik, hogy az angollal szemben egyes nyelvekben, például a törökben annyira megfordul a helyzet, hogy az egyszótagú szavak aránya még a háromszótagúaknál is kevesebb. A magyar ebből a szempontból közepes helyet foglal el, de jelentős

 

5. ábra. Az alapzaj hatása az érthetőség változására. Esetünkben a zavaró zaj az átviteli vonalba elektromosan van bekeverve, és az érthetőség a beszéd átlagos hangosságszintjének a fehérzaj jellegű zavarszinthez képest mérhető többletszint függvényében van ábrázolva [10, 12].

arányú a háromszótagúak mennyisége. A magyar szavak hosszával az érthetőség eleinte növekszik, de három szótag fölött már biztosan csökken. Egy másik tapasztalat, hogy zajos környezetben három küszöböt kell átlépnünk, hogy a fokozatosan javuló jel/zaj viszony mellett a szövegmegértésig eljussunk. Ha a zajszint 10 dB-lel magasabb az átlagos beszédszintnél, meg tudjuk állapítani, hogy beszédet hallunk. További 6 dB beszédszint emelés esetén már sok szóalakot fölismerünk, végül 0 dB jelszint-zajszint helyzetben 40-60 % logatomérthetőség tapasztalható, ami a nyelv és a téma ismeretében elérheti a 85-90 %-os beszédérthetőséget is (5. ábra) 5.

A nyelv gyakorlata mindezt már régen tudta, ezért külön szó alakult ki a kü]önféle szócsonkok, illetve a folyamatos beszéd megértésére. Franciában a netteté (tisztaság, világosság), angolban az articulation (tagoltság, kiejtés), németben a Silbenverständlichkeit (szótagfölismerés) vonatkozik az általában értelemmel nem bíró szóelemekre, míg az itelligibilité (inelligibility, Verständlichkeit) fejezi ki a beszédmegértést. A szétválasztás valóban ennél bonyolultabb. A kettő kapcsolatát szemlélteti a 6. ábra. Pontosabb összefüggéseket főleg angol nyelvre ismerünk [8, 10, 15], az eredmények azonban erősen függenek a vizsgálati anyagtól.

6. ábra. Hozzávetőleges kapcsolat a szótag- és mondatérthetőség között több vizsgálat eredménye szerint [10-12, 15].

Több típusú vizsgálati szövegfajta létezik, négyet sorolunk föl [8].

1. Nyelvi jelentés nélküli egytagú logatomok. Ezekkel vizsgálható például egyes hangok érthetőségi foka, zajos körülmények között érthetőségi stabilitása. A vizsgálati minták összeállításához figyelembe kell venni a nyelvben előforduló hangok és hangkapcsolatok statisztikáját. Ezt a föltételt általában nem tartják be következetesen. Az első próbálkozások során például csak magát a szótári hangstatisztikát vették figyelembe. Ez azonban hibás álláspont. Egy magyar példán bemutatva: VCC alakzatban “tr" hangkapcsolat nemlétezik, viszont “rt" gyakori (mert, kert, part stb.); CCV esetben viszont a helyzet megfordul, éppen “rt" nem fordul elő, viszont “tr" akad (trón, trombita, tréfa stb.). Végül VCCV formában mindkét változat előfordul. Többek közt ezért is kell kétszótagú logatomokat szerepeltetni a vizsgálatokban. Ismételten hangsúlyozzuk, hogy az értelem nélküli szókapcsolatokban is ragaszkodnunk kell a teljes értékű nyelvi statisztika adatainak tekintetbe vételéhez. 6

Amikor az angol jelentés nélkül logatomokat készítették, a hagyományos helyesírással nem lehetett mit kezdeni. A szövegmondók sem tudták, hogyan olvassák be a logatomokat. Ezért - elsősorban az ő kiképzésük érdekében - a 40 angol beszédhang, különösen a 11 vokális és a 4 diftongus 7 egységes jelölésére körmönfont mesterséges fonetikai jelrendszert alakítottak ki, mint például ä (“take", “face"), ë (“treem", “feet"), ü (“boot", “glue"), ď (“bite", “lime") stb. A megértett műszavak visszajelzésében elfogadták a hagyományos angol helyesírási megoldások bármelyikét. Ha például a közölt szó “blue" hangzású volt, a “blue", “blew" vagy “bloo" választ egyaránt helyesnek tekintették. A szövegközlők 8 órai, a lehallgatók 24 órai (!) gyakorlás után foghattak hozzá a valóságos kísérletekhez.

2. Egy- és kétszótagú valóságos szavak. Ezen az úton is elképzelhető egyes hangok és hangkapcsolatok, méginkább az egyes szavak érthetőségének vizsgálata, természetesen erősen nyelvtől függő eredménnyel. Maguknak a szószedeteknek az összeállítása kényes feladat. Nehéz vagy ritkán előforduló szavak éppúgy nem kerülhetnek a listába, mint a nagyon megszokottak vagy sűrűn előfordulók. Könnyíti a helyzetet, hogy ezúttal nem kell kényszerfonetikai fölkészülés, így a gyakorlási idő a felolvasónak 1 órára, a lehallgatóknak 12 órára csökkenthető. Ez a fajta vizsgálódás átviteltechnikai szempontból kisebb jelentőségű, de orvosi célú beszéd-audiometriában éppen ilyen szavak fölismerésére szokás támaszkodni.

2/a. Az úgynevezett szpondeusz jellegű kétszótagú szavak. Két, egyenlő mértékben hangsúlyozott szótagból álló angol szó, például “eyebrow", “playmate", “workshop". Tudomásunk szerint más nyelvben nem használják, bár például a svédben is van rá lehetőség.

3. Mondatokban elrejtett kulcsszavak, vagy egyszerűbben mondatok végszavai. Egyes amerikai szabványokban [16] olyan rövid mondatok hangzanak el, amelyeknek az igaz-hamis voltát kell eldönteni, vagy a kérdésre egy szóval válaszolni. Bonyolultabb esetben le kell írni a hallott mondatot, a 4 vagy 5 kulcsszónak pedig hibátlannak kell lennie. A módszert hosszadalmassága miatt sok kritika éri, azért is, mert érthetőség helyett inkább emlékezetet vizsgál. Német szabványok [17] jóval egyszerűbb feladatot jelentenek, amikor az elhangzott mondat utolsó szavát kérik rögzíteni. Mindkét módszert kevés célra használják.

2. táblázat

Angol, német és francia egytagtú szóminták érthetőségvizsgálati célokra

Angol szó
[16]

are
bad
bar
bask
hunt

boksz
came
cleanse
clove
there

crash
creed
death
deed
tue

ride
rise
rub
slip
use

smile strife
such
then
wheat

Német logatom [17]

lid
schrolb
garn
ruch
glund

hecht
heir
weh
dib
schles

kroch
blek
teus
bar
frorch

banz
fetz
trül
degt
där

spusch
grisk
nand
zend
neft

Francia logatom
[18]

frok
spour
roul
drčle

gouze
glig
bouc
prost

boul
grin
yache
strotch

lif
flčre
britch
trame

slot
chčte
site
youb

 

4. Kötöttszámú hasonló hangzású szóból a helyes kiválasztása. A lehallgató ilyenkor nyomtatott szólistát kap kézbe, ebben azt a szót kell megjelölnie, amit a bemondott szöveg alapján hallani vélt. Rímes próbának is nevezik, angol nyelvterületen kitűnően bevált. Az amerikai szabványos vizsgálatokhoz 150 hatos szópár készült. Példák: cook look - hook - shook - book - took, vagy: kid - kith - king - kit - kill kiss. Más nyelvekre hasonló mennyiségben nem könnyű ilyen sorozatot alkotni. Magyarban például ilyen lehetne: fóka - hóka - jóka - móka - róka - zsóka. A német DIN szabványokban találunk hasonló próbálkozást, ezek azonban nem érik el az angol példák használhatóságát. A következő sorozatban: Hin - Drin - Sinn - Zinn - Kinn - Rinn, például nemcsak a kezdőhangok között van észlelhető különbség, hanem a többi hang között is - például hosszúságban.

Akár jó, akár kevésbé jó példákat közlünk a megfigyelővel véletlen találatok elég nagy valószínűséggel adódnak. Ezért az egyszerű [1] képletünk már nem használható. A kevés alternatívát képviselő esetekben a korrigált számítás valamivel bonyolultabb [8, 16]:

(2)

ahol k a feladatok száma, n pedig a változatok lehetősége, j a helyes és h a hibás válaszok száma. Ha például az elhangzott 50 hatos mintából 25 helyes és 25 hibás választ kapunk, figyelembe véve, hogy n-1 = 5, tehát É= 40 %, szemben az (1) összefüggés szerint számított 50 %-kal. Természetesen minden olyan esetben, ahol az alternatív válaszok lehetősége kicsi, a pontosabb számítást kell elvégezni. Például CV vagy VC esetben nagyjából 200-300, ha azonban a magánhangzó fölismerése biztos, mindössze 30-40 válaszlehetőséggel számolhatunk.

Semmi sem új a Nap alatt. M. Vitruvius Pollio Augustus korabeli római építész “De Architectura" című híres munkájának V. könyve 4. fejezetében egyes színházi szövegek szavairól azt írja, hogy a “sol", “lux", “flos", “vox" azért érthetők nehezen, mert nem “határozott" a kezdetük és a befejezésük. Kempelen Farkas “Mechanismus"- ának (1791) előszavában arról szól, hogy a beszélőgépe által képzett, mesterségesen összeállított rövid szavak közül melyek voltak legjobban és melyek legkevésbé érthetők a hallgatóság számára.

3. táblázat

A magyar érthetőségi szövegminták számának szótagtípusok szerinti eloszlása

Szótagtípusok

V

VC

CV

CVC

CVCC

összes

Egyszótagú

9

15

4

15

4

47

Kéttagú, első szótag

6

5

15

14

1

42

Kéttagú, második szótag

-

1

10

29

2

42

Háromtagú, első szótag

4

2

16

1

-

23

Háromtagú, második szótag

1

2

12

8

-

23

Háromtagú, harmadik szótag

1

1

5

14

2

23

Az első logatom próbálkozások nemzetközileg nem váltak be. A nyelvi statisztikák több-kevesebb figyelembe vételével hasonló elvű, de nyelvileg elfogadható vizsgálati minták keletkeztek. A 2. táblázatban néhány összehasonlító példát közlünk.

Első csoportban az amerikai egytagú szavak listájából közlünk egy részletet [16]. A szavak az angolban előforduló hangok statisztikai arányában vannak összeállítva (phonetically balanced = PB). Később látni fogjuk, hogy ez a megoldás még további módosításra szorul, amint a magyar vizsgálati szöveg-összeállítás szemlélteti. A táblázat második csoportja a volt keletnémet szabványból van kiemelve [17]. Ezek mesterségesen összeállított logatomok, amelyekben már inkább alkalmazni lehet statisztikai elveket. Hasonló próbálkozás a francia szövegminták összeállítása [18], amelyből szintén közlünk néhány példát a táblázatban. Mivel a két utóbbi nyelv helyesírása sem egyértelműen fonetikus, néhány válasznál a kétértelmű eseteket külön kell elbírálni.

Magyar szövegminták szerkezete és használata

Érthetőségvizsgálati szövegmintáink megszerkesztéséhez sok előzményre támaszkodhattunk [19, 20]. Az első elv, amit a korábbiaknál nagyobb következetességgel alkalmaztunk, nem a szótár, hanem a nyelvhasználat statisztikai adatainak fölhasználása. Ez hozzáférhető [21], eredményeit magyar szabványban 1954-ben rögzítettük [22]. Röviden összefoglalva arra fordítottunk gondot, hogy ne csak a nyelvben előforduló hangok gyakorisága, hanem a szótagok hangi alakja és egymáshoz fűződő kapcsolódásai is arányosan képviselve legyenek a mintákban. Nem csak egy-, hanem két- és háromszótagú szóalakokat is alkalmaztunk.

A 3. táblázatban állítottuk össze, hogy szómintáinkba milyen alakú szótagok kerültek be. A pontos adatok nem mind egyeznek a valóságos nyelvi arányokkal, elsősorban a ragozás, fokozás és egyéb nyelvtani változatok elhanyagolása miatt. Annyi megfelel a valóságos statisztikának, hogy a leggyakoribb magyar szótagtípus CV és CVC. Az is jellegzetes, hogy az amúgy is nagyon ritka CVCC nem szerepel háromszótagú mintaszavainkban sem az első, sem a második szótagban.

A háromszótagúak bevétele mintaszavaink közé indokolást igényel, mivel ilyeneket más nyelvekben nem alkalmaznak. Az előfordulási gyakoriság mellett (az összes ennél hosszabb szó csak mintegy 13-15 %-ot tesz ki) fő ok, hogy VCCV kapcsolat legkönnyebben ebben az alakzatban hozható létre. Hozzá kell tennünk, hogy az összeállítások során bizonyos tiltó szabályokat is figyelembe kellett vennünk, például, hogy ne kerülhessen a CC kapcsolatok közé zárhang + réshang (például t+ s vagy p+f, tehát ezért is ki kellett használnunk a három szótag adta lehetőségeket. Mindezen előnyök ellenére kétségtelen, hogy az ilyen hosszú szóalakok megfigyelése nagyobb terhelést jelent.

Ismételten utalnunk kell arra, hogy más a fölismerés mechanizmusa a hangok és más az értelmes szavak esetében. A szótári ismeret bekapcsolása a megértés folyamatába második szövegkészítési alapelvünk megvalósításával nagyobb szellemi teljesítményt és gyorsabb kifáradást jelent. Ezt igyekszünk kikerülni, amit a következő bekezdésben ismertetünk. Még tovább menve, erősen nő a lehallgató terhelése, ha a nyelvtani kapcsolatokra is figyelnie kell. A mondatok megfigyeltetését ezért már nem tekinthetjük klasszikus értelemben vett érthetőségvizsgálatnak. A mondatokat tartalmilag is meg kell érteni, sőt a teljes tartalmi megértés még mindig nem logikai megértés!

Saját értelmezésünk szerint valójában csak a megértés elemi fokát, azaz a hangok és hangkapcsolatok pontos visszajelzését tekinthetjük ellenőrizhető és megismételhető mérési adatnak, ez tekinthető az alapfokú valóságos fonetikai érthetőségnek. Ehhez képest aztán a szöveg (szó, mondatrész, mondat) érthetősége bizonyos szorzófaktorokkal látható el, ezek a szorzók azonban mind a szövegtől, mind a megfigyelő értelmességi fokától erősen függenek, tehát nem érthetőségi, hanem intelligencia adatokat eredményeznek.

Második tézisünk az előbbiekből következik. Mégis bővebb magyarázatra szorul, mert ez nem módosítása vagy javítása a korábbi külföldi próbálkozásoknak, hanem azokkal egyenesen ellentétes. Szemben azzal a gyakorlattal, hogy az egytagú logatomok jelentés nélküli hangkapcsolatok, az egy- vagy többtagú hangalakzatok viszont jelentéssel bíró valóságos szavak, mi azt az elvet követjük, hogy a mintaszavak a véletlen összeállítás folytán akár nyelvi jelentéssel bíró, akár ilyennel nem rendelkező hangalakzatok egyaránt lehetnek. Hiszen az összeállítás a nyelvi hangeloszlásnak és a szótag-alakzatoknak megfelelően, de nem meglévő szövegekből kivett hanganyagból készült. Ezért a végleges szövegmintákban értelem nélküli, de nyelvi hangzás szempontjából kifogástalan, továbbá véletlenül értelmes szavak is előfordulhatnak. Ezzel kettős célt érünk el. Minden nyelvben vannak kevéssé ismert, például nyelvjárási, szakmai vagy ritkán használt irodalmi szavak, amelyek nem mindenki számára ismertek. Ezt a nehézséget az angol példákban úgy kerülték meg, hogy az ilyen szavakat nem vették be a példák közé. Ezzel azonban a nyelvi hangkapcsolatok valószínűségi eloszlását némileg rontották. Saját álláspontunk más megoldást kínál. Azzal veszi figyelembe az agy valószínű fölismerési mechanizmusát, hogy nem köti meg a hallgató beállítottságát az értelmes vagy értelem nélküli szöveg irányába. Más szóval: az egy irányba beállított gondolkodást megakadályozzuk, vagy legalább is valószínűtlenné tesszük. Ha valaki tudja, hogy értelmetlen szótagokat fog hallani, jobb meggyőződése ellenére is értelmetlenre javítja a hallott hanganyagot. Hasonló a helyzet az ellentétes esetben is. Ha azonban az értelmezés agyi mechanizmusa ebből a szempontból nincs kényszerhelyzetben, szabadon dönt, vagyis azt válaszolja, amit valóban hallott.

Pszichológiai okokból őszinte válaszadásban is szerepet kaphatnak kényszer-félrehallások. Ez az érdeklődési vagy szakmai beállítódás következménye. Amikor például katonákkal hallgattattunk le szövegmintákat, az “arc" szóra gyakran kaptunk “harc" választ. Ebből arra lehet következtetni, hogy a homogén csoportoktól nem várhatunk el olyan megbízható érthetőségi eredményt, mint a vegyesen összeállítottaktól. Várható, hogy a szóráskép ilyenkor jobban szétterül, de a középérték megbízhatóbb lesz.

Tévesztések a leggondosabb előkészítés mellett is előfordulnak, hiszen éppen ezek megismerésére készülnek a vizsgálatok. Ezért célszerű azt is kideríteni, hogy az egyes beszédhangok milyen irányokban téveszthetők, és hogy mekkora a tévesztésekkel szemben az állékonyságuk. Ezekről az eredményekről egy második írásban számolunk be. Annyit mégis megemlíthetünk, hogy egyes hangok érthetőségi stabilitása suttogott szövegmondás esetén nagyobb, mint a normális hangerejű beszédben. Arra is gondolni lehet, hogy más-más nyelvekben más az egyes hangok érthetőségi biztonsága. Ez azonban csak akkor volna ellenőrizhető, ha azonos szempontok szerint összeállított, de az illető nyelv hangösszetételét képviselő szövegmintákkal végezhetnénk vizsgálatot.

A magyar szabvány szövegmintáiból néhány töredéket a 4. táblázatban mutatunk be. Az értelmes-értelmetlen probléma előzetes közlése mellett további magyarázkodás és hosszas előzetes gyakorlás nem szükséges. Bevezető mondatok nélkül, megfelelő szüneteket tartó fölolvasással kell beolvasni a lejegyzendő szóalakzatokat. Az amerikai szabvány [16] szerint a logatomok mindegyike előtt figyelemfölkeltő mondatok (carrier sentences) hangzanak el: “az első csoport... most figyeljen... a negyediknek írja" stb.

Az amerikai listasor 1000 egyszótagú szóból áll, a magyar jegyzék 10 sorozatban 200-200 vegyes-szótagos szövegmintát tartalmaz, azonos szempont szerinti elosztásban, de egymással sehol nem egyező összetételben. A 4. táblázatban bemutatott néhány példa négy sorozat 10-10 szóösszeállítását tartalmazza. Nagyjából ellenőrizhető, hogy a 30-35 % értelem nélküli hangkapcsolat mellett hasonló mennyiségű olyan alakzat szerepel, amit egyetlen hang cseréje értelmessé tehet, végül van egyharmad olyan szó, amely véletlenül értelmesnek adódott.

A vizsgálatok lebonyolítása alkalmával néhány mellékes szempont nem hagyható figyelmen kívül. Ilyen a megfigyelők személyi képessége, amit ellenőriznünk kell. Az audiometriás átvizsgálás és a korellenőrzés mellett az egyéni figyelem vagy fáradékonyság szintén fontos tényező. Éppen emiatt kell az előzetes ellenőrző próbakísérleteket elvégezni. Az alkalmatlan egyedek ezáltal kiszűrhetők.

Foglalkozni kell a célnak megfelelő számú egyszerre résztvevő lehallgatók csoportosításával és elhelyezésével is. A nagyobb létszám előnye a valósabb középérték, viszont elhelyezkedés szempontjából a nagy létszámú csoport már nem kaphat akusztikailag egységes benyomást, például a hangszóró jelleggörbéje vagy egy nagyobb terem akusztikai egyenlőtlenségei miatt. A vizsgálatok pontos körülményeit ezért a jegyzőkönyvekben mindig rögzíteni kell. E nélkül kétes, hogy egy érthetőségvizsgálat eredményei a megadott pontossággal elfogadhatók-e?

A vizsgálatok egyik legjelentősebb problémaköre magának a kísérletnek a végső célja. Nagyon valószínű, hogy a legmegfoghatóbb cél az átvitel jóságának megállapítása, csakhogy ez sem abszolút értékekkel adható meg, hiszen a vizsgálati feltételektől is függenek az eredmények. Ezért általában nem abszolút értékként kezelendők az eredmények, hanem mint két átviteli rendszer vagy valamilyen zavaró hatás értékelésére vonatkozó minősítési adatok. Ezeket a különbségeket objektív módszerekkel is mérni lehet (megváltoztatott átviteli sáv vagy más jellegű utózengési idő stb.), tehát jó kapcsolatok teremthetők az érthetőségben adódó eltérésekkel. Az érthetőségi adatok különbsége minőségi értékelést szolgáltat akkor is, ha nem pontosan tudjuk, hogy melyik fizikai tényező okozta a változást.

4. táblázat

Példák a magyar érthetőségi szövegmintákból

I. sorozat

III. sorozat

VII. sorozat

X. sorozat

peme

zék

vérzőhaj

lekfenn

mak

nyeri

apu

neből

suntold

viterül

vez

ik

eg

kundog

ig

inu

rókám

ve

szőtte

poémzett

taslacs

leomalt

mag

em

eb

hezg

bógáncs

ogylak

nyelvér

rotol

a

emlékszem

gyet

vel

lang

sen

kattlagzi

állvafon

elfér

godlos

Ebben a dolgozatban a probléma fölvázolását tekintettük célunknak. Egy későbbi alkalommal az objektív mérési módszerekkel kívánunk foglalkozni.

Irodalom

1. H. POINCARÉ: Tudomány és föltevés - K. M. Természettud. Társ., Budapest 1908.
2. S.S. STEVENS: The Psychophysics of Sensory Function - Sensory Communication, szerk.: W.A. ROSENBLITH, Wiley, New York 1961. 1-33
3. S.S. STEVENS: Sensation and psychological measurement - Foundation of Psychology, szerk.: BORNG - LANGFELD - WELD, Wiley, New York 1961.
4. Sensory Communication, szerk.: W.A. ROSENBLITH, Wiley; New York 1961.
5. W. MEYER-EPPLER: Grundlagen und Anwendungen der Informationstheorie - Springer, Berlin 1959. p. 368
6. P.B. DENES, E.N. PINSON: The Speech Chain. The Physics and Biology of Spoken Language. - 2nd edition. Freeman and Co., New York 1993.
7. H. FLETCHER, R.H. GALT: The perception of speech and its relation to telephony-J. Acoust. Soc. Amer. 22, (1950) 89-151
8. K.D. KRYTER: Recommended methods for measuring the intelligibility of speech - ISO DP 4870-1975, 77
9. HOU ZEZHANG, CH.V. PAVLOVICH: Effects of temporal smearing on temporal resolution... - J. Acoust. Soc. Amer. 96 (1994) 1325-1340
10. L.L. BERANEK: Acoustic Measurements - Wiley, New York 1949. cf. 13.5, 17.6
11. H. FLETCHER, J.C. STEINBERG: Articulation Testing Methods - Bell Syst. Tech. J. 8 (1929) 806-854
12. J.P. EGAN: Articulation Testing Methods II. - OSRD Report 3802. Psychoacoust. Lab. Harvard Univ. 1943.; Laryngoscope. St. Louis 58 (1948) 955-991
13. W. FUCKS: Die mathematischen Gesetze der Bildung von Sprachelementen aus ihren Bestandteilen-Nachrichtentechn. Z. 3 (1956) 7-21
14. TARNÓCZY T.: A jeloszlás és a hírtartalom nyelveket meghatározó tulajdonságairól - Nyelvtud. Közl. 63 (1961) 161-178
15. H. FLETCHER: Speech and Hearing in Communication - Van Nostrand, New York 1953. 15. fejezet
16. American National Standard: Methods for measurement of monosyllabic word intelligibility 5.3.2.-1960. A.N.S.I. NewYork 10018, 1960.
17. FASOLD, KRAAK, SCHIRMER: Taschenbuch Akustik - Veb Vg. Technik, Berlin 1984 p. 1228.
18. H. PIRAUX: Dictionnaire général d'acoustique et d'électroacoustique - Eyrolles, Paris 1964.
19. TARNÓCZY T.: A magyar hangzókapcsolatok eloszlása Ady költői nyelve alapján - Nyelvtud. Közl. 53 (1951) 107-152
20. VÉRTES EDIT: Adalékok a magyar nyelv hangtani szerkezetéhez - Nyelvtud. Közl. 54 (1952) 96-141; 55 (1953) 138-180; 56 (1954) 215-266
21. TARNÓCZY T.: Az érthetőségvizsgálatok magyar szövegmintái Magy. Híradástechn. 5 (1954) 43-51; Phonetische Gesichtspunkte bei der Zusammenstellung... - Z. Phonetik 14 (1961) 74-87; A method for constructing phonetically balanced word lists... - Sympos. Intelligib. de la Parole. Ličge 1973, 185-190
22. Hangtani mérések. MNOSz 3392. Magyar Szabványügyi Hiv., Budapest 1954. 40 lap

________________________________

1 A 3-6. ábrák az 1930-as évek méréstechnikájával nyert átlagos kísérleti eredmények, kisebb változtatásokkal módosítva.

2 A legkisebb nyelvi egység, a szótag, sőt nem feltétlenül értelemmel bíró szótag megnevezése. Tulajdonképpen a logmolekula kifejezés jobb lett volna rá. Később már kétszótagú logatomról is beszélnek.

3 Comité Consultatif International Téléphonique rövidítése. Akkoriban minden nemzetközi tudományos szervezet neve, miként a Genfben székelő Népszövetség első hivatalos nyelve is francia volt. A Téléphonique rövidítése azért lett F, mert a T már le volt foglalva a Télégraphique-ra, és ezért a német Fernsprecher szó első betűjét vették kölcsön. Később a két szervezetet CCITT betűrövidítéssel egyesítették.

4 A szakirodalomban V (vokális) a magánhangzó, C (konszonáns) a mássalhangzó rövidített jele.

5 Arra, hogy az agy milyen kombinációkra képes, számos példát tapasztaltam. Idegen város utcáin sétálva, az előttünk haladók beszédében magyar szavakat, sőt szókapcsolatokat vélünk fölfedezni, kizárólag néhány százalékos szótagérthetőség és az imbolygó figyelmű agyi adatelemzés révén. Közelebb érve a beszélőkhöz, kiderül, hogy a társalgás idegen nyelven folyt, és egyetlen magyar szó sem hangozhatott el.

6 F. TRENDELENBURG: Klänge und Gerdusche - Springer, Berlin 1935. című könyvének 208. lapján utal H.F. Mayer egy 1927-ben megjelent dolgozatára, amely szerint a logatomok szerkesztésében a hangokat és hangkapcsolatokat a nyelvben előforduló gyakoriságuk szerint kell tekintetbe venni. Ezzel valószínűleg elsőként vetette föl a kiegyenlített fonetikájú szöveglisták ötletét.

7 A diftongus két egymás utáni magánhangzó szoros átmenő kapcsolata.