Robotok érzelemkifejezésére alkalmas hangokat vizsgált a kutatócsoport

Robotok érzelemkifejezésre alkalmas hangjait vizsgálták a kutatásban, amelyben a Gépészmérnöki Kar Mechatronika, Optika és Gépészeti Informatika Tanszék (MOGI) kutatói is részt vettek. Az eredmény etológiával és robotikával foglalkozó kutatók, tanszékek és kutatócsoportok nemzetközi együttműködésével jött létre. A kutatást a gyakorlatban egy pincérrobottal tervezik tesztelni. A rangos Nature Science Reports folyóiratában megjelent tanulmány első szerzője Korcsok Beáta, BME-GPK MOGI Tanszék tanársegédje (balra). Interjú a projekt egyik résztvevőjével, Korondi Péterrel (lent), a BME-GPK MOGI Tanszékének egyetemi tanárával.

Hogyan találtak rá erre a kutatási területre?

A Mechatronika, Optika és Gépészeti Informatika Tanszék már több, mint tíz éve részt vesz etorobotikai kutatásokban, mely terület ebben a formában egy hazai intézmények közötti összefogásból született meg. Az etorobotikai kutatásokban mérnöki oldalról a MOGI Tanszék vesz részt, etológiai oldalról pedig az ELTE Etológia Tanszék és az MTA-ELTE Összehasonlító Etológiai Kutatócsoport. A kutatásokban többek között rendszeresen részt vesz a Miskolci Egyetem Általános Informatikai Intézeti Tanszéke, illetve külföldi partnerként a tokiói Chuo Egyetem is.

A kutatás azzal kezdődött, hogy egy beszélgetés során Miklósi Ádám etológus elmesélte, hogy ők milyen formában írták át a pszichológusok által kidolgozott anya-gyermek kötődési vizsgálatok kutya-gazda tesztekké. Akkor elhatároztuk, hogy ezt az utat folytatva a kutyát robottal helyettesítve a robot-gazda kötődési viselkedését is lehet vizsgálni. Persze ehhez szükséges volt a robot kötődési viselkedésének leírása. Miklósi Ádám elmondott néhány szabályt, amelyeket a kutatásaik során megállapítottak a kutyákkal kapcsolatban, majd arra jutottak, hogy ezeket a verbális etológiai szabályokat fuzzy logikával le lehet írni. Ez volt az a pillanat, amikor megteremtődött a magyar etorobotika. Ekkor készült a ma már nyugdíjba vonult MOGI Robi.

A fuzzyt legjobban a következőképpen lehet leírni: a klasszikus halmazelmélet szerint egy elem vagy bele tartozik egy halmazba, vagy nem. Ilyen módon a világot csak feketében és fehérben képes leírni. Például egy ember (vagy a mostani kutatásaink után egy robot) vagy teljesen vidám vagy teljesen szomorú. A fuzzy halmazelmélet viszont az éles határokat (a fuzzy szó eredeti jelentésének megfelelően) homályossá teszi, például megengedi, hogy valaki csak egy kicsit legyen szomorú, vagy csak egy kicsit vidám, sőt akár egyszerre egy picit mindkettő is lehet. Egy erős szemüveget viselő japán professzor egyszer azt mondta, hogy az a fuzzy, amikor leveszem a szemüvegemet.

Az etorobotika, mely kifejezés az állati viselkedés kutatásával foglalkozó tudományterület, az etológia, illetve a robotika szavak összevonásával jött létre, annak a lehetőségeit kutatja, hogyan tudunk olyan szociális robotokat fejleszteni, melyek viselkedésük, kommunikációjuk révén könnyebben be tudnak illeszkedni az emberi környezetbe, elfogadhatóbbak az emberek számára. A kutatási terület szükségességét az hívta életre, hogy miközben a szociális robotok egyre inkább elterjednek a világban, nemcsak munkahelyi környezetben, de az otthonainkban, vagy az idősgondozás területén is, az továbbra sem megoldott probléma, hogyan tudnak megfelelően kommunikálni az emberekkel. Szükséges, hogy egyrészt technikai tudás, gyakorlat nélkül is könnyen érthetőek legyenek bárki számára, másrészt pedig hosszú távon se váljanak zavaróvá.
MOGI Robi (balra) és MOGI Ethon

A jelenleg legelterjedtebb kutatási irányzat az emberszerű robotok létrehozása, mely azonban több problémába ütközik. Az emberszerű robotok, melyek feladatok elvégzésére is alkalmasak, még sokáig nem lesznek technológiailag megvalósíthatóak, emellett az embert mintázó robotok könnyen félelmet vagy viszolygást is kiválthatnak a velük interakcióba kerülőkben. Az etorobotikai megközelítés ehelyett úgy gondolja, hogy a robotokra külön fajként érdemes tekinteni, és a funkciójukhoz, képességeikhez kell igazítani a kommunikációjukat. Kutatásaink során olyan, főleg szociális állatok viselkedésén alapuló modelleket vizsgálunk, melyek segítségével kialakítható a robotok megfelelő viselkedése és kommunikációs jelzései. A most megjelent kutatásunkban is ilyen jelzéseket, hangadásokat vizsgáltunk.

Biscee, a szociális robot
Milyen feladatokkal foglalkoztak a kutatáson belül? 
A kutatássorozaton belül már korábban is foglalkoztunk érzelemkifejezésekkel, például vizuális jelzések segítségével; egy képernyőn megjelenített mesterséges ágens – egy körből és szögletes, labirintus-szerű részből álló absztrakt forma – mozgásával, színének és méretének változtatásával alakítottunk ki érzelemkifejezéseket olyan szabályszerűségek mentén, melyek több állatfaj érzelemkifejező viselkedésében is láthatóak. 

Az elmúlt időszakban Korcsok Beáta tanársegéddel és az ELTE Etológia Tanszék kutatóival azt vizsgáltuk, hogy mesterségesen létrehozott hangok esetén is megfigyelhetőek-e azok az állati és emberi hangadásokban megfigyelt szabályszerűségek, melyek a kiadott hangok akusztikai paraméterei és a hangot kiadó egyed belső, érzelmi állapota közötti összefüggésekre világítanak rá. Az ember nemcsak más nyelvet beszélő vagy más kultúrájú embertársai érzelemkifejezéseit képes megérteni a nem-verbális hangadások segítségével (pl. sírás, sikoly, nevetés vagy sóhaj), de ez igaz sok más szárazföldi emlősre, például kutyák vagy malacok hangadásaira is.

Ezt az teszi lehetővé, hogy a hangképzőszervek és a hangadás módja alapvetően megegyezik az emlősök körében, ezáltal a hasonló érzelmi állapotok kifejezésére hasonló hangtani tulajdonságokkal rendelkező vokalizációk szolgálnak. Ilyen szabályszerűség például, hogy a magas alapfrekvenciájú hangadásokat intenzívebbnek, a rövid hangadásokat pedig pozitívabb érzelmi töltetűnek értékelik az emberek.

Kutatásunk során a Praat akusztikai szoftver segítségével közel 600 mesterséges hangot generáltunk, melyekben szisztematikusan változtattuk a hangmagasságot és a hangok hosszát, illetve ezek mellett több, állati hangadásokra jellemző akusztikus paramétert is hozzáadtunk a hangokhoz, hét különböző hangkategóriát létrehozva. A mesterséges hangok az egyszerű szinuszos hangoktól (amelyek a legegyszerűbb, és egyben legtisztább hangzású hangok) a komplex, emlős hangképzés működését modellező hangokig terjedtek. A hangokat online kérdőív segítségével és az ott kapott adatok statisztikai elemzésével vizsgáltuk.

Mi jelentette a legnagyobb kihívást a munkában?
A jelenlegi kutatásban a legnagyobb kihívást a mesterséges hangokban használt és szisztematikusan változtatott paraméterek és azok értékhatárainak megválasztása jelentette, mivel az állati hangadások komplexitása miatt sok lehetőség kínálkozott. Segítségünkre voltak azok a nagy múltra visszatekintő bioakusztikai kutatások, melyek az állati és emberi vokalizációkban a hangképzés mechanizmusain túl az érzelemkifejezések fajon belüli és fajok közötti felismerését is vizsgálják, és melyek az Etológia Tanszéken is folynak.


Online tesztelték a hangok által kiváltott érzelmeket. Ez hogyan zajlott? Hány fős volt a minta, hogyan választották ki?
A kutatás valóban egy online interaktív kérdőív segítségével zajlott, melynek kitöltésére közösségi oldalakon hirdetve kerestünk résztvevőket. A vizsgálatban önkéntes felnőttek vettek részt, a kérdőív angol és magyar nyelven is kitölthető volt. A demográfiai kérdéseket és néhány, a kérdőív felületének használatát bemutató demó hangot követően az egyes résztvevők mind a hét hangkategóriából tíz-tíz véletlenszerűen kiválasztott hangot hallgattak meg.

 A hang meghallgatása után a kitöltőknek egy koordinációs rendszerben kellett elhelyezniük azt, aszerint, hogy mennyire tartották intenzívnek a hangot, illetve milyen érzelmi töltetet tulajdonítottak neki. A válaszokat reakcióidő alapján szűrtük, a húsz másodpercnél később érkező válaszokat kizártuk. Összesen 237 résztvevő válaszát dolgoztuk fel, melyek közül 95-en magyarul, 142-en angolul töltötték azt ki.
A kérdőív kitöltése során a jobbra látható koordináta rendszerben kellett elhelyezni a hangokat, intenzitásuk és érzelmi töltetük alapján. 

Milyen élőlény hangkészletéhez áll legközelebb az optimálisnak talált hangkészlet?
Az emberek a mesterséges hangokat az állati hangoknál megfigyelt szabályszerűségek alapján értékelték, függetlenül a biológiai komplexitástól, vagyis a magasabb alapfrekvenciájú hangokat intenzívebbnek, a rövid hangokból álló hangmintákat pedig pozitívabbnak értékelték. Ez egyrészt arra utal, hogy a vizsgált érzelemkódoló szabályszerűségek nagyon ősiek lehetnek, másrészt hogy a szabályok fajtól függetlenül működnek, és a hangok kiadása mellett a hangokat feldolgozó neurális folyamatok is hasonlóak lehetnek a szárazföldi emlősöknél. A szociális robotok számára tehát nem volt optimálisabb, vagy kevésbé optimális hangkészlet az érzelemkifejezés alapján, ami lehetővé teszi a hangokat további szempontok mentén, a robot további tulajdonságaihoz való igazítását, azok érzelemkifejező jellegének megtartása mellett.

Terveznek-e további kutatásokat a témában?

Igen, a kialakított mesterséges hangokat egy további kérdőíves kutatásban is vizsgáltuk abból a szempontból, hogy megközelítést vagy eltávolodást váltanak-e ki, mely az érzelmi modell harmadik, szociális dimenziójaként működik. Ez alapján elkülöníthetőek például olyan hangok, melyek az első kérdőív eredményei alapján mind negatív és intenzív hangok, a rájuk adott reakció viszont teljesen eltérhet. Hétköznapi példaként gondolhatunk a düh illetve a félelem vagy fájdalom során kiadott hangokra: egy dühösen ugató, acsarkodó kutyához kevésbé megyünk közel, mint egy fájdalmasan nyüszítőhöz, pedig mindkét hangadás intenzív és negatív érzelmi töltetű. A mesterséges hangok által kiváltott eltávolodást-megközelítést vizsgáló kutatás eredményeit hamarosan publikáljuk.

A hangokat természetesen tervezzük valós élethelyzetekben is vizsgálni egy szociális robot, Biscee segítségével, mely terveink szerint hamarosan kávéházi környezetben, pincéri feladatok ellátása közben nyújt majd lehetőséget a hangok, illetve további kommunikációs jelzések vizsgálatára.


Benesóczky László
Fotó: MOGI

A cikk 2020. 06. 09.-én jelent meg.

Megjegyzések

Népszerű bejegyzések