Word meaning for open domain dialogue systems
robust and flexible word explanation
word meaning
structured sparse coding
open domain dialogue systems
unintelligible words
Wikipedia
word puzzles
Informatika D. I./Az informatika alapjai és módszerei.
szavak jelentésének reprezentálása
strukturált ritka kódolás
nyílt dialógusrendszerek
ismeretlen szavak meghatározása
Wikipédia
szójátékok
Abstract:
A természetes nyelvek gépi feldolgozásának és a mesterséges intelligenciának egyaránt központi célja a párbeszédre képes ágensek kifejlesztése. Ahhoz, hogy egy ilyen ágens megfeleljen a Turing-teszten és intelligensnek nevezhessük, nem lehet témaspecifikus: bármilyen témáról képesnek kell lennie beszélgetni [2]. Emiatt egy, a párbeszédre képes ágenseket támogató, szavak jelentését reprezentáló módszernek a lehető legáltalánosabbnak kell lennie.
Ahhoz, hogy meghatározzuk egy ilyen módszer jellemzőit, a párbeszédben lekötés [1], azaz az egymás megértéséhez szükséges közös fogalmi sík fenntartásának problémája adhat támpontokat. Ha hibák adódnak a lekötésben, a párbeszéd nehezen folytatható, vagy akár teljesen meg is akadhat. Ezeknek a problémáknak az elemzése arra mutat, hogy a módszernek két szempontból kell általánosnak lennie. Egyfelől robusztusnak kell lennie, azaz működnie kell olyan szavakkal is, amiknek ismeretlen vagy hibás az alakja (például ha a beszédfelismerő komponens hibázik egy dialógusrendszerben). Másfelől nyíltnak kell lennie, azaz szinte minden szóhoz jelentésreprezentációt kell tudnia rendelni témakörtől függetlenül. Ezen felül az átláthatóság is fontos szempont: a szavakhoz rendelt reprezentációknak a felhasználók által érthetőnek kell lennie.
Disszertációm első részében egy, a fenti elvek alapján kialakított módszert mutatok be. Mivel a tetszőleges szavak értelmezése a természetes nyelvek gépi feldolgozásának egy megoldatlan alapproblémája, a nyíltság kritériumát gyengítem a rugalmasság kritériumára. Ez azt jelenti, hogy a módszer a szokásos egy fogalomnál rugalmasabb jelentésreprezentációt rendel a szavakhoz, és ismeretlen jelentésű szavakhoz is képes jelentésreprezentációt rendelni kapcsolódó fogalmakat felhasználva. A módszer alkalmazásra került egy webportálon különböző tudományos diszciplínákból érkező felhasználók kommunikációjának segítésére.
A módszer által szavakhoz rendelt jelentésvektorokat egy neurális hálóval hatékonyan közelítem. Ez a fentihez hasonló alkalmazások esetén fontos. Végül bemutatok egy, a szójelentés reprezentáló módszer módosításával kapott módszert ismeretlen alakú szavak meghatározására a kontextusukból.
A második részben a szójelentés reprezentáló módszerek gyakorlati hasznosságát demonstrálom két, a dialógusrendszerekhez szorosan kötődő problémán: szójátékok automatikus generálásán és a következő válasz osztályozásán, ahol a feladat egy párbeszédben a következő helyes válasz meghatározása.
HIVATKOZÁSOK
[1] Herbert H Clark, Susan E Brennan, et al. “Grounding in communication”. In: Perspectives on socially shared cognition 13.1991 (1991), pp. 127– 149.
[2] Alan M Turing. “Computing machinery and intelligence”. In: Mind 59.236 (1950), pp. 433–460.