Természetes nyelvek a gépi kommunikációban
önálló labor és diplomaterv témajavaslat
Bevezetésképpen egy
demo videót [lásd
irodalmak
a lap végén] szeretnék bemutatni, amely egy magyar nyelvű kérdés
SQL fordítását készíti el, és azt illusztrálja, hogy a gépi nyelvekhez
nem értő felhasználó hogyan használhatja a saját természetes nyelvét
egy feladat megfogalmazása során.
A feladat általánosabban
Az
önálló laboratórium feladat lényege annak a kérdésnek a vizsgálata,
hogy egy kellően korlátozott természetes nyelv mennyiben egyszerűsíti
(teszi lehetővé) olyan gépi kommunikációs rendszerek felépítését,
amelyeknek emberek is a résztvevői. A vizsgált rendszer a szokásos
mesterséges (pl. ágens kommunikációs) nyelveket szintaktikailag és
szemantikailag jól meghatározott természetes nyelvekkel (angol, magyar)
cseréli fel annak érdekében, hogy megkönnyítse emberek részvételét a
kommunikációban. A feladatról szól néhány fólia is (Dobrowiecki Tadeusz készítésében).
Előzmények, alkalmazási területek
A tanszéken a kilencvenes évek óta foglalkozunk
ágensrendszerek vizsgálatával,
illetve alkalmazásukkal különféle területeken. Az intelligens ágensek
szabványos kommunikációja (ACL) lehetővé teszi a fejlesztők számára
különböző tartalom nyelvek alkalmazását. Érdekes lehet annak
vizsgálata, hogy ezek a tartalom nyelvek mennyiben helyettesíthetők
természetes nyelvekkel oly módon, hogy ne rontsuk az ágens nyelvek
hatékonyságát (feldolgozhatóságát), ugyanakkor a gépi kommunikációt
közelebb hozzuk az ágens közösségekben (pl. intelligens terekben)
megjelenő emberekhez. (A feladat akár a tanszéki
mitmót moduláris robothoz kapcsolódóan tovább is alakulhat.)
A tanszéken az "
információ és tudás tárház"
projektben az információhoz jutás folyamatát modelleztük, illetve
javaslatokat tettünk ilyen rendszerek felépítésére és működésére. Egy
információkereső rendszer egyik sarkallatos eleme a felhasználói
kérések megfogalmazásának mikéntje: hogyan lehet megfogalmazni a
felhasználó információs igényét létező tárgyterületi leírásokra
(ontológiákra, adat- és tudásbázisokra) támaszkodva, az egyszerű
kulcsszavas keresésnél lényegesen hatékonyabban. Ebben is segíthet egy
jól szabályozott természetes nyelv, amely bár közel áll a felhasználó
anyanyelvéhez, de nyelvtani szabályai, illetve szókincse a
tárgyterületi tudásból származnak (ezáltal lehetővé téve az egyértemű
gépi feldolgozást).
Részfeladatok
A kiírt feladat sokféleképpen részletezhető, néhány mérföldkövet szeretnék csak megfogalmazni:
- irodalomkutatás: kontrollált természetes nyelvek, ágens kommunikációs nyelvek
- (kontrollált) természetes nyelvek gépi feldolgozása
- tárgyterületi háttértudás leírása (ontológia, tudásbázis)
- nyelvtan és szókincs generálás tárgyterületi háttértudásból
- ágens kommunikációs (tartalom) nyelvek
- ágens rendszerek megvalósítása Jade környezetben (programozás)
Szükséges kompetenciák - megszerezhető képességek
A
feladat sikeres megoldásához jó programozói tudás szükséges, de
speciális (pl. NLP) nyelvek és algoritmusok előismerete nem. Előzetesen
csak alapszintű jártasság szükséges az MI egyes területein (lásd MI könyv ágensekről
és kommunikációról szóló fejezetei).
A
feladat
megoldása során gyakorlati ismeretek szerezhetők egyszerűbb
természetes nyelv feldolgozási és fordítási feladatokban, valamint
mélyebb ismeretek ágensrendszerek megvalósításában (ágensek működése,
kommunikációja, kooperációja, stb.). Alkalmazási területtől függően
további gyakorlati ismeretek szerezhetőek pl. az információbeszerzés,
beágyazott intelligencia, intelligens otthon, stb. témakörökben.
Kapcsolódó kutatás
Az előzményekben felsorolt (lezárult) projektek mellett a tanszék hasonló témájú OTKA pályázatot adott be 2007. szeptemberében.
Felhasznált eszközök
A
fejlesztés Eclipse / Jade környezetben zajlik. Kisebb webes (HTML, PHP)
feladatok is elképzelhetők. Megfelelő érdeklődés esetén egyedi
(beágyazott) hardver és szoftver eszközök alkalmazására is lehetőség
van. A feladat hosszabb távú célkitűzése az, hogy az intelligens terek
különféle eszközeit is bevonjuk a mintaalkalmazásokba, illetve olyan
érdekes és jövőbemutató alkalmazási környezetek eszközeit is
megvizsgáljuk, mint például az otthoni betegellátás, illetve az idősek
egészségügyi (táv)felügyelete.
Ajánlott olvasmányok
(bővítés alatt)
- A bevezetésben említett demonstráció részletesebb ismertetője:
Mészáros Tamás, Dobrowiecki Tadeusz, Kiss Margit: "Kontrollált természetes nyelvű lekérdezés webes adatbázisokhoz" In: Networkshop 2007, Eger, Magyarország 2007.04.11.-2007.04.13, 2007. -