Mottó:
There are 3 types of people in the world: those who make things happen,
those who watch things happen and those who wonder what just happened.

Ez itt egy egyetem: nem csodálkozni kell a dolgokon, hanem tenni értük.


Természetes nyelvek a gépi kommunikációban

önálló labor és diplomaterv témajavaslat

Bevezetésképpen egy demo videót [lásd irodalmak a lap végén] szeretnék bemutatni, amely egy magyar nyelvű kérdés SQL fordítását készíti el, és azt illusztrálja, hogy a gépi nyelvekhez nem értő felhasználó hogyan használhatja a saját természetes nyelvét egy feladat megfogalmazása során. 

A feladat általánosabban

Az önálló laboratórium feladat lényege annak a kérdésnek a vizsgálata, hogy egy kellően korlátozott természetes nyelv mennyiben egyszerűsíti (teszi lehetővé) olyan gépi kommunikációs rendszerek felépítését, amelyeknek emberek is a résztvevői. A vizsgált rendszer a szokásos mesterséges (pl. ágens kommunikációs) nyelveket szintaktikailag és szemantikailag jól meghatározott természetes nyelvekkel (angol, magyar) cseréli fel annak érdekében, hogy megkönnyítse emberek részvételét a kommunikációban. A feladatról szól néhány fólia is (Dobrowiecki Tadeusz készítésében).

Előzmények, alkalmazási területek

A tanszéken a kilencvenes évek óta foglalkozunk ágensrendszerek vizsgálatával, illetve alkalmazásukkal különféle területeken. Az intelligens ágensek szabványos kommunikációja (ACL) lehetővé teszi a fejlesztők számára különböző tartalom nyelvek alkalmazását. Érdekes lehet annak vizsgálata, hogy ezek a tartalom nyelvek mennyiben helyettesíthetők természetes nyelvekkel oly módon, hogy ne rontsuk az ágens nyelvek hatékonyságát (feldolgozhatóságát), ugyanakkor a gépi kommunikációt közelebb hozzuk az ágens közösségekben (pl. intelligens terekben) megjelenő emberekhez. (A feladat akár a tanszéki mitmót moduláris robothoz kapcsolódóan tovább is alakulhat.)

A tanszéken az "információ és tudás tárház" projektben az információhoz jutás folyamatát modelleztük, illetve javaslatokat tettünk ilyen rendszerek felépítésére és működésére. Egy információkereső rendszer egyik sarkallatos eleme a felhasználói kérések megfogalmazásának mikéntje: hogyan lehet megfogalmazni a felhasználó információs igényét létező tárgyterületi leírásokra (ontológiákra, adat- és tudásbázisokra) támaszkodva, az egyszerű kulcsszavas keresésnél lényegesen hatékonyabban. Ebben is segíthet egy jól szabályozott természetes nyelv, amely bár közel áll a felhasználó anyanyelvéhez, de nyelvtani szabályai, illetve szókincse a tárgyterületi tudásból származnak (ezáltal lehetővé téve az egyértemű gépi feldolgozást).

Részfeladatok

A kiírt feladat sokféleképpen részletezhető, néhány mérföldkövet szeretnék csak megfogalmazni:
  • irodalomkutatás: kontrollált természetes nyelvek, ágens kommunikációs nyelvek
  • (kontrollált) természetes nyelvek gépi feldolgozása
  • tárgyterületi háttértudás leírása (ontológia, tudásbázis)
  • nyelvtan és szókincs generálás tárgyterületi háttértudásból
  • ágens kommunikációs (tartalom) nyelvek
  • ágens rendszerek megvalósítása Jade környezetben (programozás)

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához jó programozói tudás szükséges, de speciális (pl. NLP) nyelvek és algoritmusok előismerete nem. Előzetesen csak alapszintű jártasság szükséges az MI egyes területein (lásd MI könyv ágensekről és kommunikációról szóló fejezetei).

A feladat megoldása során gyakorlati ismeretek szerezhetők egyszerűbb természetes nyelv feldolgozási és fordítási feladatokban, valamint mélyebb ismeretek ágensrendszerek megvalósításában (ágensek működése, kommunikációja, kooperációja, stb.). Alkalmazási területtől függően további gyakorlati ismeretek szerezhetőek pl. az információbeszerzés, beágyazott intelligencia, intelligens otthon, stb. témakörökben.

Kapcsolódó kutatás

Az előzményekben felsorolt (lezárult) projektek mellett a tanszék hasonló témájú OTKA pályázatot adott be 2007. szeptemberében.

Felhasznált eszközök

A fejlesztés Eclipse / Jade környezetben zajlik. Kisebb webes (HTML, PHP) feladatok is elképzelhetők. Megfelelő érdeklődés esetén egyedi (beágyazott) hardver és szoftver eszközök alkalmazására is lehetőség van. A feladat hosszabb távú célkitűzése az, hogy az intelligens terek különféle eszközeit is bevonjuk a mintaalkalmazásokba, illetve olyan érdekes és jövőbemutató alkalmazási környezetek eszközeit is megvizsgáljuk, mint például az otthoni betegellátás, illetve az idősek egészségügyi (táv)felügyelete.

Ajánlott olvasmányok

(bővítés alatt)
  1. A bevezetésben említett demonstráció részletesebb ismertetője:
    Mészáros Tamás, Dobrowiecki Tadeusz, Kiss Margit: "Kontrollált természetes nyelvű lekérdezés webes adatbázisokhoz" In: Networkshop 2007, Eger, Magyarország 2007.04.11.-2007.04.13, 2007.
  2.