Információszûrés az Useneten
A WWW mellett a Usenet is fontos szerepet tölt be az interneten.
A maga struktúrált témakörszerkezetével
könnyebb eligazodást nyújt az információkeresésben.
Nagyszerû vizsgálódási területe a szövegalapú
infószûrésnek és -gyûjtésnek. Ha
szétnézünk (*) helyen, akkor megfigyelhetõ, hogy
milyen nagy az igény az ilyesféle ágensek iránt.
A legtöbb ügynök olyan szolgáltató, amely
egy központi szerveren mûködik és a felhasználók
(kliensek) e-mailen vagy WWW-browseren keresztül kommunikálnak
vele. Az ágens olyan szolgáltatást nyújt, hogy
a felhasználó igényei alapján megtanulja annak
érdeklõdési köreit és a témaköröknek
megfelelõ hírcsoportokban felbukkanó cikkekbõl
a megfelelõket válogatja ki (lehetõség van
a drótpostázásra is). A CNN+ képes KQML
nyelven más ágensekkel "beszélgetni".
Néhány Usenet-ágens megvalósítása:
- SIFT: jelenleg nem elérhetõ.
- NewsSIEVE
Homepage: ha regisztráltattuk magunkat, akkor elõre meghatározott
hírcsoportokból válogathatunk. WWW-böngészõ
alatt Java-applet ablakokkal férhetünk hozzá az áhított
cikkekhez. A minden hírcsoportra vonatkozó cikk-kiválasztási
szabályokat úgy állapíthatjuk meg, hogy minden
szabály tartalmaz egy pontszámot és szavakat. Egy
hírcsoportból csak azokat a cikkeket fogja megjeleníteni,
amelyekre illeszkedik legalább egy szabály (tartalmazza az
adott szavakat) és a pontszám jelenti az adott cikkre az
osztályzatot. Egy hírcsoport böngészésénél
a cikkek az osztályzatoknak megfelelõ csökkenõ
sorrendben jelennek meg. A cikkeket pozitív, negatív ill.
semleges véleménnyel láthatjuk el, amivel finomíthatjuk
a találatot. A legközelebbi futtatáskor már
a finomított találatokat jelenííti meg.
- CNN++
- An intelligent News filter Agent: a felhasználó e-mailen
keresztül kommunikálhat a szerverrel egy meghatározott
utasításkészlettel (ld.).
Cikkeket hozhatunk le és osztályozhatjuk õket (visszajelzés
útján).
- Infoscan:
egy személyi titkár, amely képes hírcsoportok
és e-levelek szûrésére, a felhasználó
érdeklõdési köreinek megfelelõen. Több
infót itt
találhatsz. Letölthetõ(Win95).
- Clarinet:
elektronikus újság Usenet formában. Rövid összefoglaló
itt. Nem
csak a klasszikus értelemben vett hírcsoportokat képes
kezelni, hanem virtuális (elõfizetõk számára
látható) hírcsoportokat is létrehoz.
Ha ezen kívül érdekel az információkeresés
és -gyûjtés, akkor nézz be ide.
Információszûréssel foglalkozó cikkek
helyi gyûjteménye
Abakus93.ps : egy alapvetõ bevezetõ
cikk az infószûrõ technikák lelkivilágába.
Számos technikát és elméletet vonultat fel
(automatikus kulcsszó-indexelés, vektortér-modell,
Schank-scriptek, stb.) és ötvözni ill. továbbfejleszteni
próbál néhány megközelítést.
Balt.ps : az orvosi információs
rendszerekben alkalmazott technikákról szóló
beszámoló. A jelenen túl a további lehetséges
irányokról is szól.
Filter.ps : fogalmi keretet ad a szövegszûrésnek.
A szövegszûrés olyan infókeresõ metódus,
ahol egy változó szövegfolyam dokumentumokat választunk
ki, hogy egy stabil és egyéni információszükségletet
elégítsünk ki. Történelmi áttekintés
után esettanulmányok is olvashatók e cikkben.
Signidr.ps : egy prezentáció
az intelligens információszûrésrõl. Címszavakban
beszél, nagyszerû gyors áttekintésnek.
Innc94.ps : a személyi információs
szûrésre mutat egy példát neurális hálózat
alkalmazásával, alapelvek bemutatásával.
Ml95.ps : a Newsweeder hírszûrõ
ágens bemutatása. A felhasználó érdeklõdési
területei megtanulásának metódusát írja
le, ill. a hatékonyságát elemzi különbözõ
tanulási módszerek beépítésével.
News-fil.ps : a Newt rendszer ismertetése:
olyan intelligens infószûrõ ágens, amely a Usenet
cikkeit dolgozza fel; kulcsszóalapú szûrési
metódust és felhasználói visszajelzésen
alapuló cikkosztályozást használ, genetikus
algoritmus tanulási rendszerrel.
drótposta