Integrált Intelligens Rendszerek Labor


Text Miner konfigurációs fájlokról

Az egyes fájlok a Textminer könyvtár alatt az "sbin\mine"-ban találhatók. Tipikusan "C:\SPSSLQ\TMFC\sbin\mine\". A legt0bb konfigurációs fájlnak létezik globális és prefix (kb. lokális) változata, utóbbi egy konrét dokumentum feldolgozáshoz tartozik és annak nevét viseli perfix-ként. A prefix konfig fájlok a textminer csomópont egyszeri lefutása után jönnek létre.

További segítség a hivatalos doksiban.

OPTION FILES

exclurep.lst A felsorolt abszolút könyvtárak NEM lesznek beolvasva, és így a bennük lévõ dokumentumok nem lesznek feldolgozva
extensio.lst A felsorolt kiterjesztésû fájlok lesznek csak feldolgozva (pl: .html, .xml, .txt)

DOCUMENT FORMAT FILES

mclef.txt Strukturált dokumentumokhoz megadhatók mezõket elválasztó szövegek, illetve a mezõkhõz tartozó fogalom típusok (pl: AUTH:P)
mtag.txt XML fájlokhoz meg tudjuk adni, hogy mely elemek tartalmát akarjuk feldolgozni - ezeket fel kell sorolni (pl: <content>, <a, <table)

DICTIONARY FILES

dico.pos felsorolhatunk fogalmakat, amelyeket szeretnénk még kinyerni mindenképpen
dico.sup Felsorolhatunk fogalmakat, amelyeket nem szeretnénk kinyerni (wildcard-ot használhatunk)
synonym.add Szinonímákat sorolhatunk fel (rekurzíven fut a szinoníma átalakítás)
synonymconf.txt Szinoníma listát tartalmazó egyéb fájlot adhatunk meg
location.add Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (L)
name.add Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (P)
organization.add Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (O)
product.add Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (D)
term.add Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (T)
location.kw Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (L)
name.kw Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (P)
organization.kw Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (O)
product.kw Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (D)
term.kw Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (T)
globalcat.txt Megadhatunk konrét fogalom-kategória párokat (ez a szótár lesz utoljára feldolgozva, pl: charlotte, L)

Fogalom kategóriák

D Product
L Location
O Organization
P People
C Custom category
T Term
U Unknown
d Date
t Time
c Currency
u URL
e Email
% Percent
# Digit