Integrált Intelligens Rendszerek Labor
Text Miner konfigurációs fájlokról
Az egyes fájlok a Textminer könyvtár alatt az "sbin\mine"-ban
találhatók.
Tipikusan "C:\SPSSLQ\TMFC\sbin\mine\". A legt0bb konfigurációs fájlnak
létezik globális és prefix (kb. lokális) változata, utóbbi egy konrét dokumentum
feldolgozáshoz tartozik és annak nevét viseli perfix-ként. A prefix konfig
fájlok a textminer csomópont egyszeri lefutása után jönnek létre.
További segítség a hivatalos doksiban.
OPTION FILES
| exclurep.lst |
A felsorolt abszolút könyvtárak NEM lesznek beolvasva, és így a bennük
lévõ dokumentumok nem lesznek feldolgozva |
| extensio.lst |
A felsorolt kiterjesztésû fájlok lesznek csak feldolgozva (pl: .html,
.xml, .txt) |
DOCUMENT FORMAT FILES
| mclef.txt |
Strukturált dokumentumokhoz megadhatók mezõket elválasztó szövegek, illetve
a mezõkhõz tartozó fogalom típusok (pl: AUTH:P) |
| mtag.txt |
XML fájlokhoz meg tudjuk adni, hogy mely elemek tartalmát akarjuk feldolgozni
- ezeket fel kell sorolni (pl: <content>, <a, <table) |
DICTIONARY FILES
| dico.pos |
felsorolhatunk fogalmakat, amelyeket szeretnénk még kinyerni mindenképpen |
| dico.sup |
Felsorolhatunk fogalmakat, amelyeket nem szeretnénk kinyerni (wildcard-ot
használhatunk) |
| synonym.add |
Szinonímákat sorolhatunk fel (rekurzíven fut a szinoníma
átalakítás) |
| synonymconf.txt |
Szinoníma listát tartalmazó egyéb fájlot adhatunk meg |
| location.add |
Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (L) |
| name.add |
Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (P) |
| organization.add |
Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (O) |
| product.add |
Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (D) |
| term.add |
Megadhatunk fogalmakat, amelyek ebbe a kategóriába fognak esni (T) |
| location.kw |
Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (L) |
| name.kw |
Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (P) |
| organization.kw |
Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (O) |
| product.kw |
Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (D) |
| term.kw |
Megadhatunk kulcsszavakat szabályokhoz, az így felismert fogalmak ebbe a kategóriába fognak esni (T) |
| globalcat.txt |
Megadhatunk konrét fogalom-kategória párokat (ez a szótár lesz utoljára feldolgozva, pl: charlotte, L) |
Fogalom kategóriák
| D |
Product |
| L |
Location |
| O |
Organization |
| P |
People |
| C |
Custom category |
| T |
Term |
| U |
Unknown |
| d |
Date |
| t |
Time |
| c |
Currency |
| u |
URL |
| e |
Email |
| % |
Percent |
| # |
Digit |
|