Teoria tezaurului - urlete în

Teoria tezaurului.

Tezaur - ontogenie.

Deci, de ce avem nevoie de un tezaur ajută la integrarea cunoștințelor și creșterea eficienței muncii prin optimizarea procesului de comunicare. Prin urmare, este necesar să-l ia în considerare în detaliu. Dar mai întâi ce definesc un tezaur.

Tezaur - Definiție

Deci, tezaur (din greacă thesuarus „comoara, o comoara.“):
  1. Dicționar, care sunt prezentate cât mai complet posibil, toate cuvintele limbii, cu o listă exhaustivă de exemple de utilizare a acestora în texte;
  2. tezaur, care arată relațiile semantice (genul specifice, și alte sinonime.) între unitățile lexicale, adică relația dintre denotațiilor pe care le reprezintă.

Tezaur în primul sens pentru a pune în aplicare pe deplin numai pentru limbile moarte, de exemplu, „Tezaur Lingue Latine“. Pentru acest tip de abordare, precum și „Dicționarul limbii poloneze a secolului al XVI-lea.“.

bază structurală pentru tezaur, în al doilea sens este, de obicei, un sistem ierarhic de concepte, și anume denotata furnizarea de căutare a sensului unităților lexicale, adică căutați cuvinte bazate pe conceptul.

tezaure populare și caracteristicile lor.

Fiecare tradiție națională a creat propriul tip special de tezaur. Pentru a vedea modul în tezaur, ceea ce utilitatea și unicitatea caracteristicilor sale sale, să ne întoarcem la popularul tezaur german DUDEN. Pe fiecare pagină a lui pictat orice fel de activitate umană în imagini. De exemplu, calea ferată. Pe fiecare imagine ilustrând modul feroviar stațiile, vagoane etc. se extind săgeți cu numere. Pe pagina următoare despre fiecare număr este scris numele său în limba germană, rusă, engleză. Pentru a ne imagina ce cuvinte de căutare special, cu un tezaur, imaginați-vă că noi nu știm nici o parte a echipamentului de tren, chiar și în limba lor maternă limba rusă. Dar această parte, putem găsi pe imagine, și apoi citește numele său la noi în lista de limbi de pe pagina următoare.

Este evident că aici vom merge nu este cuvântul (semn) la valoarea sa, atât în ​​dicționarul explicativ, iar în direcția opusă - de la notația la semnul. Aceasta este o diferență fundamentală de multe ori ascunse de caracteristicile dicționare ale structurii, dar pot fi urmărite destul de clar în tezaur de diferite specii. Într-adevăr, dacă ne-am întâlnit în text, nu știu cuvântul „cercuri“, suntem în căutarea pentru ea în dicționar al alfabetului cu litera „F“. Această piesă de îmbrăcăminte pentru femei din secolul al XIX-lea. Dar dacă vom vedea hainele aceste femei (cum ar fi într-un muzeu) și doresc să cunoască numele acestui articol, vom găsi în pagina DUDEN tezaur cu imagini de haine din diferite epoci, iar indicatorul este numele orice detalii și nu numai în limba lor maternă. Aceasta este situația cu care se confruntă persoanele implicate în orice activitate complexă împreună. De multe ori problema este o înțelegere clară, adică, desemnarea diferitelor sale facilități. Pentru a optimiza aceste procese în domeniul cercetării aerospațiale tezaur a fost creat de NASA.

Cel mai faimos tezaur francez - un Larousse celebru, în limba engleză este a lui Roget. alocări enorme în crearea tezaurelor specializate (de multe ori mai multe limbi), de regulă, este deja vândute pe suporturi de stocare cu suport software pentru utilizatori. De exemplu, în medicină, este un tezaur de SNOMED.

Teoria tezaurului și semiotica


Luați în considerare modul în care să pună în aplicare funcționalitatea tezaur în termeni de semiotică. Într-adevăr, așa cum sa menționat mai sus, într-un dicționar explicativ, suntem în căutarea pentru o explicație a cuvântului, și anume, Ne mutam de la semn denotatum -


Acest lucru înseamnă că denotația avem o funcție a semnului:


Tezaurul este implementat de funcția inversă -


Acesta este semnul unei funcții denotat -


Este evident că, în scopul de a realiza pe valoarea sa (denotatum), trebuie să găsiți funcția tipic tezaur de a găsi un cuvânt (semn) această însemnare, printre altele, ca el. Se face creatorii de tezaure oferi utilizatorului o imagine structurată a lumii, astfel încât el ar putea găsi în denotația lor. Creatorii dicționar DUDEN a decis cel mai simplu mod de a acestei probleme - au reprezentat cele mai populare activități umane pe mai multe sute de imagini, fiecare dintre care cititorul poate găsi obiectul propriu-zis. Dicționar de creatorii lumii Roget lui structurate ierarhic - merge de la general la particular. De la conceptele inițiale lumi-om natura viu-neînsuflețit, lumea tehnologiei, etc. cititorul până la denotatum dorit el, apoi își găsește numele său (de multe ori împreună cu un set de sinonime). O astfel de vedere structurată ierarhică a denotata mondială a constituit baza tezaurelor moderne implementate pe computere.

Teoria tezaurului și Informatică

De ce am nevoie de un tezaur în știința calculatoarelor? În primul rând - aceasta este extragerea de informații (SP). Într-adevăr, dacă ne uităm ceva pe internet cel mai simplu „iskalkoy“ vom găsi doar acele texte care includ specificate în cuvintele cheie din interogare. Vă puteți imagina ce caut informații despre flori. Cererea mea mi-ar aduce un text cu cuvântul. Acum, imaginați-vă că este necesar să-mi texte despre trandafiri sau garoafe, care nu a avut niciodată întâlnit cuvântul „flori“. Apoi, aceste texte nu va fi găsit, în ciuda oricăror creșteri ale vitezei procesorului. În cazul în care cererea de a trece printr-un tezaur simplu, acesta va implementa un termen de căutare în detaliu necesar, până la un nivel în structura tezaurului său de căutare denotatnoy. După ce merge în jos pe această structură la un nivel mai jos denotația „flori“, un program de sprijin al glosarului va tamrazvernutuyu imagine a lumii de flori cu numele lor. Adică, acest caz, cererea poate fi extins automat - acesta poate fi adăugat la numele de culori diferite și de căutare vor fi efectuate pe toate aceste titluri. Este destul de clar că rezultatele această căutare va fi mult mai complet.


De ce am nevoie de un al doilea tezaur. După cum sa menționat deja mai sus - este integrarea cunoștințelor și creșterea eficienței muncii prin optimizarea procesului de comunicare. Toate notațiile orice tip de activitate poate fi rezumate într-o structură ușor de utilizat în care este ușor să-l găsească denotație, atunci numele său folosește.

Tezaur - paradigme.

După cum sa menționat mai sus, tezaurul - este lumea in primul rand stukturirovanny denotata orice fel de activitate. Cel mai adesea aceasta este o clasificare ierarhică. Este necesar, în primul rând, pentru a găsi denotația corectă, și apoi l semneze. Într-adevăr, dacă văd piulița și nu știu ce se numește, chiar și în propria mea limbă, tezaur îmi oferă un astfel de model de căutare pe lemn: Nut - aceasta este ideea sau esența materialului. Apoi - piulița - este natura obiectului creat sau creat de om, etc. Ne mișcăm copac, până când vom ajunge la denotație ei, și apoi să vedem cum se numește.

terminologia Thesaurus.


Navigarea tezaurul și structura de conexiune semantică între notațiile denotatnoy descrie terminologia engleză. Chiar și în limba engleză - modernă imperială tezaur terminologia latină conține două dintre cele mai comune set de termeni sinonimi - una cu înclinații mai științifică, celălalt - cu un scop practic sau tehnic.

Să luăm în considerare cele mai frecvente dintre ele. Astfel, termenul mai mare în raport cu intrarea în dicționarul curent este numit Vraciul (hyperonym). Dar în știința calculatoarelor (în special într-un sistem software ce permite raelizovat tezaurul dvs. - MultiTes) acest termen se numește BT - termen mai larg (așa cum au fost - un termen mai larg). Pentru denotația „copac“ Vraciul va „planta“.

Și invers - termenul de bază - respectiv - hiponim (hiponim) sau software și hardware sinonimul său numit NT (Termen ingust). De exemplul nostru cu copacul va denotațiilor „molid“, „mesteacăn“, etc. Mai în detaliu, această terminologie este descris pe site-ul MULTITES.

tezaure populare și caracteristicile lor.

În forma sa pură este rară tezaur - mișcare cum ar fi, fără frecare sau siliciu pur. În tezaure reală va simplifica ideile inițiale sau adăugarea de informații străine, dar potențial dorit pentru utilizator. Acest lucru poate fi văzut foarte pe scurt pe tezaurele cunoscute, deja menționat.


DUDEN. Ideea de a găsi numele denotării este pus în aplicare cel mai simplu și clar. DUDEN este o carte de imagine pe partea dreapta (pentru o varietate de software) cu numerotată cu atenție cele mai mici detalii. Pe partea dreaptă a acestei este însoțită de o listă numerotată de titluri (chiar și în două limbi). De exemplu, - trase de cale ferată pe întreaga pagină utilaje, instalații, cale, etc. In dreapta puteți găsi numele trăgătorului, semafoarelor, cârje.

NASA Tezaur. Ca de SNOMED - tezaurului - una din marile realizări în domeniul lingvisticii. set sistematic de termeni privind tehnologia rachetelor și domenii conexe. NASA a făcut un site minunat. Puteți vedea acest lucru în interfața grafică dinamică tezaur original.

MULTITES. Este un instrument popular pentru crearea de dicționare. vă permite să prin intermediul GUI, urmați instrucțiunile simple pentru a construi un tezaur pentru un software specific, și doar a lua sub forma unui produs software.

WordNet - un tezaur inteligent calculator. Creat la Universitatea Princeton și este distribuit gratuit. Materialul principal al este situat pe site-ul său. Caracteristici cheie WordNet. Cuvintele în ea sunt grupate în grupuri de sinonime (synset - synset-uri). Acestea sunt împărțite în 4 vocabular - substantive, adjective, verbe și adverbe. Synset-uri combinate ca o relație ierarhică (și stafie tetralogie) și în relație antonimie și de asemenea meronimii (face parte din sau constă din n bucăți). De asemenea, a rezolvat problema morfologiei - cuvânt după apelul la tezaurul înapoi la forma originală gramatical normalizat. Descris în acest fel vocabularul în limba engleză (și acum și română) limba permite de a rezolva cu ajutorul tuturor, cele mai complexe provocări informaționale.