Curs 4 asistată de calculator traducere și traducere automată

SISTEM DE TRADUCERE SI AUTOMAT de traducere automată

De-a lungul ultimilor 10-15 de ani, natura muncii traducătorului și cerințele sale s-au schimbat în mod semnificativ. În primul rând schimbări au afectat traducerea științifice și tehnice, și documentele oficiale de afaceri. Nu este suficient pur și simplu pentru a traduce un text, utilizând computerul ca o mașină de scris. Clientul se așteaptă un traducător că proiectarea documentului finit va corespunde cu apariția originalului cât mai aproape posibil, în timp ce îndeplinesc standardele de performanță în această țară. Translatorul necesită, de asemenea, capacitatea de a utiliza în mod eficient o comenzile finalizate anterior pe aceeași temă, și angajatorul, la rândul său, se bazează pe o perioadă semnificativă de timp și economii de costuri în traducerea fragmentelor de text repetate sau similare. Aceste condiții, dure adesea contradictorii pot fi observate numai în cazul în cazul în care interpretul nu este numai fluent în limba maternă și străină, și profund studiat zona lor de subiectul ales, dar, de asemenea, se concentrează cu încredere în tehnologii moderne de calculator.

O documentație tehnică cheie pentru traducerea în aceste condiții este tehnologia Translation Memory (TM). sistemele de traducere automată este dat puțin spațiu, ca și posibilitatea lor limitate și nu este posibil de a le recomanda pentru a fi utilizate în cursul activității profesionale asupra textului.

În ultimii ani, volumul remitențelor a crescut constant, legate de tehnologia informației, precum și de traducere și de calculator companiile trebuie să se ocupe nu numai cu pregătirea documentației, dar, de asemenea, localizarea software-ului, și anume transferul de resurse conținute în dosarele exe- și dll-. Și cu testarea software-ul ulterior.

Ce este masina de traducere și sisteme de traducere automată, modul în care acestea diferă și modul în care poate ajuta traducătorul în lucrarea sa.

traducere automată

Traducere automată - proces de traducere Word (scris, și în mod ideal, oral) de la un limbaj natural la un alt computer cu totul speciala. De asemenea, se referă la direcția de cercetare științifică referitoare la construirea unor astfel de sisteme.

Forme de organizare a interacțiunii de calculator și de traducere automată umană

Cu omul predredaktirovaniem se potrivește text la mașina de prelucrare (eliminând posibilitatea citirii ambigue, facilitează și marchează textul), urmat de prelucrare începe software.

Cu omul interredaktirovaniem intervine în activitatea sistemului de traducere, permițând cazuri dificile.

Sisteme mixte (de exemplu, simultan cu pre și post-editare).

traducere automată

În loc de „mașină“ este uneori folosit cuvinte în mod automat. care nu afectează sensul. Cu toate acestea, termenul automatizat traducerea are un sens complet diferit - cu el programul, pur și simplu ajută o persoană pentru a traduce texte.

traducere automată implică astfel de forme de cooperare:

Traducere parțial automatizate: de exemplu, utilizarea unui calculator traducător-persoană.

Sistem cu diviziune a muncii: computerul este instruit pentru a traduce doar fraze specificate în mod rigid structura (dar face, astfel încât nu au nevoie să-l corecteze) și încă nu îndeplinesc schema dă o persoană.

În terminologia engleză variază, de asemenea, termeni, traducere automată (traducere complet automat) MT și-mașină asistată sau mașină-assistedtranslation (MAT) (automat); dacă este necesar să se identifice și apoi, și mai mult, (A) T. M scrisă

Istoria traducere automată

Ideea de a utiliza un calculator pentru transferul a fost efectuat în anul. imediat după apariția primelor calculatoare. Prima traducere mașină publică (așa-numitul experiment Georgetown) a avut loc în anul. În ciuda primitivitate sistemului (un dicționar de 150 de cuvinte, de la 6 din normele, traducerea câteva fraze simple,), experimentul a primit un răspuns larg: de cercetare a început în. și alte țări; în același în 1954 și în.

Până la mijlocul Statelor Unite pentru aplicarea practică a sistemului de traducere rusă-engleză două au fost furnizate de:

MARK (Departamentul artei străine Air Force);

GAT (dezvoltare la Universitatea Georgetown, a fost folosit la Laboratorul Național de Energie Atomică din Oak Ridge și în centrul Euratom în Ispra, Italia).

Cu toate acestea, stabilit pentru evaluarea unor astfel de sisteme, Comisia a ajuns la concluzia că, având în vedere calitatea slabă a mașinii de tradus texte ale acestor activități în Statele Unite sub neprofitabilă. Deși Comisia a recomandat să continue și să aprofundeze evoluțiile teoretice, în general, constatările sale au dus la o creștere. scăderea finanțării, de multe ori la o încetare completă a activității pe această temă.

Cu toate acestea, în unele țări, studiul a continuat, alimentat de progresul constant al tehnologiei de calculator. Un factor deosebit de important este apariția mini și computere personale, precum și cu ei tot vocabularul mai complexe, și așa mai departe. N. sisteme de date estestvennoyazykovymi centrice. A crescut și nevoia de traducere, ca atare, din cauza creșterii relațiilor internaționale. Toate acestea au condus la un nou avînt în zona, starea vine aproximativ la mijloc. Timpul a venit utilizarea practică pe scară largă a sistemelor de traducere, există o piață de dezvoltare comercială pe această temă.

Cu toate acestea, visul la care rasa umană a luat o jumătate de secol în urmă, pe sarcina de traducere automată, într-o mare măsură, să rămână vise: o traducere de înaltă calitate a subiectului general al textului este încă imposibil de atins. Cu toate acestea este de necontestat accelerarea traducerii folosind sistemele de traducere automată estimate la sfârșitul anilor 1980, până la cinci ori.

În prezent, există o serie de proiecte comerciale de traducere automată. Unul dintre pionierii în domeniul traducerii automate a fost compania. În România, o mare contribuție la dezvoltarea traducere automată a făcut o echipa condusa de prof. R. G. Piotrovskogo (Română Pedagogică de Stat Universitatea. Herzen).

Calitatea traducerii

Utilizarea de traducere automată, fără ajustarea temei (sau setarea incorectă în mod intenționat) este subiectul a numeroase glume roaming pe Internet. Din exemple lungi ale celor mai renumite text „Șoriceii Drover“ (traducere o documentare Poliglossum program de calculator bazat pe medicale, comerciale și dicționare juridice); pe scurt - o fraza «Pisica mea a dat naștere la patru pisoi, două galbene, unul alb și unul negru», software-ul PROMT care se transformă în „Pisica mea a dat naștere la patru pisoi, doi, unu alb colorat în galben și un afro-american.“

Cel mai adesea, o astfel de glumă, datorită faptului că programul nu recunoaște contextul fraze și termeni se traduce cuvânt cu cuvânt, la fel fără a distinge numele proprii de cuvinte comune. Același Promt program face «sutien-KET notație» în „Nota Kate sutien», «algebra Lie» - în „Algebra Lie», «vector excentricitatea» - într-un «vector de originalitate,» etc ...

Sisteme de traducere automată


munca profesională este imposibilă fără instrumente de încredere. Traducere și localizare ca domeniu de activitate profesională în acest sens, nu este o excepție. Fiecare traducător se confruntă cu problema aplicării consecvente a terminologiei glosar în cursul unui proiect lung sau reutilizarea rapidă a textului tradus anterior. Prin natura lor, astfel de sarcină de rutină este relativ ușor (în contrast cu traducerea automată) formalizate și programate echipamente de Localizer automatizate mijloace atât la locul de muncă este norma în industrie, unele dintre aceste mijloace sunt, în esență standarde industriale.

Cele mai multe astfel de instrumente se bazează pe conceptul de memoria de traducere (memorie de traducere) - baza de date simplă, fiecare intrare care reprezintă o unitate (propoziție sau paragraf) texte paralele (de obicei bilingvă). Această bază de date stochează traducerile anterioare pentru soluții de căutare rapidă a problemelor privind conținutul posibil reutilizarea și. În ciuda faptului că programele sunt echipate cu memoria de traducere sunt denumite traducere asistată de calculator (CAT, / traducerea asistată asistată de calculator), nu trebuie confundat cu traducere automată (traducere automată) - traducere de memorie nu se traducere din în timp ce traducerea automată se bazează pe generarea remitențelor, ca urmare a analizarii textului sursă.

De obicei, intrarea în traducere este format din două segmente: sursa (sursa) și limba finală (țintă). În cazul în care are loc identice (sau similare), în segmentul limbii sursă în segmentul de text în limba țintă este găsit în memoria de traducere, traducător este furnizat ca bază pentru un nou transfer. Găsit automat textul poate fi utilizat ca atare, editat sau respinsă complet. Cele mai multe programe folosesc algoritmul de potrivire neclare (potrivirea neclare), îmbunătățește semnificativ funcționalitatea lor, la fel ca în acest caz, puteți găsi oferte doar o asemănare slabă pentru expresia de căutare, dar cu toate acestea potrivite pentru editarea ulterioară.

Avantajele utilizării astfel de software nu pot fi evidente la inceput - dar, deoarece conținutul bazei de date de substituție automată a unui cadru pentru transferul va deveni mai precis și regulate.

traducere automată

traducere automată (CAD, Computer-AidedTranslation) - texte folosind tehnologia de calculator. De la traducere automată (MT) este caracterizat prin aceea că întregul proces de traducere se face de către om, un calculator ajută doar să-l efectueze un text pregătit în mai puțin timp, sau cu cea mai bună calitate.

AP Ideea a venit odată cu apariția calculatoarelor: traducătorii au opus întotdeauna standardul la acel moment conceptul MP, care a fost trimis la majoritatea cercetărilor în domeniul lingvisticii computaționale, dar a sprijinit utilizarea calculatoarelor pentru a ajuta traducători. În anii Comunității Europene a Cărbunelui și Oțelului (predecesorul modern) a început să creeze baze de date terminologice sub un nume comun. În Uniunea Sovietică pentru a crea o bază de date a fost stabilită de acest fel.

În prezent, cele mai comune modalități de utilizare a calculatorului în traducerea este lucrarea cu dicționare și glosare, memorii de traducere (TranslationMemory, TM), conținând exemple de texte traduse anterior, și utilizarea așa-numitul. colecții mari de texte în una sau mai multe limbi, care oferă o scurtă descriere a modului de cuvinte și expresii sunt într-adevăr utilizate în limba ca un întreg sau într-un anumit domeniu.

La utilizarea simultană a traducere automată a necesității de a transfera limitat. utilizați dicționare care sunt încărcate pe unul dintre exemple. Un alt exemplu este extragerea semiautomată a listelor termen în curs de pregătire pentru traducere simultană în domeniu îngust.

În zonele supuse înguste, cu un număr mare de surse și a stabilit traducători terminologie poate folosi de traducere automată, care poate oferi o bună calitate a traducerii și a terminologiei de expresie stabilă într-un interval îngust. Interpret în acest caz poartă textul obținut. Mai mult de jumătate din textul din interiorul (în principal teste legale și corespondența reală) este transferată folosind IP.

memoria de traducere

Memorie de traducere (PP, translationmemory TM numit uneori „translatarea de unitate“.) - o bază de date care conține un set de tradus anterior. O înregistrare într-o bază de date corespunde unei „unități de traducere» (translationunit), pentru care, de obicei, durează una (cel puțin - oferte de piese slozhnosochinonnogo, sau). În cazul în care o altă propunere a textului sursă se potrivește exact propoziția stocată în baza de date (potrivire exactă, PotrivireExactă), acesta poate fi completat automat în traducere. Noua ofertă poate diferi ușor față de datele stocate în (potrivire inexactă, fuzzymatch). O astfel de propunere poate fi substituit în traducerea, dar traducătorul va trebui să facă modificările necesare.

În plus față de accelerarea procesului de a repeta fragmente de traducere și modificări ale textelor traduse (de exemplu, noi versiuni ale software-ului sau modificări ale legislației) sistem PP oferă, de asemenea, uniformitatea terminologiei în traducerea fragmente identice, care este deosebit de important în traducere tehnică. Pe de altă parte, în cazul în care interpretul substituie în mod regulat în traducerea sa potriviri exacte, transferuri extrase din bazele de date, cu nici un control al utilizării acestora într-un nou context, calitatea textului tradus poate fi afectată.

În fiecare sistem, datele PP sunt stocate în formatul său propriu (format text în Wordfast, baze de date Access în Deja Vu), dar există un standard internațional (TranslationMemoryeXchangeformat), care se bazează pe XML, care poate da naștere la aproape toate a sistemului PP. Datorită rezultatelor traducătorii pot fi schimbate între aplicații, și anume traducător de lucru cu OmegaT poate utiliza PP, creat în Trados, și vice-versa.

Majoritatea sistemelor PP cel puțin să sprijine crearea și utilizarea de dicționare de utilizator, crearea de noi baze de date pe baza unor texte paralele (aliniere), iar extracția semiautomată a terminologiei din textele originale și paralele.

sisteme software populare PP

Conform unei analize recente a utilizării sistemelor PP către cele mai populare sisteme includ:

(Sistem liber, lansat sub licență)