caietul de sarcini model de

în cazul în care y - scor semn;

n ≥ 2 - număr de factori independenți incluși în model;

f (X) - o funcție care reflectă relația de regresie;

# 949; - componenta aleatoare.

Atunci când se utilizează mai multe modele de regresie în mod tipic pe lângă construcția ecuației de regresie și de a determina factorii de influență cumulat asupra componentei simulate este determinată ca influența asupra rezultatului fiecărui factor izolat.

În alte semne de factori sunt numite, de asemenea, pentru a explica predictor, variabilele exogene, covariabile. Dependent, rezultat variabila y este uneori numit endogen.

În funcție de tipurile utilizate în model sunt următoarele tipuri de modele econometrice:

1) liniar (în cazul în care o relație liniară este utilizată între exponenții) (y = ax + b [1] sau y = a1 + a2 x1 x2 + ... + un xn + b);

2) neliniar (dacă se utilizează relația neliniară). Diferite funcții pot fi folosite aici, la rândul său:

a) polinoame de grade diferite, pornind de la al doilea, adică,

- Funcția pătratică (y = ax 2 + bx + c), [2]

- Funcția cub (y = ax 3 + 2 + bx cx + d)

b) o funcție de putere (y = ax b)

c) o funcție hiperbolică (y = a / x + b)

d) funcția exponențială (exponențială) [3] (y = ae bx)

d) alte funcții neliniară (un simplu exponent modificat (at = k - ae bx); curbă logistică (y = k / (1 - ae bx)); Gompertz funcția y = k, etc.)

Mai în detaliu, fiecare dintre aceste funcții vor fi luate în considerare atunci când studiază tema „modelul de regresie nelineară“.

Clasificarea modelelor econometrice pentru tipurile de date. În plus, modelele econometrice pot fi clasificate în tipuri de date. Și anume, datele inițiale pentru modelul de serie poate fi spațială sau temporală.

date spațiale (date transversale) sunt date privind indicatorii economici, la un anumit moment (de exemplu, datele privind cererea pentru anumite produse nivelul mediu al veniturilor și nivelul mediu în diferite regiuni ne permit să investigheze relația dintre cerere și venituri).

serii de timp (date serii de timp) ne permit să studiem dependența de timp (de exemplu, în conformitate cu cererea de produse în aceeași zonă în momente diferite permit un astfel de studiu pentru cererea).

Principalele probleme întâlnite în procesul de modelare și erorile asociate. Principalele probleme care apar în cursul simulării, și posibilele erori aferente:

1) Problema factorilor de selecție incluse în model

a) numărul de factori

b) compoziția calitativă a factorilor

Cele două părți ale aceleași probleme sunt strâns legate. Factorul de selecție substanțială este foarte importantă, deoarece este baza caietului de sarcini model. Cei mai mulți factori care afectează rezultatul care trebuie luate în considerare, modelul mai adecvat, mai aproape de realitate va fi construit. Dar, pe de altă parte, există un model de risc pentru a include factori suplimentare care nu sunt semnificative în acest studiu. Acest lucru poate duce la rezultate aparent absurde (ca un exemplu, o anecdotă despre pericolele de castravete: „Cât de mulți oameni au murit la o vârstă fragedă, să mănânce castraveți aproape 100% - prin urmare, castravete dăunătoare pentru sănătate?“).

Mai mult decât atât, cei mai mulți factori incluși în model, deci este mai greu de premii în bani și, uneori, poate fi contracarat de dificultățile asociate cu construcția și utilizarea modelelor.

Uneori, numărul de factori incluși în model, pot fi reduse prin agregarea lor, și anume, combinarea mai multor factori în una singură. De asemenea, incluse în modelul de timp, uneori, se poate lua în considerare nu sunt luate în considerare într-o formă explicită factorii asociați cu timpul.

Erori în caietul de sarcini al modelului poate fi, de asemenea, admis datorită faptului că semnele de factori afectează nu numai rezultatul, dar, de asemenea, unul de altul.

2) Problema determinării relației dintre factorii

a) selectarea unei funcții de modelare

b) determinarea parametrilor acestei funcții

Cea mai simplă funcție este liniară, iar atunci când este cuplat de regresie pentru că este necesar să se definească doi parametri. Cu toate acestea, nu toate dependențele pot fi modelate folosind această funcție. La utilizarea funcțiilor de bază non-liniară este, de asemenea, necesar să ne amintim că câștigarea adecvarea însoțită de un model de creștere complexitate.

3) determinarea datelor originale pe care modelul este de a fi construit

a) volumul probei

b) compoziția eșantionului

Atunci când construirea unui model econometric nu se poate explica toate valorile posibile ale indicatorilor, deoarece acestea sunt, de obicei, foarte mult, și, uneori, chiar și un număr infinit. De exemplu, prin examinarea dependența cererii pe venit printr-un sondaj de consumatori, este de obicei imposibil de a intervieva toți potențialii cumpărători, iar interviul doar câteva dintre ele. In acest studiu, toți cumpărătorii reprezintă populația generală, și interogat (înregistrate în model) - probă.

În cazul în care proba este mic, atunci există câțiva indicatori de combinații posibile de valori, și, prin urmare, probabilitatea de detectare a unei combinații de valori aleatoare, care arată dependența puternică, ceea ce nu este de fapt. De exemplu, intervievarea câteva sute de oameni, putem rula la întâmplare în oameni care sunt la venituri ridicate plasarea puțin cererii pentru acest produs, din care fac concluzia greșită despre relația dintre acești parametri.

Un alt exemplu care este adesea utilizat în teoria probabilității - o tragere la sorți (în cazul în care populația generală - un număr infinit de experimente). În condiții normale de strat sau cozi picătură frecvență aproximativ egală. Să presupunem că moneda este deteriorat, iar brațele de cădere în 60% din cazuri. Să dimensiunea eșantionului - 100 experimente separate, iar brațele au căzut 58 de ori. Aceasta este o incertitudine foarte mare, sugerează că moneda este echilibrată în mod corespunzător, pentru că abaterea de așteptat 50% nu este atât de mare. Pentru a confirma ipoteza că deteriorarea monedei ar fi fost un număr mai mare de experimente, de exemplu, 1000. Cu toate acestea, în cazul în care o monedă a fost deteriorat semnificativ mai mult (de exemplu, stema ar fi scăzut în 99% din cazuri), și într-un eșantion de 100 de experimente, aceasta a scăzut la 98 de ori, atunci ar fi un semn clar de deteriorare a monedei.

Dimensiunea minimă a eșantionului. Ultimul exemplu arată că dimensiunea minimă necesară eșantionului depinde de cât de puternic de obligațiuni explora.

Construirea unui model econometric bazat pe o dimensiune a eșantionului dat, putem emite ipoteza că există o relație destul de puternică între indicatori. În realitate, această relație să nu fie disponibilă (numesc ipoteza nulă). Dacă ipoteza noastră este importantă, cum putem fi siguri că? Este chiar mai important decât mai puțin probabil să-l accepte, dacă de fapt pus în aplicare ipoteza nulă. Adică probabilitatea ca am stabilit o legătură atunci când aceasta nu este, de fapt, ar trebui să fie mici. Această probabilitate este dependentă de vedere funcțional de mărimea eșantionului și cât de puternică relație ne-o dorim pentru a detecta. Pentru a determina această probabilitate, folosind tabele statistice care să reflecte valorile funcțiilor corespunzătoare. La rândul său, atunci când determină dimensiunea eșantionului pentru construirea unui model econometric sunt rugați să solicite această probabilitate.

În plus, trebuie amintit faptul că numărul de observații din eșantion trebuie să depășească numărul de caracteristici în câteva ori la parametrii unei ecuații de regresie multiple au fost statistic fiabile.

coeficientul de corelație. La efectuarea unui studiu econometric, de regulă, în plus față de construcția ecuației de regresie se calculează ca indicatori de apropiere a legăturii dintre parametrii. Unul dintre acești indicatori - coeficientul de corelație. Acesta măsoară gradul de apropiere a relației liniare dintre variabilele.

Coeficientul de corelație între variabilele x și y se calculează cu formula: