operațiune de bază în r

Deci, în primul articol, vom introduce metodele de calcul al unor indicatori, grupați sub conceptul general sau statistici descriptive de bază. Este acceptat la media (media aritmetică, mediana, modul), valoarea minimă și maximă, dispersia și abaterea standard de variație, cvartilei și percentila ...

Ca un set de rezultate observaționale a crea un set de valori care se supun legii de distribuție normală, care constă din 100 de observații din media aritmetică a 50 și o deviație standard de 5. Fișierul de lucru este atașat la articol și este disponibil pentru toți utilizatorii înregistrați. Puteți genera aceste valori le folosiți comanda:

> X write.csv (x, file = "data.csv")

Acum, setul generat de valori stocate în folderul Documentele mele în data.csv fișier. Se poate, în orice moment de apel, prin tastare:

> Read.csv (file = "data.csv", antet = TRUE, decomandat = " "DEC =".")

sau atribuie o valoare unei variabile:

> X medie (x)
[1] 50.33122

În R, puteți cere întotdeauna un algoritm de calcul, în cazul în care nu sunteți sigur sau nu știu cum să efectueze comanda sa. Astfel, de exemplu, media aritmetică este suma tuturor valorilor, împărțită la numărul lor. Astfel, media aritmetică poate fi calculată folosind:

Pentru a calcula mediana următoarea comandă:

Dar pentru standardul de moda in comanda R nu este furnizat, deci utilizați următoarea expresie:

Valorile minime și maxime pot fi calculate utilizând următoarele comenzi, respectiv:

Echipa gama standard, reflectă „de la-la“ valori în formatul interval (de la minim la maxim):

> Interval (x)
[1] 39.44106 65.11346

Pentru a calcula într-adevăr răspândirea, trebuie să introduceți următoarea comandă:

Cu ajutorul următoarei expresii pot fi calculate valorile de variație:

Rădăcina pătrată a acestei valori arată o (rms) Deviație standard:

Cifra din urmă poate fi calculată cu ajutorul unei funcții speciale pentru calcularea abaterii standard:

Pentru a calcula quartilele introduceți următoarea comandă:

> Cuantila (x)
0% 25% 50% 75% 100%
39.44106 47.04634 50.56743 52.57987 65.11346

Rezultatele obținute arată o valoare minimă, primul, al doilea, al treilea și al patrulea cuartile.

Pentru a calcula o percentila (cuantila), utilizați comanda:

Vectorul Argumentul „c“ indică fracțiunea corespunzătoare a unității. De exemplu, pentru a calcula 30, 60 și 90% quantile, introduceți comanda:

> Quantile (x, c (.30. 60. 90))
30% 60% 90%
48.52572 51.30114 56.32634

Există, de asemenea, o comandă pentru a invoca un set standard de statistici descriptive. De exemplu:

> Sumar (x)
Min. 1st Qu. Mediana Mean treia Qu. Max.
39.44 47.05 50.57 50.33 52.58 65.11

> Fivenum (x)
[1] 47.02794 50.56743 52.61602 39.44106 65.11346

Cu ultima comandă a obținut o valoare minimă, prima cuartilă, mediana, al treilea sfert și valorile maxime.

Toate aceste comenzi sunt de bază - construite în R. În plus față de comenzile standard, există mai multe pachete diferite, care vă permit cum să automatizeze procesul de calcul și de a aplica alte algoritmi de calcul a valorilor statistice.