Omni calculator
Ultimo aggiornamento:

Calcolatore per il Test Z

Indice

Che cos'è il test Z?Quando si utilizza il test Z?Formula del test ZValore p ottenuto dal test ZTest Z bilaterale e test Z unilateraleValori critici e regioni di rifiuto del test ZCome usare il calcolatore per il test Z su un campione?Esempi di test ZFAQ

Questo calcolatore per il test Z è uno strumento che ti aiuta a eseguire un test Z sulla media di una popolazione. Esistono due forme di questo test, il test Z bilaterale e il test Z unilaterale, che possono essere utilizzati a seconda delle tue esigenze. Puoi anche scegliere se il calcolatore deve determinare il valore p dal test Z o se preferisci utilizzare l'approccio del valore critico!

Continua a leggere per saperne di più sui test Z in statistica e, in particolar modo, quando ricorrere al test Z, qual è la formula del test Z e se dovresti usare il test Z o il test t. Come bonus, ti forniamo alcuni esempi con spiegazioni passo a passo su come eseguire il test Z!

In alternativa, puoi anche consultare il nostro calcolatore per la statistica t, dove potrai imparare il concetto di un altro test statistico essenziale. Se ti interessa anche il test F, consulta il nostro calcolatore per il test F 🇺🇸.

Che cos'è il test Z?

Il test Z fatto su un campione è uno dei test di localizzazione più diffusi. L'ipotesi nulla è che il valore medio della popolazione sia uguale a un dato numero, μ0\mu_0:

H0:μ=μ0\footnotesize \mathrm H_0 \!\!:\!\! \mu = \mu_0

Eseguiamo un test Z bilaterale se vogliamo verificare se la media della popolazione non è μ0\mu_0:

H1:μμ0\footnotesize \mathrm H_1 \!\!:\!\! \mu \ne \mu_0

E un test Z unilaterale se vogliamo verificare se la media della popolazione è minore o maggiore di μ0\mu_0:

H1:μ<μ0 (test unilaterale sinistro)\footnotesize \mathrm H_1 \!\!:\!\! \mu \lt \mu_0 \ (\text{test unilaterale sinistro)}
H1:μ>μ0 (test unilaterale destro)\footnotesize \mathrm H_1 \!\!:\!\! \mu \gt \mu_0 \ (\text{test unilaterale destro)}

Discutiamo ora i presupposti di un test Z su un campione.

Quando si utilizza il test Z?

Puoi utilizzare il test Z se il tuo campione è composto da punti di dati indipendenti e se:

  • I dati sono distribuiti normalmente e conosci la variazione della popolazione;

    oppure se

  • Il campione è ampio e i dati seguono una distribuzione che ha una media e una variazione finite. In questo caso, non è necessario conoscere la variazione della popolazione.

Il motivo per cui esistono queste due possibilità è che vogliamo che le statistiche del test seguano la distribuzione normale standard N(0,1)\mathrm N(0, 1). Nel primo caso, si tratta di una distribuzione normale standardizzata esatta, mentre nel secondo caso lo è approssimativamente, grazie al teorema del limite centrale.

Rimane la domanda: "Quando il mio campione può essere considerato grande?" Beh, non esiste un criterio universale. In generale, più punti dati si hanno, meglio funziona l'approssimazione. I libri di statistica consigliano di avere non meno di 50 punti dati, mentre 30 sono considerati il minimo indispensabile.

Formula del test Z

Sia x1,...,xnx_1, ..., x_n un campione indipendente che segue la distribuzione normale N(μ,σ2)\mathrm N(\mu, \sigma^2), cioè con una media pari a μ\mu e una variazione pari a σ2\sigma ^2.

Poniamo l'ipotesi nulla, H0 ⁣ ⁣: ⁣ ⁣μ=μ0\mathrm H_0 \!\!:\!\! \mu = \mu_0.

Definiamo il test Z:

Z=(xˉμ0)nσZ = (\bar x - \mu _0 ) \frac{\sqrt n}{\sigma}

dove:

  • xˉ\bar x — Media del campione, cioè xˉ=(x1+...+xn)/n\bar x = (x_1 + ... + x_n) / n;
  • μ0\mu_0 — Media postulata in H0\mathrm H_0;
  • nn — Dimensione del campione; e
  • σ\sigma — Deviazione standard della popolazione.

Nel seguito, il carattere maiuscolo ZZ significa test Z\text{test Z} (trattato come una variabile aleatoria), mentre il carattere minuscolo zz indicherà il valore effettivo di ZZ, calcolato per un dato campione estratto da N(μ,σ²).

Se H0\mathrm H_0 è valido, allora la somma Sn=x1+...+xnS_n = x_1 + ... + x_n segue la distribuzione normale, con media nμ0n \mu_0 e variazione n2σn^2 \sigma. Poiché ZZ è la standardizzazione (test Z) di Sn/nS_n/n, possiamo concludere che il test ZZ segue la distribuzione normale standard N(0,1)\mathrm N(0, 1), a condizione che l'ipotesi H0\mathrm H_0 sia vera. A proposito, abbiamo il calcolatore per il punteggio Z se vuoi concentrarti solo su questo valore.

Se i dati non seguono una distribuzione normale o se la deviazione standard della popolazione non è nota (e quindi nella formula per ZZ sostituiamo la deviazione standard della popolazione σ\sigma con la deviazione standard del campione), allora il test statistico ZZ non è necessariamente normale. Tuttavia, se il campione è sufficientemente grande, il teorema del limite centrale garantisce che ZZ è approssimativamente N(0,1)\mathrm N(0, 1).

Nelle sezioni seguenti, ti spiegheremo come utilizzare il valore del test statistico, zz, per decidere se rifiutare o meno l'ipotesi nulla. Per arrivare a questa decisione si possono utilizzare due approcci: l'approccio del valore p e l'approccio del valore critico — e noi li trattiamo entrambi! Quale dei due dovresti usare? In passato, l'approccio del valore critico era più popolare perché era difficile calcolare il valore p dal test Z. Tuttavia, con l'aiuto dei computer moderni, possiamo farlo abbastanza facilmente e con una discreta precisione. In generale, ti consigliamo di riportare il valore p dei tuoi test!

Valore p ottenuto dal test Z

Formalmente, il valore p è il più piccolo livello di significatività al quale l'ipotesi nulla può essere rifiutata. Più intuitivamente, il valore p risponde alla domanda:
Ammesso che io viva in un mondo in cui l'ipotesi nulla è valida, quanto è probabile che il valore del test statistico sia almeno altrettanto estremo del valore zz che ho ottenuto per il mio campione?
Quindi, un valore p piccolo significa che il tuo risultato è molto improbabile in base all'ipotesi nulla e quindi c'è una forte prova contro l'ipotesi nulla — più piccolo è il valore p, più forte è la prova.

Per trovare il valore p, devi calcolare la probabilità che il test statistico, ZZ, sia almeno altrettanto estremo che il valore effettivamente osservato, zz, a condizione che l'ipotesi nulla sia vera (la probabilità di un evento calcolata sotto l'ipotesi che H0\mathrm H_0 sia vera sarà indicata come P(eventoH0)\small \mathrm{P}(\text{evento} | \mathrm{H_0})). È l'ipotesi alternativa a determinare il significato di "più estremo":

  1. Test Z bilaterale — I valori estremi sono quelli il cui valore assoluto supera z|z|, quindi quelli inferiori a z-|z| o superiori a z|z|. Pertanto, abbiamo:
Valore p= P(Z ⁣ ⁣z  H0)+ P(Z ⁣ ⁣z  H0)\begin{split} \quad \text{Valore\ p} &= \ \mathrm{P} (Z \! \leq \! - |z| \ | \ \mathrm{H_0}) \\[0.5em] &+ \ \mathrm{P} (Z \! \geq \! |z| \ | \ \mathrm{H_0}) \end{split}

La simmetria della distribuzione normale dà:

Valore p=2 P(Z ⁣ ⁣z  H0)\quad \text{Valore\ p} = 2 \ \mathrm{P} (Z \! \leq \! - |z| \ | \ \mathrm{H_0})
  1. Test Z unilaterale sinistro — I valori estremi sono quelli più piccoli di zz, quindi
Valore p=P(ZzH0)\quad \text{Valore\ p} = \mathrm{P} (Z \leq z | \mathrm{H_0})
  1. Test Z unilaterale destro — I valori estremi sono quelli maggiori di zz, quindi
Valore p=P(ZzH0)\quad \text{Valore\ p} = \mathrm{P} (Z \geq z | \mathrm{H_0})

Per calcolare queste probabilità, possiamo utilizzare la funzione di ripartizione, chiamata anche funzione cumulativa (CDF, dall'inglese cumulative distribution function, di N(0,1)\mathrm N(0, 1), che per un numero reale, xx, è definita come:

Φ(x)=P(ZxH0)=12πxet22dt\begin{split} \Phi (x) &= \mathrm{P}(Z \leq x | \mathrm{H_0}) = \\[1em] &\quad \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x \mathrm{e}^{-\frac{t^2}{2}}dt \end{split}

Inoltre, i valori p possono essere rappresentati come l'area sotto la funzione di densità di probabilità (PDF, dall'inglese probability density function) di N(0,1)\mathrm N(0, 1) perché:

P(ZxH0)=Φ(x)=l’area a sinistra di x\mathrm{P}(Z \leq x | \mathrm{H_0}) = \Phi(x) \\[0.5em] = \text{l'area a sinistra di } x
P(ZxH0)=1Φ(x)=l’area a destra di x\mathrm{P}(Z \geq x | \mathrm{H_0}) = 1 - \Phi(x) \\[0.5em] = \text{l'area a destra di } x

Test Z bilaterale e test Z unilaterale

Con tutte le conoscenze acquisite nella sezione precedente, è ora di imparare tutto sui test Z.

  1. Test Z bilaterale:
Valore p=Φ(z)+(1Φ(z))\small \text{Valore p} = \Phi(-|z|) + (1 - \Phi(|z|))

Dal fatto che Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z), deduciamo che

Valore p=2Φ(z)=2(1Φ(z))\small \text{Valore p} = 2 \Phi(-|z|) = 2(1 - \Phi(|z|))

Il valore p è l'area sotto la funzione di distribuzione di probabilità sia a sinistra di z-|z|, sia a destra di z|z|:

Valore p bilaterale.
  1. Test Z unilaterale sinistro:
Valore p=Φ(z)\small \quad \text{Valore p} = \Phi(z)

Il valore p è l'area sotto la funzione di distribuzione di probabilità a sinistra del nostro valore zz:

Valore p unilaterale sinistro.
  1. Test z unilaterale destro:
Valore p=1Φ(z)\small \quad \text{Valore p} = 1 - \Phi(z)

Il valore p è l'area sotto la funzione di distribuzione di probabilità a destra di zz:

Valore p unilaterale destro.

La decisione se rifiutare o meno l'ipotesi nulla può essere presa a qualunque livello di significatività, α\alpha, tu desideri!

  • Se il valore p è minore o uguale a α\alpha, l'ipotesi nulla viene rifiutata a questo livello di significatività; e

  • Se il valore p è maggiore di α\alpha, allora non ci sono prove sufficienti per rifiutare l'ipotesi nulla a questo livello di significatività.

Valori critici e regioni di rifiuto del test Z

L'approccio del valore critico prevede il confronto del valore del test statistico ottenuto per il nostro campione, zz, con i cosiddetti valori critici. Questi valori costituiscono i confini delle regioni in cui è altamente improbabile che il test statistico si trovi. Queste regioni vengono spesso chiamate regioni di rifiuto o regioni critiche. La decisione di rifiutare o meno l'ipotesi nulla si basa sul fatto che il nostro zz appartenga o meno alla regione critica.

Le regioni critiche dipendono dal livello di significatività, α\alpha, del test e dall'ipotesi alternativa. La scelta di α\alpha è arbitraria; in pratica, i valori di 0, ⁣10,\!1, 0, ⁣050,\!05 o 0, ⁣010,\!01 sono più comunemente utilizzati come α\alpha.

Una volta concordato il valore di α\alpha, possiamo facilmente determinare le regioni critiche del test Z:

  1. Test Z bilaterale:
 (,Φ1 ⁣ ⁣(α2) ⁣][Φ1 ⁣ ⁣(α2),)\small \ \left(-\infty, \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right) \! \right] \cup \left[ \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right), \infty \right)
  1. Test Z unilaterale sinistro:
(,Φ1 ⁣(α)]\small \quad \left(-\infty, \Phi^{-1} \! \left(\alpha \right) \right]
  1. Test Z unilaterale destro:
[Φ1 ⁣(1α),)\small \quad \left[ \Phi^{-1} \! \left( 1 - \alpha \right), \infty \right)

Per decidere il destino di H0\mathrm H_0, controlla se il tuo zz cade o meno nella regione di rifiuto:

  • Se sì, allora rifiuta H0\mathrm H_0 e accetta H1\mathrm H_1; e

  • Se no, allora non ci sono prove sufficienti per rifiutare H0\mathrm H_0.

Come vedi, le formule per i valori critici di test Z coinvolgono l'inverso, Φ1\Phi^{-1}, della funzione di ripartizione (CDF) di N(0,1)\mathrm N(0, 1).

Come usare il calcolatore per il test Z su un campione?

Il nostro calcolatore riduce tutti i passaggi complicati:

  1. Scegli l'ipotesi alternativa (bilaterale, o unilaterale destro o sinistro);

  2. Nel nostro calcolatore per il test Z, puoi decidere se utilizzare il valore p o l'approccio delle regioni di rifiuto. In quest'ultimo caso, imposta il livello di significatività, α\alpha;

  3. Inserisci il valore del test statistico, zz. Se non lo conosci, puoi inserire alcuni dati che ci permetteranno di calcolare il valore di zz per te:

    • La media del campione xˉ\bar x (se hai dei dati grezzi, vai al calcolatore per la media per determinare la media),
    • La media testata μ0\mu_0,
    • La dimensione del campione nn, e
    • La deviazione standard della popolazione σ\sigma (o deviazione standard del campione se il campione è ampio); e infine
  4. I risultati verranno visualizzati immediatamente sotto il calcolatore.

Se vuoi trovare zz in base al valore p, ricorda che nel caso del test bilaterale ci sono due possibili valori di zz — uno positivo e uno negativo, e sono numeri opposti. In questo caso, il calcolatore per il test Z restituisce il valore positivo. Per trovare l'altro possibile valore di zz per un dato valore p, basta prendere il numero opposto al valore di zz visualizzato dal calcolatore.

Esempi di test Z

Per assicurarci che tu abbia compreso appieno l'essenza del test Z, vediamo alcuni esempi:

  1. Una macchina per il riempimento di bottiglie segue una distribuzione normale. La sua deviazione standard, come dichiarato dal produttore, è pari a 30 mL. Un venditore di succhi di frutta afferma che il volume versato in ogni bottiglia è in media di un litro, cioè 1000 mL, ma sospettiamo che in realtà il volume medio sia inferiore al volume dato.

Formalmente, le ipotesi che abbiamo posto sono le seguenti:

  • H0 ⁣:μ=1000 mL\mathrm H_0 \! : \mu = 1000 \text{ mL}

  • H1 ⁣:μ<1000 mL\mathrm H_1 \! : \mu \lt 1000 \text{ mL}

Siamo andati in un negozio e abbiamo acquistato un campione di 9 bottiglie. Dopo aver misurato attentamente il volume di succo in ogni bottiglia, abbiamo ottenuto il seguente campione (in millilitri):

1020,970,1000,980,1010,930,950,980,980\small 1020, 970, 1000, 980, 1010, 930, 950, 980, 980

  • Dimensione del campione: n=9n = 9;

  • Media del campione: xˉ=980 mL\bar x = 980 \ \mathrm{mL}; e

  • Deviazione standard della popolazione: σ=30 mL\sigma = 30 \ \mathrm{mL}.

  • Quindi

Z=(9801000)/309=2\quad Z = (980 - 1000) / \frac{30}{\sqrt 9} = -2
  • E dunque Valore p=Φ(2)0, ⁣0228\text{Valore p} = \Phi(-2) \approx 0,\!0228.

    Come 0, ⁣0228<0, ⁣050,\!0228 \lt 0,\!05, concludiamo che i nostri sospetti non sono infondati; al livello di significatività più comune, 0, ⁣050,\!05, rifiutiamo l'affermazione del produttore, H0\mathrm H_0, e accettiamo l'ipotesi alternativa, H1\mathrm H_1.

  1. Abbiamo lanciato una moneta 50 volte. Abbiamo ottenuto croce 20 volte e testa 30 volte. Ci sono prove sufficienti per affermare che la probabilità di ottenere croce o testa è distorta?

    Chiaramente i nostri dati seguono la distribuzione di Bernoulli, con una certa probabilità di successo pp e una variazione σ2=p(1p)\sigma^2 = p (1-p). Tuttavia, il campione è ampio, quindi possiamo tranquillamente eseguire un test Z. Adottiamo la convenzione secondo cui otteniamo croce.

    Formuliamo l'ipotesi nulla e l'ipotesi alternativa:

    • H0 ⁣:p=0, ⁣5\mathrm H_0 \! : p = 0,\!5. (La moneta è equa — la probabilità di ottenere croce è di 0, ⁣50,\!5); e

    • H1 ⁣:p0, ⁣5\mathrm H_1 \! : p \ne 0,\!5. (La moneta è distorta — la probabilità di ottenere croce è diversa da 0, ⁣50,\!5).

    Nel nostro campione abbiamo 20 successi (indicati con 11) e 30 fallimenti (indicati con 00), quindi:

  • Dimensione del campione n=50n = 50;

  • Media del campione xˉ=20/50=0, ⁣4\bar x = 20/50 = 0,\!4; e

  • La deviazione standard della popolazione è data da σ=0, ⁣5×0, ⁣5\sigma = \sqrt{0,\!5 \times 0,\!5} (perché 0, ⁣50,\!5 è la proporzione pp ipotizzata in H0\mathrm H_0). Quindi, σ=0, ⁣5\sigma = 0,\!5;

  • Dunque:

Z=(0, ⁣40, ⁣5)/0, ⁣550=21, ⁣4142\begin{split} \quad Z &= (0,\!4 - 0,\!5)/ \frac{0,\!5}{\sqrt{50}} \\[0.5em] &= -\sqrt 2 \approx -1,\!4142 \end{split}
  • E pertanto:
Valore P2 Φ(1, ⁣4142)0, ⁣1573\begin{split} \quad \text{Valore P} &\approx 2 \ \Phi(-1,\!4142) \\[0.5em] &\approx 0,\!1573 \end{split}

Dal momento che 0, ⁣1573>0, ⁣10,\!1573 \gt 0,\!1, non abbiamo prove sufficienti per rifiutare l'affermazione che la probabilità di ottenere testa o croce è regolare, anche a un livello di significatività così alto — 0,110,11. In questo caso, puoi tranquillamente donare un soldo al tuo Witcher o utilizzare il calcolatore per il lancio della moneta per trovare le probabilità di ottenere, ad esempio, 10 teste di fila (che sono estremamente basse!).

FAQ

Qual è la differenza tra il test Z e il test t?

Utilizziamo il test t per testare la media della popolazione di un insieme di dati normalmente distribuiti con una deviazione standard della popolazione sconosciuta. Per ottenere ciò, si sostituisce la deviazione standard della popolazione nella formula del test t a un campione con la deviazione standard del campione, il che significa che questo nuovo test statistico segue (a condizione che H₀ sia valido) la distribuzione di Student (o t di Student) con n-1 gradi di libertà invece di N(0,1).

Quando è meglio usare il test t rispetto al test Z?

Per campioni di grandi dimensioni, la distribuzione t di Student con n gradi di libertà si avvicina a N(0,1). Quindi, se il numero di punti dati è sufficiente (almeno 30), non importa se si utilizza il test Z o il test t, poiché i risultati saranno quasi identici. Tuttavia, per campioni piccoli con variazione sconosciuta, ricorda di utilizzare il test t invece del test Z.

Come si calcola il test Z?

Per calcolare il test Z:

  1. Calcola la media aritmetica del tuo campione;
  2. Da questa media sottrai la media postulata nell'ipotesi nulla;
  3. Moltiplica per la radice quadrata della dimensione del campione;
  4. Dividi per la deviazione standard della popolazione; ed
  5. Ecco fatto, hai appena calcolato il test Z!

In questo caso, eseguiamo un test Z per la media della popolazione μ.

Ipotesi nulla H₀: μ = μ₀.

Check out 26 similar inference, regression, and statistical tests calculators 📉
Absolute uncertaintyAB testCoefficient of determination...23 more