Calcolatore per il Test Z

Q: Quando si utilizza il test Z?

Puoi utilizzare il test Z se il tuo campione è composto da punti di dati indipendenti e se: I dati sono distribuiti normalmente e conosci la variazione della popolazione ; oppure se Il campione è ampio e i dati seguono una distribuzione che ha una media e una variazione finite. In questo caso, non è necessario conoscere la variazione della popolazione.

Q: Come si calcola il test Z?

Per calcolare il test Z: Calcola la media aritmetica del tuo campione ; Da questa media sottrai la media postulata nell'ipotesi nulla ; Moltiplica per la radice quadrata della dimensione del campione ; Dividi per la deviazione standard della popolazione ; ed Ecco fatto, hai appena calcolato il test Z!

Creatori

Dott. Anna Szczepanek, Ph.D.

Anna SzczepanekPhD, Jagiellonian University in Kraków, Poland

Website

Anna Szczepanek, PhD is a mathematician at the Faculty of Mathematics and Computer Science of the Jagiellonian University in Kraków, where she researches mathematical physics and applied mathematics. At Omni, Anna uses her knowledge and programming skills to create math and statistics calculators. In her free time, she enjoys hiking and reading. See full profile

Check our editorial policy

Traduttori

Agata Flak

Agata is an aspiring translator and interpreter with a passion for foreign languages and linguistics. She holds a Bachelor’s degree in French and Italian Studies from the University of Manchester. She spent a year studying translation and interpreting in Mons, Belgium. She is currently pursuing her Master’s degree in Translation Studies at the Jagiellonian University in Cracow, specializing in conference interpreting. In her free time, she likes petting her dog and engaging in physical training. See full profile

Check our editorial policy

e Rangsimatiti Binda Saichompoo

Rangsimatiti Binda Saichompoo

Environmental matters and supporting sustainability are always the most important aspects of Kat’s goals. Hence, Kat directed her education towards biomaterials, sustainability, and bioeconomy. Despite this major path, psychology, language, and culture are also her other strong fields of interest! Thanks to her Erasmus Joint Master’s degree, learning and adapting to new cultures is a piece of cake. See full profile

Check our editorial policy

Revisori

Dott. Dominik Czernia, Ph.D.

Dominik CzerniaPhD, Institute of Nuclear Physics PAN

Website

Research Gate

Dominik Czernia, PhD, is a physicist at the Institute of Nuclear Physics in Kraków, specializing in condensed matter physics with a focus on molecular magnetism. He has led several national research projects, pioneering innovative approaches to novel materials for high technology. Passionate about making science accessible, Dominik has created various calculators, mostly in physics and math categories. In his free time, he enjoys family walks, city explorations, mountain hiking, and traveling everywhere by bike. See full profile

Check our editorial policy

e Jack Bowater

Questo calcolatore per il test Z è uno strumento che ti aiuta a eseguire un test Z sulla media di una popolazione. Esistono due forme di questo test, il test Z bilaterale e il test Z unilaterale, che possono essere utilizzati a seconda delle tue esigenze. Puoi anche scegliere se il calcolatore deve determinare il valore p dal test Z o se preferisci utilizzare l'approccio del valore critico!

Continua a leggere per saperne di più sui test Z in statistica e, in particolar modo, quando ricorrere al test Z, qual è la formula del test Z e se dovresti usare il test Z o il test t. Come bonus, ti forniamo alcuni esempi con spiegazioni passo a passo su come eseguire il test Z!

In alternativa, puoi anche consultare il nostro calcolatore per la statistica t, dove potrai imparare il concetto di un altro test statistico essenziale. Se ti interessa anche il test F, consulta il nostro calcolatore per il test F 🇺🇸.

Che cos'è il test Z?

Il test Z fatto su un campione è uno dei test di localizzazione più diffusi. L'ipotesi nulla è che il valore medio della popolazione sia uguale a un dato numero, $\mu_0$ :

\footnotesize \mathrm H_0 \!\!:\!\! \mu = \mu_0

Eseguiamo un test Z bilaterale se vogliamo verificare se la media della popolazione non è $\mu_0$ :

\footnotesize \mathrm H_1 \!\!:\!\! \mu \ne \mu_0

E un test Z unilaterale se vogliamo verificare se la media della popolazione è minore o maggiore di $\mu_0$ :

\footnotesize \mathrm H_1 \!\!:\!\! \mu \lt \mu_0 \ (\text{test unilaterale sinistro)}

\footnotesize \mathrm H_1 \!\!:\!\! \mu \gt \mu_0 \ (\text{test unilaterale destro)}

Discutiamo ora i presupposti di un test Z su un campione.

Quando si utilizza il test Z?

Puoi utilizzare il test Z se il tuo campione è composto da punti di dati indipendenti e se:

I dati sono distribuiti normalmente e conosci la variazione della popolazione;

oppure se
Il campione è ampio e i dati seguono una distribuzione che ha una media e una variazione finite. In questo caso, non è necessario conoscere la variazione della popolazione.

Il motivo per cui esistono queste due possibilità è che vogliamo che le statistiche del test seguano la distribuzione normale standard $\mathrm N(0, 1)$ . Nel primo caso, si tratta di una distribuzione normale standardizzata esatta, mentre nel secondo caso lo è approssimativamente, grazie al teorema del limite centrale.

Rimane la domanda: "Quando il mio campione può essere considerato grande?" Beh, non esiste un criterio universale. In generale, più punti dati si hanno, meglio funziona l'approssimazione. I libri di statistica consigliano di avere non meno di 50 punti dati, mentre 30 sono considerati il minimo indispensabile.

Formula del test Z

Sia $x_1, ..., x_n$ un campione indipendente che segue la distribuzione normale $\mathrm N(\mu, \sigma^2)$ , cioè con una media pari a $\mu$ e una variazione pari a $\sigma ^2$ .

Poniamo l'ipotesi nulla, $\mathrm H_0 \!\!:\!\! \mu = \mu_0$ .

Definiamo il test Z:

Z = (\bar x - \mu _0 ) \frac{\sqrt n}{\sigma}

dove:

$\bar x$ — Media del campione, cioè $\bar x = (x_1 + ... + x_n) / n$ ;
$\mu_0$ — Media postulata in $\mathrm H_0$ ;
$n$ — Dimensione del campione; e
$\sigma$ — Deviazione standard della popolazione.

Nel seguito, il carattere maiuscolo $Z$ significa $\text{test Z}$ (trattato come una variabile aleatoria), mentre il carattere minuscolo $z$ indicherà il valore effettivo di $Z$ , calcolato per un dato campione estratto da N(μ,σ²).

Se $\mathrm H_0$ è valido, allora la somma $S_n = x_1 + ... + x_n$ segue la distribuzione normale, con media $n \mu_0$ e variazione $n^2 \sigma$ . Poiché $Z$ è la standardizzazione (test Z) di $S_n/n$ , possiamo concludere che il test $Z$ segue la distribuzione normale standard $\mathrm N(0, 1)$ , a condizione che l'ipotesi $\mathrm H_0$ sia vera. A proposito, se vuoi concentrarti solo su questo valore, abbiamo il calcolatore per il punteggio Z. Abbiamo anche scritto un articolo sul punteggio Z e valore p 🇺🇸*.

Se i dati non seguono una distribuzione normale o se la deviazione standard della popolazione non è nota (e quindi nella formula per $Z$ sostituiamo la deviazione standard della popolazione $\sigma$ con la deviazione standard del campione), allora il test statistico $Z$ non è necessariamente normale. Tuttavia, se il campione è sufficientemente grande, il teorema del limite centrale garantisce che $Z$ è approssimativamente $\mathrm N(0, 1)$ .

Nelle sezioni seguenti, ti spiegheremo come utilizzare il valore del test statistico, $z$ , per decidere se rifiutare o meno l'ipotesi nulla. Per arrivare a questa decisione si possono utilizzare due approcci: l'approccio del valore p e l'approccio del valore critico — e noi li trattiamo entrambi! Quale dei due dovresti usare? In passato, l'approccio del valore critico era più popolare perché era difficile calcolare il valore p dal test Z. Tuttavia, con l'aiuto dei computer moderni, possiamo farlo abbastanza facilmente e con una discreta precisione. In generale, ti consigliamo di riportare il valore p dei tuoi test!

Valore p ottenuto dal test Z

Formalmente, il valore p è il più piccolo livello di significatività al quale l'ipotesi nulla può essere rifiutata. Più intuitivamente, il valore p risponde alla domanda:
Ammesso che io viva in un mondo in cui l'ipotesi nulla è valida, quanto è probabile che il valore del test statistico sia almeno altrettanto estremo del valore $z$ che ho ottenuto per il mio campione? Quindi, un valore p piccolo significa che il tuo risultato è molto improbabile in base all'ipotesi nulla e quindi c'è una forte prova contro l'ipotesi nulla — più piccolo è il valore p, più forte è la prova.

Per trovare il valore p, devi calcolare la probabilità che il test statistico, $Z$ , sia almeno altrettanto estremo che il valore effettivamente osservato, $z$ , a condizione che l'ipotesi nulla sia vera (la probabilità di un evento calcolata sotto l'ipotesi che $\mathrm H_0$ sia vera sarà indicata come $\small \mathrm{P}(\text{evento} | \mathrm{H_0})$ ). È l'ipotesi alternativa a determinare il significato di "più estremo":

Test Z bilaterale — I valori estremi sono quelli il cui valore assoluto supera $|z|$ , quindi quelli inferiori a $-|z|$ o superiori a $|z|$ . Pertanto, abbiamo:

\begin{split} \quad \text{Valore\ p} &= \ \mathrm{P} (Z \! \leq \! - |z| \ | \ \mathrm{H_0}) \\[0.5em] &+ \ \mathrm{P} (Z \! \geq \! |z| \ | \ \mathrm{H_0}) \end{split}

La simmetria della distribuzione normale dà:

\quad \text{Valore\ p} = 2 \ \mathrm{P} (Z \! \leq \! - |z| \ | \ \mathrm{H_0})

Test Z unilaterale sinistro — I valori estremi sono quelli più piccoli di $z$ , quindi

\quad \text{Valore\ p} = \mathrm{P} (Z \leq z | \mathrm{H_0})

Test Z unilaterale destro — I valori estremi sono quelli maggiori di $z$ , quindi

\quad \text{Valore\ p} = \mathrm{P} (Z \geq z | \mathrm{H_0})

Per calcolare queste probabilità, possiamo utilizzare la funzione di ripartizione, chiamata anche funzione cumulativa (CDF, dall'inglese cumulative distribution function, di $\mathrm N(0, 1)$ , che per un numero reale, $x$ , è definita come:

\begin{split} \Phi (x) &= \mathrm{P}(Z \leq x | \mathrm{H_0}) = \\[1em] &\quad \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x \mathrm{e}^{-\frac{t^2}{2}}dt \end{split}

Inoltre, i valori p possono essere rappresentati come l'area sotto la funzione di densità di probabilità (PDF, dall'inglese probability density function) di $\mathrm N(0, 1)$ perché:

\mathrm{P}(Z \leq x | \mathrm{H_0}) = \Phi(x) \\[0.5em] = \text{l'area a sinistra di } x

\mathrm{P}(Z \geq x | \mathrm{H_0}) = 1 - \Phi(x) \\[0.5em] = \text{l'area a destra di } x

Test Z bilaterale e test Z unilaterale

Con tutte le conoscenze acquisite nella sezione precedente, è ora di imparare tutto sui test Z.

Test Z bilaterale:

\small \text{Valore p} = \Phi(-|z|) + (1 - \Phi(|z|))

Dal fatto che $\Phi(-z) = 1 - \Phi(z)$ , deduciamo che

\small \text{Valore p} = 2 \Phi(-|z|) = 2(1 - \Phi(|z|))

Il valore p è l'area sotto la funzione di distribuzione di probabilità sia a sinistra di $-|z|$ , sia a destra di $|z|$ :

Test Z unilaterale sinistro:

\small \quad \text{Valore p} = \Phi(z)

Il valore p è l'area sotto la funzione di distribuzione di probabilità a sinistra del nostro valore $z$ :

Test z unilaterale destro:

\small \quad \text{Valore p} = 1 - \Phi(z)

Il valore p è l'area sotto la funzione di distribuzione di probabilità a destra di $z$ :

La decisione se rifiutare o meno l'ipotesi nulla può essere presa a qualunque livello di significatività, $\alpha$ , tu desideri!

Se il valore p è minore o uguale a $\alpha$ , l'ipotesi nulla viene rifiutata a questo livello di significatività; e
Se il valore p è maggiore di $\alpha$ , allora non ci sono prove sufficienti per rifiutare l'ipotesi nulla a questo livello di significatività.

Valori critici e regioni di rifiuto del test Z

L'approccio del valore critico prevede il confronto del valore del test statistico ottenuto per il nostro campione, $z$ , con i cosiddetti valori critici. Questi valori costituiscono i confini delle regioni in cui è altamente improbabile che il test statistico si trovi. Queste regioni vengono spesso chiamate regioni di rifiuto o regioni critiche. La decisione di rifiutare o meno l'ipotesi nulla si basa sul fatto che il nostro $z$ appartenga o meno alla regione critica.

Le regioni critiche dipendono dal livello di significatività, $\alpha$ , del test e dall'ipotesi alternativa. La scelta di $\alpha$ è arbitraria; in pratica, i valori di $0,\!1$ , $0,\!05$ o $0,\!01$ sono più comunemente utilizzati come $\alpha$ .

Una volta concordato il valore di $\alpha$ , possiamo facilmente determinare le regioni critiche del test Z:

Test Z bilaterale:

\small \ \left(-\infty, \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right) \! \right] \cup \left[ \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right), \infty \right)

Test Z unilaterale sinistro:

\small \quad \left(-\infty, \Phi^{-1} \! \left(\alpha \right) \right]

Test Z unilaterale destro:

\small \quad \left[ \Phi^{-1} \! \left( 1 - \alpha \right), \infty \right)

Per decidere il destino di $\mathrm H_0$ , controlla se il tuo $z$ cade o meno nella regione di rifiuto:

Se sì, allora rifiuta $\mathrm H_0$ e accetta $\mathrm H_1$ ; e
Se no, allora non ci sono prove sufficienti per rifiutare $\mathrm H_0$ .

Come vedi, le formule per i valori critici di test Z coinvolgono l'inverso, $\Phi^{-1}$ , della funzione di ripartizione (CDF) di $\mathrm N(0, 1)$ .

Come usare il calcolatore per il test Z su un campione?

Il nostro calcolatore riduce tutti i passaggi complicati:

Scegli l'ipotesi alternativa (bilaterale, o unilaterale destro o sinistro);
Nel nostro calcolatore per il test Z, puoi decidere se utilizzare il valore p o l'approccio delle regioni di rifiuto. In quest'ultimo caso, imposta il livello di significatività, $\alpha$ ;
Inserisci il valore del test statistico, $z$ . Se non lo conosci, puoi inserire alcuni dati che ci permetteranno di calcolare il valore di $z$ per te:
- La media del campione $\bar x$ (se hai dei dati grezzi, vai al calcolatore per la media per determinare la media),
- La media testata $\mu_0$ ,
- La dimensione del campione $n$ , e
- La deviazione standard della popolazione $\sigma$ (o deviazione standard del campione se il campione è ampio); e infine
I risultati verranno visualizzati immediatamente sotto il calcolatore.

Se vuoi trovare $z$ in base al valore p, ricorda che nel caso del test bilaterale ci sono due possibili valori di $z$ — uno positivo e uno negativo, e sono numeri opposti. In questo caso, il calcolatore per il test Z restituisce il valore positivo. Per trovare l'altro possibile valore di $z$ per un dato valore p, basta prendere il numero opposto al valore di $z$ visualizzato dal calcolatore.

Esempi di test Z

Per assicurarci che tu abbia compreso appieno l'essenza del test Z, vediamo alcuni esempi:

Una macchina per il riempimento di bottiglie segue una distribuzione normale. La sua deviazione standard, come dichiarato dal produttore, è pari a 30 mL. Un venditore di succhi di frutta afferma che il volume versato in ogni bottiglia è in media di un litro, cioè 1000 mL, ma sospettiamo che in realtà il volume medio sia inferiore al volume dato.

Formalmente, le ipotesi che abbiamo posto sono le seguenti:

$\mathrm H_0 \! : \mu = 1000 \text{ mL}$
$\mathrm H_1 \! : \mu \lt 1000 \text{ mL}$

Siamo andati in un negozio e abbiamo acquistato un campione di 9 bottiglie. Dopo aver misurato attentamente il volume di succo in ogni bottiglia, abbiamo ottenuto il seguente campione (in millilitri):

$\small 1020, 970, 1000, 980, 1010, 930, 950, 980, 980$

Dimensione del campione: $n = 9$ ;
Media del campione: $\bar x = 980 \ \mathrm{mL}$ ; e
Deviazione standard della popolazione: $\sigma = 30 \ \mathrm{mL}$ .
Quindi

\quad Z = (980 - 1000) / \frac{30}{\sqrt 9} = -2

E dunque $\text{Valore p} = \Phi(-2) \approx 0,\!0228$ .

Come $0,\!0228 \lt 0,\!05$ , concludiamo che i nostri sospetti non sono infondati; al livello di significatività più comune, $0,\!05$ , rifiutiamo l'affermazione del produttore, $\mathrm H_0$ , e accettiamo l'ipotesi alternativa, $\mathrm H_1$ .

Abbiamo lanciato una moneta 50 volte. Abbiamo ottenuto croce 20 volte e testa 30 volte. Ci sono prove sufficienti per affermare che la probabilità di ottenere croce o testa è distorta?

Chiaramente i nostri dati seguono la distribuzione di Bernoulli, con una certa probabilità di successo $p$ e una variazione $\sigma^2 = p (1-p)$ . Tuttavia, il campione è ampio, quindi possiamo tranquillamente eseguire un test Z. Adottiamo la convenzione secondo cui otteniamo croce.

Formuliamo l'ipotesi nulla e l'ipotesi alternativa:
- $\mathrm H_0 \! : p = 0,\!5$ . (La moneta è equa — la probabilità di ottenere croce è di $0,\!5$ ); e
- $\mathrm H_1 \! : p \ne 0,\!5$ . (La moneta è distorta — la probabilità di ottenere croce è diversa da $0,\!5$ ).
Nel nostro campione abbiamo 20 successi (indicati con $1$ ) e 30 fallimenti (indicati con $0$ ), quindi:

Dimensione del campione $n = 50$ ;
Media del campione $\bar x = 20/50 = 0,\!4$ ; e
La deviazione standard della popolazione è data da $\sigma = \sqrt{0,\!5 \times 0,\!5}$ (perché $0,\!5$ è la proporzione $p$ ipotizzata in $\mathrm H_0$ ). Quindi, $\sigma = 0,\!5$ ;
Dunque:

\begin{split} \quad Z &= (0,\!4 - 0,\!5)/ \frac{0,\!5}{\sqrt{50}} \\[0.5em] &= -\sqrt 2 \approx -1,\!4142 \end{split}

E pertanto:

\begin{split} \quad \text{Valore P} &\approx 2 \ \Phi(-1,\!4142) \\[0.5em] &\approx 0,\!1573 \end{split}

Dal momento che $0,\!1573 \gt 0,\!1$ , non abbiamo prove sufficienti per rifiutare l'affermazione che la probabilità di ottenere testa o croce è regolare, anche a un livello di significatività così alto — $0,11$ . In questo caso, puoi tranquillamente donare un soldo al tuo Witcher o utilizzare il calcolatore per il lancio della moneta per trovare le probabilità di ottenere, ad esempio, 10 teste di fila (che sono estremamente basse!).

*Articolo disponibile in inglese

FAQ

Qual è la differenza tra il test Z e il test t?

Utilizziamo il test t per testare la media della popolazione di un insieme di dati normalmente distribuiti con una deviazione standard della popolazione sconosciuta. Per ottenere ciò, si sostituisce la deviazione standard della popolazione nella formula del test t a un campione con la deviazione standard del campione, il che significa che questo nuovo test statistico segue (a condizione che H₀ sia valido) la distribuzione di Student (o t di Student) con n-1 gradi di libertà invece di N(0,1).

Quando è meglio usare il test t rispetto al test Z?

Per campioni di grandi dimensioni, la distribuzione t di Student con n gradi di libertà si avvicina a N(0,1). Quindi, se il numero di punti dati è sufficiente (almeno 30), non importa se si utilizza il test Z o il test t, poiché i risultati saranno quasi identici. Tuttavia, per campioni piccoli con variazione sconosciuta, ricorda di utilizzare il test t invece del test Z.

Come si calcola il test Z?

Per calcolare il test Z:

Calcola la media aritmetica del tuo campione;
Da questa media sottrai la media postulata nell'ipotesi nulla;
Moltiplica per la radice quadrata della dimensione del campione;
Dividi per la deviazione standard della popolazione; ed
Ecco fatto, hai appena calcolato il test Z!