🔬 Advanced

Z-Score计算器 - 标准得分,百分位数和概率

使用标准正常分布计算z分数并转换为百分位数. 试试这个免费的在线数学计算器,即时获得准确的结果.

什么是Z分数?

一个z分数 (也称为标准分数) 可以告诉你标准偏差一个特定的值高于或低于其数据集的平均值.公式很简单:z = (x - μ) / σ这里x是观察值,μ (mu) 是人口平均值, σ (sigma) 是人口标准偏差.

z分数的力量在于标准化:通过将原始值转换为z分数,您可以比较来自完全不同的尺度的测量.在生物学测试中得分为78的学生 (平均70,SD 10) 的z = +0.8.在历史测试中得分为85的同一个学生 (平均80,SD 3.33) 的z = +1.5.尽管原始分数差异,但学生在历史中表现相对更好 - - 在没有z分数转换的情况下,这一事实是不可见的.

在统计学,心理学,教育,医学和质量控制中,Z分数是基础.它们直接与正常分布下的概率连接,允许你计算人口的百分比在任何两个值以上,以下或之间.

标准正常分布和百分位数

当z-score被绘制时,它们遵循标准正常分布--一个钟形曲线,平均值=0和标准偏差=1.该曲线下的面积代表了概率:z分数的左边面积等于百分位数 (低于z分数的值的百分比).

Z-分数	百分比	在%以上	解释
-3.0 没有	0.13% 的	99.87% 的	极低于平均水平
-2.0 没有	2.28% 的	97.72% 其他	远低于平均水平
- - 一点半	6.68% 的	93.32% 其他	低于平均水平
-1.0 没有	15.87% 的	美国	略低于平均水平
-0.5 没有	30.85% 其他	美国	低平均值
0.0 的	其他	其他	正确的平均值
+0.5 年	美国	30.85% 其他	高平均值
+1.0 年	美国	15.87% 的	略高于平均水平
+1.5 年	93.32% 其他	6.68% 的	在平均水平以上
+2.0 年	97.72% 其他	2.28% 的	远远高于平均水平
+3.0 年	99.87% 的	0.13% 的	非常高于平均水平

这些百分位数来自正常分布的累积分布函数 (CDF).在实践中,您可以在z表中查找它们或使用软件计算它们 (Excel的NORM.S.DIST,Python的scipy.stats.norm.cdf或这个计算器).

68-95-99.7规则 (经验规则)

在统计学中最常被引用的事实之一,经验规则描述在正常分布中数据在平均值的1,2和3标准偏差范围内的百分比:

+/-1σ (z 在 -1 和 +1 之间):68.27% 的数据
+/-2σ (z 在 -2 和 +2 之间):95.45% 的数据
+/-3σ (z 在 -3 和 +3 之间):99.73% 的数据

同样,只有5%的正常分布数据与平均值相差超过2个标准偏差,只有0.27% (约370分之一) 超过3个标准偏差.这就是为什么+/-2σ是"与平均值显著不同"的常见值,+/-3σ标志着极端异常值.

范围	包括的数据	不包括数据	一个在N的稀有性
+/-1σ	68.27% 的	31.73% 的	~三分之一
+/-2σ	95.45% 的	4.55% 的	~22人中的1人
+/-3σ	99.73% 的	0.27% 的	~370分之一
+/-4σ	99.9937% 其他	0.0063% 在	~每15,787人中的1人
+/-6σ	99.9999998% 的	美国	~506,842,372分之一

六西格玛质量管理的目标是将制造缺陷降低到不到每百万个机会中的3.4个 - - 这一水平假定随着时间的推移1.5σ的工艺转变,使其大致相当于+/-4.5σ. "六西格玛"性能的愿望是使缺陷在统计学上无意义.

标准化测试中的Z分数

标准化测试 - - SAT,ACT,智商测试,GRE,GMAT - - 旨在产生正常分布的分数,可以使用z分数有意义地转换为百分位数.这使不同测试形式 (可能在难度上略有不同) 和跨年进行比较.

智商分数:设计的平均值=100,标准偏差=15.智商130的z= (130-100)/15=+2.0,将人置于第97.7百分位.智商145的z=+3.0,将他们置于第99.87百分位 (大约740人中的1人).

考试成绩:每个部分 (基于证据的阅读/写作和数学) 的平均值为~500,SD为~100.数学得分为680的z= (680-500)/100=+1.8,大约是第96个百分位.1400的综合得分 (z~+1.8 - 2.0) 将学生置于大约5%的考生中.

测试	意思是	SD	比平均值高1σ的得分	百分比
IQ	一百个	15	一百五十五	第八十四
SAT (每个部分)	500 个	一百个	其他	第八十四
在ACT	21	5	26	第八十四
GRE 语言	一百五十	8.5 年	158.5 年	第八十四

在质量控制和六西格玛中获得Z分数

在制造和工艺质量控制中,z-score被用来衡量工艺能力 - - 一个生产过程在规范范围内达到多少.工艺能力指数Cp和Cpk是从z-score概念中衍生出来的.

处理能力:如果工艺平均值为μ,标准偏差为σ,规格要求输出值在下方规格限值 (LSL) 和上方规格限值 (USL) 之间,则:

z_上部= (USL - μ) / σ 在
z_下一个= (μ - LSL) / σ
Cp = (USL - LSL) / (6σ) -- 测量与规格宽度相对的差距
Cpk = min ((z) 时间_上部没有_下一个) / 3 -- 流程集中的账户

汽车和航空航天制造业通常需要Cpk>=1.33 (相当于+/-4σ过程能力).医疗器械制造业通常需要Cpk>=1.67 (+/-5σ). "六西格玛"过程的目标是Cpk=2.0.

医学参考范围中的Z分数

医学实验室报告与参考范围相对的测试结果,这些测试结果通常被定义为健康人群中95%的中心值 - 相当于z-score在-1.96和+1.96之间.在这个范围之外的结果被标记为"异常",尽管这仅仅意味着它在统计学上是不寻常的,不一定是临床上的问题.

骨密度 (DEXA扫描):结果以T分数 (与年轻成年人标准相比较) 和Z分数 (与年龄相匹配标准相比较) 报告:

T分数>=-1.0:正常
T-分数 -1.0至 -2.5:骨质疏松症
骨质疏松症

增长图表:儿童的身高,体重和头周长被绘制为与年龄性别规范相对的z-score.第50个百分位的儿童有z = 0;第97个百分位的z = +1.88;第3个百分位的z = -1.88.儿科z-score截止值指导营养和发育评估.

血液学:血细胞计数 (血红蛋白,白细胞,血小板) 具有以平均值+/- 2SD表示的参考范围. 超出这些范围的值引发临床审查,尽管个体变化和实验室差异意味着临床背景至关重要.

假设测试和Z测试

Z-分数是z-测试的基础,这是统计学中最常用的假设测试之一.在测试样本平均值是否与已知的人口平均值有显著差异时,您计算:

z = (x̄ - μ0) / (σ / √n)

其中x̄是样本平均值,μ0是假设的人口平均值,σ是已知的人口标准偏差,n是样本大小.

如果 z 是 > 1.96 的结果在 α = 0.05 级别 (双尾) 时具有统计学意义.如果 z 是 > 2.576 的结果在 α = 0.01 时具有统计学意义.这些关键值直接来自正常分布:分布的 95% 属于 +/-1.96 SD,99% 属于 +/-2.576 SD.

显著程度 (α)	临界z值 (双尾)	解释
0.10 (10%) 其他	+/-1.645 年	90%的可靠性
0.05 (5%) 在	+/-1.960 年	95%的可靠性 (标准)
0.01 (1%) 在	+/-2.576 年	99% 的可靠性
0.001 (0.1%) 在	+/-3.291 年	99.9%的可靠性

Z-Score的限制以及何时不使用它们

Z-分数和从中获得的百分比计算假设底层数据遵循一个正常分布 (高斯分布)许多现实数据集违反了这一假设:

收入和财富:平均值远高于中位数,而z分数大大低估了极端财富的稀有性.
财务回报:有"胖尾巴" - 极端事件 (市场崩 ,意外) 发生的频率远高于正常分布的预测.使用z-score的模型低估了2008年金融危机的概率.
社交媒体指标:追随者,点赞和浏览量依赖于权力法分布, 而不是正常分布.
小样:在少于30个观测时,t分布 (较重的尾巴) 比z分布更合适.

在应用z-score分析之前,始终检查您的数据是否使用直方图,Q-Q图或正式的正常性测试 (Shapiro-Wilk,Anderson-Darling) 大致分布正常.如果数据非正常,请考虑转换 (日志,平方根) 或非参数替代方案.

人们常问的问题

一个z分数为1.5意味着什么?

一个z-score为1.5意味着值在平均值上方为1.5个标准偏差,将其置于大约第93百分位.正常分布中的大约93.3%的值在这个点以下,6.7%的值在这个点以上.

什么是好的z分数?

"好"取决于上下文.对于测试成绩或性能指标,较高的z-score是最好的.对于风险指标 (胆固醇,血压),z-score接近0是最健康的.在质量控制中,z-score超出+/-3标志缺陷或异常值.没有普遍的"好"z-score - 它取决于正在测量的东西.

如何计算z分数?

从你的值中减去平均值,然后除以标准偏差:z = (x - μ) / σ. 例:得分为85,平均值为70,SD 10 -> z = (85-70) / 10 = 1.5. 这意味着得分高于班级平均值1.5个标准偏差.

对于第95个百分点的z分数是多少?

与第95个百分位相对应的z-score大约是+1.645 (单尾).这也是一个单尾显著性测试的关键值,α = 0.05.对于双尾95%范围 (即分布的中心95%),截止值是+/-1.96.

一个z-分数可以是负的吗?

是的.负的z-score表示值低于平均值.z-score为-1.0表示值低于平均值的一个标准偏差,在第15.87百分位.Z-score范围从-∞到+∞,尽管超出+/-4的值在正常分布的数据中非常罕见.

在z分数和t分数之间有什么区别?

两者均对相对于平均值和标准偏差的数据进行标准化.一个z-score假设已知人口标准偏差 (σ).一个t-score (或t-statistic) 在未知时使用样本标准偏差 (s) 作为估计,并遵循较重的t-分布.对于大样本 (n > 30),t和z几乎相同.

如何在金融中使用z-score?

阿尔特曼Z分数使用加权的财务比率组合预测企业破产风险.在风险管理中,z分数测量了投资组合回报率从零 (风险价值) 到多少标准偏差.在算法交易中,价格差的z分数识别了平均逆转机会 (对交易).

数据的百分比在2个标准偏差之内?

大约95.45%的数据在正常分布 (经验规则) 中处于平均值的+/-2σ范围内.确切的数字是95.449%.补充的4.551%在每个尾部超出+/-2σ - 2.275%.这就是为什么+/-2σ是许多领域 (α = 0.05,双尾) 的"统计学显著"的标准门 .

如何将z分数转换为百分位数?

在标准正常表 (z-table) 中查找z-score,该表给出累积概率.为百分位数乘以100.例如,z = 1.0 -> 0.8413 -> 第84个百分位数.作为替代方案,使用公式:百分位数 = Φ ((z) x 100,其中 Φ 是标准正常CDF. Excel: =NORM.S.DIST ((z,TRUE) x100.

在质量控制中使用z-score是什么?

在六西格玛质量管理中,z-score测量过程能力.一个运行在+/-3σ (z = 3) 的过程每百万产生2,700个缺陷.在+/-6σ (z = 6) 时,它只产生每百万3.4个缺陷 (考虑到典型的过程漂移).CP和CPK指数直接使用z-score概念来量化一个过程满足规格的程度.

使用Z分数检测异常值

一个最常见的z-score的实际应用是异常值检测 -- 识别异常远离平均值的数据点, 可能代表错误,非凡事件或真正不寻常的观察需要调查.

标记异常值的标准值是: z > 3. 在正常分布下,仅在0.27%的观测值中预计会有超过3个标准偏差 - 大约是370个数据点中的1个. 在1000个测量的数据集中,你只会偶然地预期超过+/-3σ的3个值. 如果你找到20个这样的值,就会发生一些不寻常的事情 - - 设备故障,数据输入错误或真正的极端观测.

在特定领域使用更严格的标准:

医疗器械:根据临床紧急情况,警报值为+/-2σ (5%的警报率) 至+/-3σ (0.27%的警报率)
金融市场:超出+/-4σ的"肥尾"事件比正常分布预测的频率要高得多 - - 2008年金融危机涉及5 - 7σ的动作,在正常分布假设下理论上是"不可能的"
质量控制:超过+/-3σ的值 (六西格玛框架中的缺陷) 需要过程调查和根源分析
科学研究:声称粒子物理学发现所需的5σ 值是 (如2012年在CERN公布的希格斯玻色子)

Z-分数门	% 标记 (正常)	在
现在是2.0	4.55% 的	最初的数据选
这样就好了.	一,24%	医疗参考范围
没有人知道.	0.27% 的	质量控制,异常值检测
没有.	0.0063% 在	过程缺陷分析
这样做是很容易的.	美国	关于粒子物理学发现的声明

重要警告:现实数据的尾数通常比正常分布预测的尾数 (leptokurtic分布) 重. 始终手动检查异常值 - 4的z-score可能是数据输入错误 (48记录为4.8) 或具有重要意义的真实极端值. 永远不要在没有调查的情况下自动删除异常值.

财务和风险管理中的Z分数

在金融领域,z分数在学术统计之外有多种重要应用.阿尔特曼Z分数(1968年),一个破产预测模型,将五个财务比率结合为一个单一的分辨分数:

Z = 1.2x ((工作资本/总资产) + 1.4x ((保留收益/总资产) + 3.3x ((EBIT/总资产) + 0.6x ((市值/总负债) + 1.0x ((收入/总资产)

阿尔特曼Z-Score解释:Z > 2.99 =安全区;1.81 - 2.99 =灰色区;Z < 1.81 =危险区 (高破产风险).该模型在原始研究中准确预测了94%的破产情况,并且至今仍被信贷分析师和投资者广泛使用.

风险价值 (VaR):在投资组合风险管理中,VaR使用z-score来量化潜在的损失.每日回报平均值μ和标准偏差 σ的1天95%的VaR是:VaR = -(μ + z x σ) ,其中z = -1.645 (第5百分位数).如果一个1000万美元的投资组合每日μ = 0%和s = 1%,那么95%信心的VaR=1.645%x1万美元=16.450美元.这意味着在一天内损失超过16450美元的可能性为5%.

自信程度	使用的Z-Score	解释
90% 的	-1.282 年	损失超过交易日的10%
95% 的	-1.645 年	损失超过交易日的5%
99% 的	-2.326 年	损失超过交易日的1%
99.9% 的	-3.090 年	损失超过交易日的0.1%

使用样本数据计算Z分数

当使用样本 (而不是已知的人口) 工作时,您可以从样本中估计人口参数.样本平均值 (x̄) 估计 μ,样本标准偏差 (s) 估计 σ.z-score公式保持不变:z = (x - x̄) / s.

然而,在小样本中,由于估计σ的增加不确定性,得出的z-score遵循t-分布 (而不是正常分布).t-分布具有更重的尾巴,反映了这种更大的不确定性.对于30个或更多样本,t-分布和正常分布几乎相同,并且任何计算的z-score大致相当.

当您有一个数据集并希望将所有值标准化 (将整个数据集转换为z-score) 时,功能缩放 or 标准化在机器学习中.这是一个预处理步骤,将所有特征放在相同的尺度上 (平均值 = 0,SD = 1),防止具有更大的绝对值的特征主导基于距离的算法 (KNN,SVM,神经网络).在标准化后,无论原始单位或规模如何,每个特征的z-score都是直接可比的.

在Python中标准化数据集:from sklearn.preprocessing import StandardScaler; scaler = StandardScaler(); X_scaled = scaler.fit_transform(X)在Excel中:对于列中的每个值,计算=STANDARDIZE(value, AVERAGE(range), STDEV(range)).