確率分布の歪度(Skewness)
確率分布の歪度(Skewness)は分布の歪み具合(非対称の度合い)を表す指標です。歪度により分布の歪みが変化します。
skewness < 0
分布が右に歪むskewness = 0
分布が左右対称skewness > 0
分布が左に歪む
下図は正規分布の歪度を変化させた標準正規分布を示しています。
正規分布の場合、歪度は次の式で求めることができます。
確率分布の尖度(Kurtosis)
確率分布の尖度(Kurtosis)は正規分布を基準とした分布の尖り具合や裾の広がり具合を表す指標です。正規分布よりも尖った分布では尖度は正の値、正規分布よりも緩やかな分布では尖度は負の値になります。
下図は尖度2.228のラプラス分布、尖度0.045の正規分布、尖度-1.161の一様分布を示しています。
正規分布の場合、尖度は次の式で求めることができます。
Python コード
今回の確率分布の歪度と尖度を描画したPythonコードは以下になります。
from scipy.stats import skewnorm
import matplotlib.pyplot as plt
import numpy as np
plt.style.use('ggplot')
fig, ax = plt.subplots(facecolor="w", figsize=(10, 10))
skews = [-4, 0, 4]
for i, skew in enumerate(skews):
plt.subplot(3, 1, i+1)
x = np.linspace(skewnorm.ppf(0.01, skew),
skewnorm.ppf(0.99, skew), 100)
plt.plot(x, skewnorm.pdf(x, skew), lw=5, alpha=0.5, label=f'norm dist (skew={skew})')
r = skewnorm.rvs(skew, size=1000)
plt.hist(r, density=True, histtype='stepfilled', alpha=0.2)
plt.legend(loc='best', frameon=False)
plt.show()
import matplotlib.pyplot as plt
import scipy.stats as stats
from scipy.stats import kurtosis
plt.style.use('ggplot')
fig, ax = plt.subplots(facecolor="w", figsize=(10, 5))
x = np.linspace(-5, 5, 100)
ax = plt.subplot()
distnames = ['laplace', 'norm', 'uniform']
for distname in distnames:
if distname == 'uniform':
dist = getattr(stats, distname)(loc=-2, scale=4)
else:
dist = getattr(stats, distname)
data = dist.rvs(size=1000)
kur = kurtosis(data, fisher=True)
y = dist.pdf(x)
ax.plot(x, y, lw=5, alpha=0.5, label="{} dist (kurtosis={})".format(distname, round(kur, 3)))
ax.legend()
参考
AlloyDB
Amazon Cognito
Amazon EC2
Amazon ECS
Amazon QuickSight
Amazon RDS
Amazon Redshift
Amazon S3
API
Autonomous Vehicle
AWS
AWS API Gateway
AWS Chalice
AWS Control Tower
AWS IAM
AWS Lambda
AWS VPC
BERT
BigQuery
Causal Inference
ChatGPT
Chrome Extension
CircleCI
Classification
Cloud Functions
Cloud IAM
Cloud Run
Cloud Storage
Clustering
CSS
Data Engineering
Data Modeling
Database
dbt
Decision Tree
Deep Learning
Descriptive Statistics
Differential Equation
Dimensionality Reduction
Discrete Choice Model
Docker
Economics
FastAPI
Firebase
GIS
git
GitHub
GitHub Actions
Google
Google Cloud
Google Search Console
Hugging Face
Hypothesis Testing
Inferential Statistics
Interval Estimation
JavaScript
Jinja
Kedro
Kubernetes
LightGBM
Linux
LLM
Mac
Machine Learning
Macroeconomics
Marketing
Mathematical Model
Meltano
MLflow
MLOps
MySQL
NextJS
NLP
Nodejs
NoSQL
ONNX
OpenAI
Optimization Problem
Optuna
Pandas
Pinecone
PostGIS
PostgreSQL
Probability Distribution
Product
Project
Psychology
Python
PyTorch
QGIS
R
ReactJS
Regression
Rideshare
SEO
Singer
sklearn
Slack
Snowflake
Software Development
SQL
Statistical Model
Statistics
Streamlit
Tabular
Tailwind CSS
TensorFlow
Terraform
Transportation
TypeScript
Urban Planning
Vector Database
Vertex AI
VSCode
XGBoost