Estudio de simulación sobre la potencia y sensibilidad de dieciséis pruebas de normalidad en distintos escenarios de no normalidad

Palabras clave: método de clasificación de distribuciones, método de Fleishman, simulación Monte Carlo, pruebas de normalidad, comparación de potencias

Resumen

En el análisis de datos, la validación del supuesto de normalidad es crucial para determinar si es correcto aplicar métodos paramétricos. El objetivo de esta investigación fue comparar la potencia y sensibilidad de dieciséis pruebas de normalidad, clasificadas según diversos aspectos. La metodología utilizada consistió en simular datos a partir del sistema de contaminación Fleishman para evaluar las pruebas en situaciones de no normalidad y diez distribuciones con distintos grados de desviación de la normalidad. Los resultados obtenidos fueron que las pruebas basadas en la correlación y la regresión, como Shapiro-Wilk y Shapiro-Francia, superaron a las demás en potencia, especialmente, para muestras grandes y desviaciones sustanciales de la normalidad. Para desviaciones moderadas se observó que las pruebas de D’Agostino-Pearson y de sesgo se desempeñaron bien, mientras que, para desviaciones bajas, sobresalieron la prueba robusta de Jarque-Bera y la prueba de Jarque-Bera. Además, algunas pruebas mostraron una elevada potencia en distintos tipos de distribuciones, como Snedecor-Cochran y Chen-Ye para distribuciones platicurticas simétricas, y Snedecor-Cochran y Chen-Ye para distribuciones leptocurticas asimétricas. Estos resultados aportaron información valiosa sobre la selección de pruebas de normalidad adecuadas en función de las características de la muestra, lo que ayuda a los investigadores a mejorar la fiabilidad de la inferencia estadística. En conclusión, este artículo muestra escenarios donde las pruebas estadísticas más conocidas no siempre son las más efectivas.

Biografía del autor/a

Cristian David Correa-Ávarez, Universidad Nacional de Colombia, Colombia

Universidad Nacional de Colombia, Sede Manizales, Facultad de Ciencias Exactas y Naturales, Manizales-Colombia, crdcorreaal@unal.edu.co

Jessica María Rojas-Mora, Instituto Tecnológico Metropolitano, Colombia

Instituto Tecnológico Metropolitano, Medellín-Colombia, Jessicarojas@itm.edu.co

Antonio Elías Zumaqué Ballesteros, Universidad de Córdoba, Colombia

Universidad de Córdoba, Montería-Colombia, antoniozumaque@gmail.com

Osnamir Elias Bru-Cordero, Universidad Nacional de Colombia, Colombia

Universidad Nacional de Colombia, Sede De La Paz, Dirección Académica, La Paz-Colombia, oebruc@unal.edu.co

Referencias bibliográficas

T. Uhm, and Y. Seongbaek, “A Comparison of Normality Testing Methods by Empirical Power and Distribution of P-Values,” Communications in Statistics Simulation and Computation, vol. 52, no. 9, pp. 4445-4458, Aug. 2021. https://doi.org/10.1080/03610918.2021.1963450

K. Rani Das, and A. H. M. Rahmatullah Imon “A Brief Review of Tests for Normality,” American Journal of Theoretical and Applied Statistics, vol. 5, no. 1, pp. 5-12, Jan. 2016. https://doi.org/10.11648/j.ajtas.20160501.12

S. S. Shapiro, M. B. Wilk, and H. J. Chen, “A Comparative Study of Various Tests for Normality,” Journal of the American Statistical Association, vol. 63, no. 324, pp. 1343-1372, Apr. 1968. https://doi.org/10.1080/01621459.1968.10480932

H. C. Thode, “Plots, probability plots and regression tests,” in Testing for Normality, 1st ed: Boca Raton: CRC Press, 2002. https://doi.org/10.1201/9780203910894

X. Romão, R. Delgado, and A. Costa, “An Empirical Power Comparison of Univariate Goodness-of-Fit Tests for Normality,” Journal of Statistical Computation and Simulation, vol. 80, no. 5, pp. 545-591, Mar. 2009. https://doi.org/10.1080/00949650902740824

H. A. Noughabi, and N. R. Arghami, “Monte Carlo Comparison of Seven Normality Tests,” Journal of Statistical Computation and Simulation, vol. 81, no. 8, pp. 965-972, Dec. 2010. https://doi.org/10.1080/00949650903580047

J. Arnastauskaitė, T. Ruzgas, and M. Bražėnas, “An Exhaustive Power Comparison of Normality Tests,” Mathematics, vol. 9, no. 7, p. 788, Apr. 2021. https://doi.org/10.3390/math9070788

A. Kolmogorov, “Sulla determinazione empirica di una legge di distribuzione,” Giornale dell'Istituto Italiano degli Attuari, vol. 4, pp. 89-91, 1933. https://www.sciepub.com/reference/1552

S. S. Shapiro, and M. B. Wilk, “An Analysis of Variance Test for Normality (Complete Samples),” Biometrika, vol. 52, no. 3/4, pp. 591-611, Dec. 1965. https://doi.org/10.2307/2333709

T. W. Anderson, and D.A. Darling, “Asymptotic Theory of Certain 'Goodness of Fit' Criteria Based on Stochastic Processes,” Annals of Mathematical Statistics, vol. 23, no. 2, pp. 193-212, Jun. 1952. https://doi.org/10.1214/aoms/1177729437

K. V. Mardia, “9 Tests of Univariate and Multivariate Normality,” in Handbook of Statistics, Amsterdam: Elsevier, 1980, pp. 279–320. https://doi.org/10.1016/S0169-7161(80)01011-5

B. W. Yap, and C.H. Sim, “Comparisons of Various Types of Normality Tests,” Journal of Statistical Computation and Simulation, vol. 81, no. 12, pp. 2141-2155, May. 2011. https://doi.org/10.1080/00949655.2010.520163

S. S. Uyanto, “Monte Carlo Power Comparison of Seven Most Commonly Used Heteroscedasticity Tests,” Communications in Statistics - Simulation and Computation, vol. 51, no. 4, pp. 2065-2082, Nov. 2019. https://doi.org/10.1080/03610918.2019.1692031

H. Hernandez, “Testing for Normality: What is the Best Method?,” ForsChem Research Reports, Medellín, Colombia, Technical Report, 2021. Accessed: Jan. 11, 2024. [Online]. Available: https://www.researchgate.net/publication/351128739_Testing_for_Normality_What_is_the_Best_Method

E. M. Gandica de Roa, “Potencia y Robustez en Pruebas de Normalidad con Simulación Montecarlo,” Rev. Sci., vol. 5, no. 18, pp. 108–119, Jan. 2020. https://doi.org/10.29394/Scientific.issn.2542-2987.2020.5.18.5.108-119

S. S. Uyanto, “An Extensive Comparisons of 50 Univariate Goodness-of-fit Tests for Normality,” Austrian Journal of Statistics, vol. 51, no. 3, pp. 45-97, Aug. 2022. https://doi.org/10.17713/ajs.v51i3.1279

A. I. Fleishman, “A Method for Simulating Non-Normal Distributions,” Psychometrika, vol. 43, no. 4, pp. 521-532, Dec. 1978. https://doi.org/10.1007/BF02293811

L. Baringhaus, R. Danschke, and N. Henze, “Recent and Classical Tests for Normality - A Comparative Study,” Communications in Statistics - Simulation and Computation, vol. 18, no. 1, pp. 363-379, Jul. 2007. https://doi.org/10.1080/03610918908812764

C. M. Jarque, and A. K. Bera, “A Test for Normality of Observations and Regression Residuals," International Statistical Review, vol. 55, no. 2, pp. 163-172, Aug. 1987. https://doi.org/10.2307/1403192

R. D'Agostino, and E.S. Pearson, “Tests for Departure from Normality. Empirical Results for the Distributions of b2 and √b1," Biometrika, vol. 60, no. 3, pp. 613-622, Dec. 1973. https://doi.org/10.1093/biomet/60.3.613

H. Cramér, “On the Composition of Elementary Errors: First Paper: Mathematical Deductions,” Scandinavian Actuarial Journal, vol. 1928, no. 1, pp. 13-74, Dec. 2011. https://doi.org/10.1080/03461238.1928.10416862

M. Arshad, M. Rasool, and M. Ahmad, “Anderson-Darling and Modified Anderson-Darling Tests for Generalized Pareto Distribution,” Pakistan Journal of Applied Sciences, vol. 3, no. 2, pp. 85-88, 2003. https://doi.org/10.3923/jas.2003.85.88

M. D. Esteban, M. E. Castellanos, D. Morales, and I. Vajda, “Monte Carlo Comparison of Four Normality Tests Using Different Entropy Estimates,” Communications in Statistics - Simulation and Computation, vol. 30, no. 4, pp. 761-785, Aug. 2006. https://www.tandfonline.com/doi/full/10.1081/SAC-100107780

Y. R. Gel, and J. L. Gastwirth, “A Robust Modification of the Jarque–Bera Test of Normality,” Economics Letters, vol. 99, no. 1, pp. 30-32, Apr. 2008. https://doi.org/10.1016/j.econlet.2007.05.022

D. G. Bonett, and E. Seier, “A Test of Normality with High Uniform Power," Computational Statistics & Data Analysis, vol. 40, no. 3, pp. 435-445, Sep. 2002. https://doi.org/10.1016/S0167-9473(02)00074-9

C. Bontemps, and N. Meddahi, “Testing Normality: A GMM Approach,” Journal of Econometrics, vol. 124, no. 1, pp. 149-186, Jan. 2005. https://doi.org/10.1016/j.jeconom.2004.02.014

J. Bai, and S. Ng, “Tests for Skewness, Kurtosis, and Normality for Time Series Data,” Journal of Business & Economic Statistics, vol. 23, no. 1, pp. 49-60, 2012. https://doi.org/10.1198/073500104000000271

G. W. Snedecor, and W. G. Cochran, “The mean and standard deviation,” Statistical Methods, 8th ed. New York, NY, USA: Wiley-Blackwell, 1989. https://www.wiley.com/en-kr/Statistical+Methods%2C+8th+Edition-p-9780813815619#description-section

Z. Chen, and C. Ye, “An Alternative Test for Uniformity,” International Journal of Reliability, Quality and Safety Engineering, vol. 16, no. 4, pp. 343-356, Jul. 2009. https://doi.org/10.1142/S0218539309003435

G. Brys, M. Hubert, and A. Struyf, “A Robust Measure of Skewness,” Journal of Computational and Graphical Statistics, vol. 13, no. 4, pp. 996-1017, Jan. 2012. http://www.jstor.org/stable/27594089

S. S. Shapiro, and R. S. Francia, “An Approximate Analysis of Variance Test for Normality,” Journal of the American Statistical Association, vol. 67, no. 337, pp. 215-216, Jun. 1972. https://doi.org/10.1080/01621459.1972.10481232

J. A. Doornik, and H. Hansen, “An omnibus test for univariate and multivariate normality,” Oxf. Bull. Econ. Stat., vol. 70, no. s1, pp. 927–939, Dec. 2008. https://onlinelibrary.wiley.com/doi/10.1111/j.1468-0084.2008.00537.x

J. M. Dufour, A. Farhat, L. Gardiol, and L. Khalaf, “Simulation-based Finite Sample Normality Tests in Linear Regressions,” The Econometrics Journal, vol. 1, no. 1, pp. C154-C173, Jun. 2008. https://doi.org/10.1111/1368-423X.11009

M. J. Blanca, J. Arnau, D. López-Montiel, R. Bono, and R. Bendayan, “Skewness and Kurtosis in Real Data Samples,” Methodology, vol. 9, no. 2, pp. 78-84, Jan. 2013. https://doi.org/10.1027/1614-2241/a000057

R. Bendayan, J. Arnau, M. J. Blanca, and R. Bono, “Comparación de los procedimientos de Fleishman y Ramberg et al. para generar datos no normales en estudios de simulación,” Anales de Psicología / Annals of Psychology, vol. 30, no. 1, Dec. 2013. https://doi.org/10.6018/analesps.30.1.135911

P. Flores Muñoz, L. Muñoz Escobar, and T. Sánchez Acalo, “Estudio de potencia de pruebas de normalidad usando distribuciones desconocidas con distintos niveles de no normalidad,” Perfiles, vol. 1, no. 21, pp. 4-11, Jun. 2019. https://doi.org/10.47187/perf.v1i21.42

R Core Team, R: A Language and Environment for Statistical Computing, (2024), R Foundation for Statistical Computing, Vienna, Austria, 2024. Accessed: Jan. 11, 2024. [Online]. Available: https://www.R-project.org/

Cómo citar
[1]
C. D. Correa-Ávarez, J. M. Rojas-Mora, A. E. Zumaqué Ballesteros, y O. E. Bru-Cordero, «Estudio de simulación sobre la potencia y sensibilidad de dieciséis pruebas de normalidad en distintos escenarios de no normalidad», TecnoL., vol. 28, n.º 62, p. e3293, mar. 2025.

Descargas

Los datos de descargas todavía no están disponibles.
Publicado
2025-03-31
Sección
Artículos de investigación
Crossref Cited-by logo
Estadísticas de artículo
Vistas de resúmenes
Vistas de PDF
Descargas de PDF
Vistas de HTML
Otras vistas

Algunos artículos similares: