Categoría: Blog
-
Visualizando los contagios y muertes de Coronavirus (COVID-19) con R
Al momento de escribir este artículo, no encontramos en medio de una pandemia global por una nueva cepa del Coronavirus (COVID-19), para la cual no cuenta con una vacuna, que ha contagiado a decenas de miles de personas en más de ciento cincuenta países, causando una enorme pérdida de vidas humana en algunos de ellos.…
-
XGBoost en R
XGBoost o Extreme Gradient Boosting, es uno de los algoritmos de machine learning de tipo supervisado más usados en la actualidad. Este algoritmo se caracteriza por obtener buenos resultados de predicción con relativamente poco esfuerzo, en muchos casos equiparables o mejores que los devueltos por modelos más complejos computacionalmente, en particular para problemas con datos…
-
Correlación biserial puntual – Psicometría con R
Al evaluar la calidad de un instrumento psicométrico, una de las tareas más importantes es analizar las características de los ítems (reactivos) que lo conforman. Una de ellas es el índice de discriminación, la cual es tomada en cuenta tanto en Teoría Clásica de los Tests (TCT) como en Teoría de la Respuesta al Ítem…
-
Resultados Planea Preescolar – 2018
Introducción En este artículo mostraré los resultados del Plan Nacional para la Evaluación de los Aprendizajes (Planea) aplicada por el Instituto Nacional para la Evaluación de la Educación (INEE) de México a estudiantes de preescolar al final del ciclo escolar 2017-2018. Como consecuencia de una reforma constitucional, en Mayo de 2019 se decretó la disolución…
-
Variables dummy (one-hot encoding) con R
Los datos categóricos o nominales, como su nombre lo indica, son usados para nombrar o categorizar información. Este tipo de dato se caracteriza por no ser ordenado, incluso si se usan números para representarlos. El nombre de las diferentes razas de perros es un dato categórico. Aunque puedes ordenar todos los nombres alfabéticamente, carece de…
-
Análisis de Componentes Principales para clasificar superhéroes
Soy aficionado a los superhéroes. Muy aficionado. Hasta podría atribuir mi gusto a la lectura a los cómics de Superman y Batman cuando era pequeño, y que haya sobrevivido a la pubertad y adolescencia a los cómics de los X-Men. Así que, cuando me encontré con un conjunto de datos con información de superhéroes y…
-
Redes relacionales con R – Tipos de Pokémon
Las redes relacionales son una manera de visualizar información que resulta muy útil para datos cualitativos y cuantitativos. Como su nombre lo indica, este tipo de redes son utilizadas para mostrar relaciones entre datos, generalmente nominales (nombres, categorías, etiquetas). Por ejemplo, la afinidad entre los integrantes de un equipo de trabajo, los principales clientes de…
-
Mapas temáticos con R — Homicidios en México durante el 2017
Al momento de escribir esto, en México estamos muy próximos a las elecciones para elegir Presidente del país. Entre los muchos temas de interés para la ciudadanía que forman parte de la agenda de los candidatos a la presidencia, uno muy importante es la seguridad. Datos recientes revelan que hasta 76% de los mexicanos se…
-
Webscrapping, APIs y minería de texto con R. Análisis de sentimientos de Coheed and Cambria
Inspirado por análisis realizados por otras personas, decidí que es un buen momento de conocer mejor el contenido de la música de Coheed and Cambria, aplicando técnicas de minería de texto con R. Coheed and Cambria es una de mis bandas favoritas. Tiene la distinción de ser una de las pocas bandas que he escuchado…
-
Alfa de Cronbach – Psicometría con R
Esta entrada está dirigido a practicantes de psicometría que están interesados en realizar sus análisis usando R, pero que no necesariamente son expertos en este lenguaje de programación. Revisaremos como obtener e interpretar el coeficiente Alfa de Cronbach usando el paquete psych de R. Usaremos un conjunto de datos abierto, correspondiente a un test de…