Etiqueta: data science
-
Webscrapping, APIs y minería de texto con R. Análisis de sentimientos de Coheed and Cambria
Inspirado por análisis realizados por otras personas, decidí que es un buen momento de conocer mejor el contenido de la música de Coheed and Cambria, aplicando técnicas de minería de texto con R. Coheed and Cambria es una de mis bandas favoritas. Tiene la distinción de ser una de las pocas bandas que he escuchado…
-
Redes semánticas con R
En este entrada revisaremos como crear redes semánticas usando R y en el proceso veremos cómo hacer algunas de las tareas más comunes al procesar texto. Una introducción informal a las redes semánticas Las redes semánticas son una técnica de representación usada en distintas disciplinas, entre ellas, la minería de texto. Estas redes son una…
-
Arboles de decisión con R – Clasificación
En este artículo revisaremos lo esencial para implementar árboles de decisión en R, en particular el caso de los árboles de clasificación, usando el paquete rpart. Utilizaremos un conjunto de datos usado frecuentemente para probar métodos de aprendizaje automático en nuestro ejemplo y durante el proceso daremos también un vistazo a algunos problemas comunes al…
-
Análisis de sentimientos con R – Léxico Afinn
En este documento revisaremos cómo realizar análisis de sentimientos usando R y el léxico Afinn. Nos enfocaremos en algunas de las opciones que tenemos para analizar sentimientos usando R más que en los resultados específicos de los datos que usaremos, pero en el proceso veremos maneras para contestar ciertas preguntas: ¿Cuáles palabras han influido para…
-
Naïve Bayes con R para clasificación de texto
En este artículo revisaremos como implementar el Naïve Bayes (clasificador Bayesiano ingenuo) para clasificar texto usando R. Naïve Bayes es un algoritmo de aprendizaje automático basado en el teorema de Bayes que aunque es sencillo de implementar, tiende a dar buenos resultados. Usaremos un conjunto de datos sencillo, obtenido con la API de Twitter, que…
-
La importancia de explorar nuestros datos (Ventas de videojuegos con R)
La exploración de nuestros datos es un paso esencial para cualquier tipo de análisis que deseemos realizar. Si no conocemos la estructura de nuestros datos, sus propiedades y particularidades, después podemos encontrarnos con problemas para analizar, modelar e interpretar resultados. No importa que tan sofisticada sea una técnica de modelo estadístico o aprendizaje automático, si…
-
¿Sobré que tuitearon los precandidatos en el 2017?
En las dos primera partes de esta serie de artículos hablamos sobre los hábitos de uso de Twitter de los candidatos a la presidencia de México en el 2017 (click aquí para leer) y sobre cuántas interacciones reciben sus tuits, entre favoritos y retuits (click aquí para leer). En esta ocasión, hablaremos sobre qué hablan…
-
¿Cómo usaron Twitter en el 2017 los precandidatos a la presidencia de México? — Interacciones: Favoritos y RTs
En la primera parte de esta serie de artículos (da click aquí para leerla), hicimos un análisis de los hábitos de uso de Twitter de los precandidatos a la presidencia de México. Revisamos el número de Tuits, Respuestas y Retuits (RTs) que hicieron durante el 2017 así como los periodos de tiempo en los que…
-
¿Cómo usaron Twitter en el 2017 los precandidatos a la presidencia de México?
Twitter es una red social de gran visibilidad en la actualidad que puede tener un impacto considerable en la percepción de sus usuarios acerca de eventos y personas. Naturalmente, Twitter es usada como parte de las estrategias de imagen pública de numerosos políticos, entre ellos, los aspirantes a ocupar puesto de elección popular en México.…