Coeficiente de Correlación de Kendall para Variables Ordinales

En el artículo “Correlación lineal y explicación de algunos métodos para detectarla”, te hablé acerca de la utilidad de los coeficientes de Pearson, de Spearman y de Kendall, así como los tipos de variables que existen. En este video te muestro las fórmulas matemáticas que se utilizan para calcular el coeficiente de correlación de Kendall, Leer másCoeficiente de Correlación de Kendall para Variables Ordinales[…]

Categorización de Variables en Python

En este video veremos cómo podemos dividir una información numérica en diferentes categorías. Esta conversión es útil cuando no nos interesa saber la cantidad numérica que un individuo poseee en una de sus características, sino a qué nivel pertenece de acuerdo a esa cantidad. Por ejemplo, tal vez no nos interesa saber exactamente cuanto mide Leer másCategorización de Variables en Python[…]

Clustering con K-Means. Explicación Matemática

😎Hoy te hablaré acerca de un algoritmo para segmentar poblaciones llamado Método de las K-Medias o K-Means, el cuál ha sido muy utilizado en diversas áreas y es parte de los métodos no jerárquicos de Clustering. 👨‍💻Para ello he creado un tutorial en vídeo donde  te explicaré los pasos del algoritmo, las acciones previas a Leer másClustering con K-Means. Explicación Matemática[…]

Pre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding)

Existen muchos métodos de machine learning que no tienen la capacidad de manejar variables categóricas, como son, el sexo o la profesión de una persona, por lo que es necesario transformarlas a numéricas. La manera más sencilla de hacerlo es crear variables dummy (también llamadas ficticias), mediante un proceso conocido como one-hot encoding, el cual Leer másPre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding)[…]

Pre-Procesamiento de Datos en Python: Detección de Outliers

Anteriormente ya explicamos como trabajar cuando teníamos valores perdidos en nuestros datos.Si no viste ese artículo puedes recordarlo aquí. Después de eso vamos ahora a trabajar en la detección de outliers. Un outlier es un valor que numéricamente es muy diferente al resto de los datos, lo que puede afectar al momento de su análisis Leer másPre-Procesamiento de Datos en Python: Detección de Outliers[…]

Pre-procesamiento de datos en Python: Reemplazando valores perdidos

En el post Valores Perdidos y Filas Duplicadas en Python te mostré la manera de detectar los valores perdidos dentro de un archivo y cómo podías borrar las filas o las columnas en las que éstos se encontraban. En el siguiente video te hablare acerca de algunas técnicas que se pueden aplicar para calcular los Leer másPre-procesamiento de datos en Python: Reemplazando valores perdidos[…]

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas

Cuando no se tiene un proceso automático para el registro de los valores en las bases de datos, muy frecuentemente estas vienen con valores faltantes en sus variables o bien con valores duplicados, es decir que, por alguna razón, la información de un individuo se encuentra registrada dos o mas veces, lo que podría alterar Leer másPre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas[…]

Correlación Lineal en Python

En esta ocasión mi amiga Rocío Chávez te explicará como llevar a cabo la detección de la correlación lineal entre variables, incluyendo la creación de diagramas de dispersión y las pruebas de normalidad utilizando el lenguaje python Además, te muestra como puedes obtener una matriz indicando el valor de las correlaciones entre las variables por Leer másCorrelación Lineal en Python[…]

Tablas de Frecuencias y Diagrama de Pareto en Python

En esta ocasión, mi amiga Rocío Chávez te explicará  en vídeo cómo crear tablas de frecuencias de variables categóricas. Este tipo de tablas es muy útil cuando queremos conocer la cantidad de veces en las que un valor aparece en una variable o columna. Una vez teniendo esta información, creará un Diagrama de Pareto, también Leer másTablas de Frecuencias y Diagrama de Pareto en Python[…]