Python

Coeficiente de Correlación de Kendall para Variables Ordinales

En el artículo “Correlación lineal y explicación de algunos métodos para detectarla”, te hablé acerca de la utilidad de los coeficientes de Pearson, de Spearman y de Kendall, así como los tipos de variables que existen. En este video te muestro las fórmulas matemáticas que se utilizan para calcular el coeficiente de correlación de Kendall, …

Coeficiente de Correlación de Kendall para Variables Ordinales Leer más »

Categorización de Variables en Python

En este video veremos cómo podemos dividir una información numérica en diferentes categorías. Esta conversión es útil cuando no nos interesa saber la cantidad numérica que un individuo poseee en una de sus características, sino a qué nivel pertenece de acuerdo a esa cantidad. Por ejemplo, tal vez no nos interesa saber exactamente cuanto mide …

Categorización de Variables en Python Leer más »

Clustering con K-Means. Explicación Matemática

😎Hoy te hablaré acerca de un algoritmo para segmentar poblaciones llamado Método de las K-Medias o K-Means, el cuál ha sido muy utilizado en diversas áreas y es parte de los métodos no jerárquicos de Clustering. 👨‍💻Para ello he creado un tutorial en vídeo donde  te explicaré los pasos del algoritmo, las acciones previas a …

Clustering con K-Means. Explicación Matemática Leer más »

Pre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding)

Existen muchos métodos de machine learning que no tienen la capacidad de manejar variables categóricas, como son, el sexo o la profesión de una persona, por lo que es necesario transformarlas a numéricas. La manera más sencilla de hacerlo es crear variables dummy (también llamadas ficticias), mediante un proceso conocido como one-hot encoding, el cual …

Pre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding) Leer más »

Pre-Procesamiento de Datos en Python: Detección de Outliers

Anteriormente ya explicamos como trabajar cuando teníamos valores perdidos en nuestros datos.Si no viste ese artículo puedes recordarlo aquí. Después de eso vamos ahora a trabajar en la detección de outliers. Un outlier es un valor que numéricamente es muy diferente al resto de los datos, lo que puede afectar al momento de su análisis …

Pre-Procesamiento de Datos en Python: Detección de Outliers Leer más »

Pre-procesamiento de datos en Python: Reemplazando valores perdidos

En el post Valores Perdidos y Filas Duplicadas en Python te mostré la manera de detectar los valores perdidos dentro de un archivo y cómo podías borrar las filas o las columnas en las que éstos se encontraban. En el siguiente video te hablare acerca de algunas técnicas que se pueden aplicar para calcular los …

Pre-procesamiento de datos en Python: Reemplazando valores perdidos Leer más »

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas

Cuando no se tiene un proceso automático para el registro de los valores en las bases de datos, muy frecuentemente estas vienen con valores faltantes en sus variables o bien con valores duplicados, es decir que, por alguna razón, la información de un individuo se encuentra registrada dos o mas veces, lo que podría alterar …

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas Leer más »

Tablas de Frecuencias y Diagrama de Pareto en Python

En esta ocasión, mi amiga Rocío Chávez te explicará  en vídeo cómo crear tablas de frecuencias de variables categóricas. Este tipo de tablas es muy útil cuando queremos conocer la cantidad de veces en las que un valor aparece en una variable o columna. Una vez teniendo esta información, creará un Diagrama de Pareto, también …

Tablas de Frecuencias y Diagrama de Pareto en Python Leer más »

Scroll al inicio