Nombre del autor:Rocio Chavez

Ingeniero en Comunicaciones y Electrónica.Maestría en Ingeniería Industrial y Doctorado en Tecnologías de Información con especialidad en Modelado y Simulación de Sistemas.

Correlación lineal y explicación de algunos métodos para detectarla

En el siguiente video te hablaré acerca de la correlación lineal entre variables y su importancia Entre otras cosas, veremos los tipos de variables que existen, ya que dependiendo del tipo de variable que se tenga será el coeficiente de correlación que utilizaremos. Existen diferentes coeficientes que se pueden utilizar para lograr nuestro objetivo, sin …

Correlación lineal y explicación de algunos métodos para detectarla Leer más »

Categorización de Variables en Python

En este video veremos cómo podemos dividir una información numérica en diferentes categorías. Esta conversión es útil cuando no nos interesa saber la cantidad numérica que un individuo poseee en una de sus características, sino a qué nivel pertenece de acuerdo a esa cantidad. Por ejemplo, tal vez no nos interesa saber exactamente cuanto mide …

Categorización de Variables en Python Leer más »

Clustering con K-Means. Explicación Matemática

😎Hoy te hablaré acerca de un algoritmo para segmentar poblaciones llamado Método de las K-Medias o K-Means, el cuál ha sido muy utilizado en diversas áreas y es parte de los métodos no jerárquicos de Clustering. 👨‍💻Para ello he creado un tutorial en vídeo donde  te explicaré los pasos del algoritmo, las acciones previas a …

Clustering con K-Means. Explicación Matemática Leer más »

Pre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding)

Existen muchos métodos de machine learning que no tienen la capacidad de manejar variables categóricas, como son, el sexo o la profesión de una persona, por lo que es necesario transformarlas a numéricas. La manera más sencilla de hacerlo es crear variables dummy (también llamadas ficticias), mediante un proceso conocido como one-hot encoding, el cual …

Pre-Procesamiento de Datos en Python: Variables Dummy (One-Hot Encoding) Leer más »

Pre-Procesamiento de Datos en Python: Detección de Outliers

Anteriormente ya explicamos como trabajar cuando teníamos valores perdidos en nuestros datos.Si no viste ese artículo puedes recordarlo aquí. Después de eso vamos ahora a trabajar en la detección de outliers. Un outlier es un valor que numéricamente es muy diferente al resto de los datos, lo que puede afectar al momento de su análisis …

Pre-Procesamiento de Datos en Python: Detección de Outliers Leer más »

Diagramas de Caja y Bigotes

En este post siguiendo con las representaciones gráficas para analizar información,como ya hicimos en el artículo anterior sobre los gráficos de barras, veremos como crear un Diagrama de Caja y Bigotes Éste diagrama es muy útil cuando queremos ver cómo están distribuidos los valores de las variables y también cuando queremos identificar visualmente los valores atípicos, …

Diagramas de Caja y Bigotes Leer más »

Pre-procesamiento de datos en Python: Reemplazando valores perdidos

En el post Valores Perdidos y Filas Duplicadas en Python te mostré la manera de detectar los valores perdidos dentro de un archivo y cómo podías borrar las filas o las columnas en las que éstos se encontraban. En el siguiente video te hablare acerca de algunas técnicas que se pueden aplicar para calcular los …

Pre-procesamiento de datos en Python: Reemplazando valores perdidos Leer más »

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas

Cuando no se tiene un proceso automático para el registro de los valores en las bases de datos, muy frecuentemente estas vienen con valores faltantes en sus variables o bien con valores duplicados, es decir que, por alguna razón, la información de un individuo se encuentra registrada dos o mas veces, lo que podría alterar …

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas Leer más »

Scroll al inicio