Pre-Procesamiento de Datos en Python: Detección de Outliers

Anteriormente ya explicamos como trabajar cuando teníamos valores perdidos en nuestros datos.Si no viste ese artículo puedes recordarlo aquí. Después de eso vamos ahora a trabajar en la detección de outliers. Un outlier es un valor que numéricamente es muy diferente al resto de los datos, lo que puede afectar al momento de su análisis Leer másPre-Procesamiento de Datos en Python: Detección de Outliers[…]

Diagramas de Caja y Bigotes

En este post siguiendo con las representaciones gráficas para analizar información,como ya hicimos en el artículo anterior sobre los gráficos de barras, veremos como crear un Diagrama de Caja y Bigotes Éste diagrama es muy útil cuando queremos ver cómo están distribuidos los valores de las variables y también cuando queremos identificar visualmente los valores atípicos, Leer másDiagramas de Caja y Bigotes[…]

Gráficos de Barras

Hoy veremos como analizar información con la ayuda de una gráfica de barras, la cuál, como su nombre lo indica, contiene barras mediante las que se representan las características de las variables. La altura de cada barra representa la frecuencia con la que se aparece cada una de las variables que se encuentran dentro del Leer másGráficos de Barras[…]

Pre-procesamiento de datos en Python: Reemplazando valores perdidos

En el post Valores Perdidos y Filas Duplicadas en Python te mostré la manera de detectar los valores perdidos dentro de un archivo y cómo podías borrar las filas o las columnas en las que éstos se encontraban. En el siguiente video te hablare acerca de algunas técnicas que se pueden aplicar para calcular los Leer másPre-procesamiento de datos en Python: Reemplazando valores perdidos[…]

Pre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas

Cuando no se tiene un proceso automático para el registro de los valores en las bases de datos, muy frecuentemente estas vienen con valores faltantes en sus variables o bien con valores duplicados, es decir que, por alguna razón, la información de un individuo se encuentra registrada dos o mas veces, lo que podría alterar Leer másPre-Procesamiento de datos en Python.Valores perdidos y filas duplicadas[…]

Tablas de Frecuencias y Diagrama de Pareto en Python

En esta ocasión, mi amiga Rocío Chávez te explicará  en vídeo cómo crear tablas de frecuencias de variables categóricas. Este tipo de tablas es muy útil cuando queremos conocer la cantidad de veces en las que un valor aparece en una variable o columna. Una vez teniendo esta información, creará un Diagrama de Pareto, también Leer másTablas de Frecuencias y Diagrama de Pareto en Python[…]

Filtrando información en Python

Python nos puede ayudar y ser de mucha utilidad en muchos temas. Uno de ellos es filtrando información de los datos que tengamos Para aprender sobre ésto, mi amiga Rocío te explica en el siguiente vídeo cómo puedes filtrar los datos contenidos en un archivo, tanto de variables numéricas como de variables categóricas en Python Leer másFiltrando información en Python[…]

Análisis exploratorio con ACP en R

🙋‍♀️ En esta ocasión aplicaré el Análisis de Componentes Principales a una base de datos que contiene información acerca de una encuesta realizada por el Instituto Nacional de Estadística y de Estudios Económicos de Francia, en el año 2006. En ella se pueden observar grupos de individuos según su edad y el monto total que Leer másAnálisis exploratorio con ACP en R[…]

Clustering Método K-Means en Python

En un artículo anterior te hablé acerca de una de las técnicas de Machine Learning no supervisado llamado Clustering Jerárquico, el cuál es útil cuando se tienen menos de 10,000 individuos o elementos a analizar. En este post te mostraré otra de las técnicas de clustering, llamada método de las K-Medias o K-Means. Una de Leer másClustering Método K-Means en Python[…]

Clustering de series temporales con ACP en R

En este artículo te mostraré cómo podrías aplicar una técnica llamada Análisis de Componentes Principales (PCA, por sus siglas en inglés), en caso de que quisieras encontrar similitudes entre series de tiempo, es decir, hacer clustering sobre las mismas. Ya en un articulo anterior hablamos sobre el Clustering Jerárquico. Si es la primera vez que Leer másClustering de series temporales con ACP en R[…]