Las variables y los diferentes tipos de variables son la columna vertebral del análisis de datos.
Y el análisis de datos es la columna vertebral en la gestión de cualquier empresa a todos los niveles y en concreto del marketing digital.
Ya sea porque te interese el estudio de la estadística, el datamining, el bigdata, el machine learning, las redes neuronales, etc., el primer paso imprescindible es entender lo que es una variable y conocer los diferentes tipos de variables.
Esto te proporcionará los siguientes beneficios:
- Entender el conocimiento que proporciona la descripción numérica de una variable
- Saber lo que puedes esperar de la descripción gráfica de una variable
- Saber el tipo de preguntas más convenientes al crear una encuesta
- Empezar con buen pie el estudio de cualquier disciplina relacionada con el análisis de datos.
En este artículo encontrarás:
- Qué es la organización de la información
- Qué es una variable
- Qué es el análisis de datos
- Tipos de variable
- Ejemplos de los tipos de variable
- Definición de variables dependientes e independientes
Tabla de contenidos
Organización de la información
Los datos son mediciones u observaciones que se recopilan como fuente de información. Hay una gran variedad de diferentes tipos de datos y diferentes formas de representar los datos.
El número de personas que visitan tu web, los países de procedencia, el número de comentarios que recibes cada día, el valor de las ventas de un producto en particular o el número de conversiones por semana, son ejemplos de datos.
Una unidad de datos es una entidad en la población estudiada, como una persona o empresa, sobre la que se recopilan datos y está integrada por diferentes tipos de variables.
Una unidad de datos también se conoce como una de unidad o registro, o simplemente registro.
Un elemento de datos es una característica (o atributo) de una unidad de datos que se mide o cuenta, como la altura, el país de nacimiento o los ingresos. Un elemento de datos también se conoce como variable porque la característica que representa puede variar entre las unidades de datos y puede variar con el tiempo.
Una observación es una ocurrencia de un elemento de datos específico que se registra sobre una unidad de datos. Una observación puede ser numérica o no numérica (categórica).
Por ejemplo, 173 es una observación numérica del elemento de datos ‘altura (cm)’, mientras que ‘España’ es una observación no numérica (categórica) del elemento de datos ‘país de nacimiento’.
Un conjunto de datos o dataset es una colección completa de todas las observaciones.
Qué es una variable
Existen diferentes tipos de variables y cada variable representa una característica, número o cantidad que se puede medir o contar.
Puedes encontrar un gran número de ellas en la analítica web con el nombre de métricas y KPIs.
Una variable también recibe el nombre de elemento de datos.
La edad, el sexo, los ingresos y gastos del negocio, el país de nacimiento, los gastos de capital, las calificaciones de clase, el color de los ojos y el tipo de vehículo son ejemplos de variables.
Se llama variable porque el valor puede variar entre las unidades de datos en una población y puede cambiar de valor con el tiempo.
Por ejemplo, los «ingresos» es una variable que puede variar entre unidades de datos en una población (es decir, las personas o empresas estudiadas pueden no tener los mismos ingresos) y también pueden variar con el tiempo para cada unidad de datos (es decir, los ingresos pueden subir o bajar).
En probabilidad y estadística, una variable aleatoria o variable estocástica es una variable cuyos valores posibles son el resultado de un fenómeno aleatorio.
Más específicamente, una variable aleatoria se define como una función que mapea los resultados de procesos impredecibles a cantidades numéricas, generalmente números reales.
Qué es el análisis de datos
El análisis de datos es el proceso de evaluar los diferentes tipos de variables y su comportamiento utilizando un razonamiento analítico y lógico para examinar cada componente de los datos proporcionados.
Esta forma de análisis es solo uno de los muchos pasos que se deben completar al realizar un experimento de investigación.
El análisis de datos es un proceso de inspección, limpieza, transformación y modelado de datos con el objetivo de descubrir información útil, informar conclusiones y respaldar la toma de decisiones.
El análisis de datos tiene múltiples facetas y enfoques, que abarcan diversas técnicas bajo una variedad de nombres como minería de datos, business intelligence, aprendizaje automático, análisis del bigdata, etc.
El análisis de datos es la piedra angular en diferentes dominios de negocios, ciencias y ciencias sociales.
Tipos de variables
Hay diferentes maneras en que los diferentes tipos de variables se pueden describir de acuerdo con las formas en que se pueden estudiar, medir y presentar.
Variables numéricas
Las variables numéricas tienen valores que describen una cantidad medible como un número.
Responden a preguntas del tipo «cuánto» o «cuántos».
Por lo tanto las variables numéricas son variables cuantitativas.
Las variables numéricas se pueden describir con más detalle como continuas o discretas:
Una variable continua puede tomar cualquier valor entre un determinado conjunto de números reales.
El valor dado a una observación para una variable continua puede incluir valores tan pequeños como lo permita el instrumento de medición.
Ejemplos de variables continuas incluyen altura, tiempo, edad y temperatura.
En una variable discreta las observaciones pueden tomar un valor basado en un conjunto de valores enteros distintos.
Una variable discreta no puede tomar el valor de una fracción entre un valor y el siguiente valor más cercano.
Los ejemplos de variables discretas incluyen el número de automóviles registrados, el número de ubicaciones comerciales y el número de hijos en una familia, todos ellos medidos como unidades completas (es decir, 1, 2, 3 automóviles).
Los datos recopilados para una variable numérica son datos cuantitativos.
Variables categóricas
Las variables categóricas tienen valores que describen una «cualidad» o «característica» de una unidad de datos, como «qué tipo» o «qué categoría».
Las variables categóricas pertenecen a una categoría entre cierto número de categorías mutuamente excluyentes (en una categoría o en otra) y exhaustivas (incluyen todas las opciones posibles).
Por lo tanto, las variables categóricas son variables cualitativas y tienden a estar representadas por un valor no numérico.
Las variables categóricas pueden describirse como ordinales o nominales:
En una variable ordinal las observaciones pueden tomar valores que se puede ordenar o clasificar lógicamente.
Las categorías asociadas con las variables ordinales se pueden clasificar según un orden, pero no necesariamente hay una diferencia numérica entre cada categoría.
Ejemplos de variables categóricas ordinales:
- las notas académicas (es decir, A, B, C),
- las tallas en la ropa (es decir, pequeño, mediano, grande, extra grande) y
- las actitudes (es decir, muy de acuerdo, de acuerdo, en desacuerdo, totalmente en desacuerdo).
En una variable nominal las observaciones pueden tomar un valor que no se puede organizar en una secuencia lógica.
Ejemplos de variables categóricas nominales incluyen sexo, tipo de negocio, color de ojos, religión y marca.
Los datos recopilados para una variable categórica son datos cualitativos.
Variables dependientes e independientes
Los diferentes tipos de variables pueden demostrar relaciones de comportamiento al medir un número de sucesos.
En modelos matemáticos, modelos estadísticos y ciencias experimentales, los valores de las variables dependientes dependen de los valores de las variables independientes.
Las variables dependientes representan la salida o el resultado cuya variación se está estudiando.
Las variables independientes, también conocidas en un contexto estadístico como regresores, representan entradas o causas, es decir, razones potenciales de variación.
En un experimento, cualquier variable que manipule el experimentador puede llamarse variable independiente.
Modelos y experimentos prueban los efectos que las variables independientes tienen en las variables dependientes.
A veces, incluso si su influencia no es de interés directo, se pueden incluir variables independientes por otras razones, como para explicar su potencial efecto de confusión.
Variable dependiente
La variable que depende de otros factores que se miden. Se espera que estas variables cambien como resultado de una manipulación experimental de la variable o variables independientes. Es el supuesto efecto.
Variable independiente
La variable que es estable y no se ve afectada por las otras variables que está tratando de medir. Se refiere a la condición de un experimento que es manipulado sistemáticamente por el investigador. Es la presunta causa.
Las variables dependientes suelen ser las cosas que te interesan pero no puedes afectar directamente, como la rentabilidad, la satisfacción del cliente y la lealtad del cliente.
Puedes influir en las variables dependientes cambiando las variables independientes. Un ejemplo de esta relación se muestra en la figura:
Llévate esto
El análisis de datos, básicamente, es el estudio de los diferentes tipos de variables y la relación entre ellas con el objetivo de extraer conocimiento útil y accionable para tus intereses.
Mediante el mismo podrás responder a preguntas del tipo:
- Qué pasó
- Porqué pasó lo que pasó
- Que puedo esperar que pase
- Cuál es la decisión más acertada en un determinada situación
muy buen articulo. gracias