Principais conceitos em análise de dados e inteligência de negócios (BI)
Dimension
A dimension is a characteristic or attribute of a set of data that provides context and organization for data analysis. For example, in a sales dataset, the time period (month, quarter, year) and product type (clothing, electronics, furniture) are dimensions that help organize the data.
Measure
A measure is a numerical value used to quantify data and provide insights into business performance. Examples of measures include sales revenue, profit margin, and customer satisfaction ratings.
Visualization
Data visualization involves presenting data in a visual format such as charts, graphs, and maps to help simplify complex information and communicate insights. It is an important part of data analysis and BI as it enables analysts to communicate their findings to stakeholders effectively.Consiste em linhas (registros) e colunas (campos).
Visualização de Dados
A visualização de dados é a representação gráfica de dados, projetada para apresentar informações complexas de maneira rápida e clara. Formas comuns incluem gráficos de barras, gráficos de linha, gráficos de pizza e gráficos de dispersão.
Distribuição
A distribuição na análise de dados refere-se à maneira como os dados são distribuídos em vários valores ou categorias. Analisar a distribuição ajuda a revelar padrões, tendências e relacionamentos entre variáveis.
Análise Exploratória de Dados
A Análise Exploratória de Dados (EDA) é a etapa inicial da análise de dados em que os analistas usam ferramentas estatísticas e de visualização para identificar padrões, anomalias e relacionamentos nos dados.
Recurso
Um recurso no contexto de ferramentas de BI refere-se à funcionalidade fornecida aos usuários finais. Os recursos muitas vezes são acessíveis por meio de guias ou menus na interface do software.
Medida vs Dimensão
Em business intelligence, uma medida é um valor numérico de um campo de dados que pode ser quantificado, como receita de vendas. Uma dimensão, por outro lado, é um valor qualitativo de um campo de dados, como nomes de produtos ou datas.
Relacionamento
Um relacionamento na análise de dados refere-se à conexão ou correlação entre duas ou mais variáveis. Por exemplo, o relacionamento entre gastos com publicidade e receita de vendas em dados de uma empresa.
Ordenação
Ordenar é um método de organizar dados em uma ordem específica, como alfabética, ascendente ou descendente. Isso pode ajudar a identificar padrões ou facilitar a compreensão dos dados.
Resumir
Resumir dados envolve a criação de um resumo estatístico do conjunto de dados, incluindo métricas como contagem, soma, média, máximo e mínimo. Isso fornece uma visão geral das características dos dados.
Variável
Uma variável é uma medida ou atributo de um campo em um conjunto de dados. As variáveis podem ser contínuas, categóricas ou uma combinação de ambas.