- Passo 1: Entendimento do Desafio
- Passo 2: Entendimento da Área/Empresa
- Passo 3: Extração/Obtenção de Dados
- Passo 4: Ajuste de Dados (Tratamento/Limpeza)
- Passo 5: Análise Exploratória
- Passo 6: Modelagem + Algoritmos (Aqui que entra a Inteligência Artificial, se necessário)
- Passo 7: Interpretação de Resultados
- !pip install matplotlib
- !pip install seaborn
- !pip install scikit-learn
#Depois vamos importar o arquivo que vamos analisar
- import pandas as pd
- tabela = pd.read_csv("nome_do_arquivo.csv")
- display(tabela)
obs: para usar o pd.read_csv("nome_do_arquivo.csv) primeiro você deve importar seus arquivos no Jupyter caso não tenha o arquivo importado deverá indicar o caminho que seu arquivo esta
- Vamos tentar visualizar como as informações de cada item estão distribuídas
- Vamos ver a correlação entre cada um dos itens
Para isso , vamos importar o seaborn e o matplotlib
-
import seaborn as sns
-
import matplotlib.pyplot as plt
-
sns.heatmap(tabela.corr(), annot=True, cmap="Wistia")
-
plt.show()
outra forma de ver a mesma análise
- sns.pairplot(tabela)
- plt.show()
- Separando em dados de treino e dados de teste