Python

O que é Pandas e Matplotlib?

O Pandas é uma biblioteca Python amplamente utilizada para manipulação e análise de dados. Ele oferece estruturas de dados poderosas, como DataFrames, que facilitam a organização e a manipulação de conjuntos de dados.

O Matplotlib, por outro lado, é uma biblioteca de visualização de dados em Python que produz gráficos de alta qualidade em vários formatos. Ele oferece uma maneira simples de criar visualizações de dados, como gráficos de linha, gráficos de barras, histogramas, entre outros.

Análise de Dados com Pandas

Abaixo alguns exemplos utilizabdo o pacote pandas:

  • Criando um DataFrame a partir de um dicionário:
    import pandas as pd
    data = {'Nome': ['João', 'Maria', 'Pedro', 'Ana'],
    'Idade': [25, 30, 35, 28],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Brasília']}
     df = pd.DataFrame(data)
     print(df)

    Isso criará um DataFrame com três colunas: ‘Nome’, ‘Idade’ e ‘Cidade’.

  • Lendo dados de um arquivo CSV:
    Suponha que você tenha um arquivo CSV chamado ‘dados.csv’ com os mesmos dados do exemplo anterior. Você pode lê-lo assim:

    import pandas as pd
    
    df = pd.read_csv('dados.csv')
    print(df)
  • Selecionando dados do DataFrame:
    
    # Selecionando uma coluna
    nomes = df['Nome']
    print(nomes)
    
    # Selecionando múltiplas colunas
    info_pessoais = df[['Nome', 'Idade']]
    print(info_pessoais)
    
    # Selecionando uma linha pelo índice
    linha = df.iloc[0]
    print(linha)
    
    # Selecionando linhas baseado em condições
    jovens = df[df['Idade'] < 30]
    print(jovens)
  • Adicionando uma nova coluna:
    
    df['Profissão'] = ['Engenheiro', 'Médica', 'Advogado', 'Professor']
    print(df)

    Isso adicionará uma nova coluna chamada ‘Profissão’ ao DataFrame.

Estes são apenas alguns exemplos básicos de como você pode usar o pandas para manipular dados em Python. O pandas oferece uma ampla gama de funcionalidades para análise e manipulação de dados, desde leitura de diferentes formatos de arquivos até operações complexas de transformação de dados.

Vizualização de dados com Matplotlib

Abaixo alguns exemplos utilizando o pacote Matplotlib:

  • Gráfico de Barras:
    
    import pandas as pd
    import matplotlib.pyplot as plt
    
    # Criando DataFrame com pandas
    data = {'Nome': ['João', 'Maria', 'Pedro', 'Ana'],
            'Idade': [25, 30, 35, 28]}
    df = pd.DataFrame(data)
    
    # Plotando gráfico de barras com Matplotlib
    plt.bar(df['Nome'], df['Idade'], color='blue')
    plt.xlabel('Nome')
    plt.ylabel('Idade')
    plt.title('Idade por Nome')
    plt.show()
    

    Este código criará um gráfico de barras que mostra a idade de cada pessoa.

  • Gráfico de Pizza:
    import pandas as pd
    import matplotlib.pyplot as plt
    
    # Criando DataFrame com pandas
    data = {'Nome': ['João', 'Maria', 'Pedro', 'Ana'],
            'Idade': [25, 30, 35, 28]}
    df = pd.DataFrame(data)
    
    # Plotando gráfico de pizza com Matplotlib
    plt.pie(df['Idade'], labels=df['Nome'], autopct='%1.1f%%', startangle=140)
    plt.axis('equal')
    plt.title('Distribuição das Idades')
    plt.show()

    Isso criará um gráfico de pizza que mostra a distribuição das idades entre as pessoas.

  • Gráfico de Dispersão:
    
    import pandas as pd
    import matplotlib.pyplot as plt
    
    # Criando DataFrame com pandas
    data = {'Nome': ['João', 'Maria', 'Pedro', 'Ana'],
            'Idade': [25, 30, 35, 28],
            'Salário': [5000, 6000, 7000, 5500]}
    df = pd.DataFrame(data)
    
    # Plotando gráfico de dispersão com Matplotlib
    plt.scatter(df['Idade'], df['Salário'], color='red')
    plt.xlabel('Idade')
    plt.ylabel('Salário')
    plt.title('Idade vs Salário')
    plt.show()

    Este código criará um gráfico de dispersão que mostra a relação entre a idade e o salário das pessoas.

Esses são apenas alguns exemplos básicos de como você pode usar o Matplotlib para visualizar dados criados com o pandas. O Matplotlib oferece uma ampla gama de funcionalidades para criar diferentes tipos de gráficos e personalizar sua aparência.

Conclusão

Neste blog, exploramos o uso do Pandas e do Matplotlib para análise e visualização de dados em Python. Vimos como o Pandas facilita a manipulação de conjuntos de dados, enquanto o Matplotlib nos permite criar visualizações informativas e atrativas.

Com esses pacotes poderosos à disposição, os cientistas de dados podem extrair insights valiosos dos dados e comunicá-los de forma eficaz.

Espero que este blog tenha sido útil para você começar sua jornada na análise de dados com Python!

Veja também esse projeto:

até breve!!!

Compartilha conteúdo

Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *