domingo, 3 de agosto de 2014

Em publicações anteriores

Como ilustrar a relação econômico-financeira do G20 utilizando Data Mining?
Text Mining, Hinos Nacionais e os 8 melhores Times da Copa do Mundo de 2014

mostramos o que são e quais podem ser os usos das redes complexas. Entretanto, sempre geramos o gráfico com o auxílio do software Gephi. No post de hoje vamos criar e plotar uma rede complexa com o Python, utilizando a biblioteca networkx.

Como faltam apenas 32 dias para o kick off desta temporada, vamos falar um pouco de Python com NFL. Desde o primeiro Super Bowl, em 15 de janeiro de  1967, já foram disputados outros 48 e neste anos teremos o 50º! É uma temporada especial, sem dúvidas. Cada ano, temos uma cidade diferente sediando o último jogo da temporada da NFL, sendo que Miami e New Orleans são as duas cidades que mais sediaram o evento, com 8 e 10 Super Bowls, respectivamente.

Vamos plotar uma rede mostrando quais são os times que já venceram nestas duas sedes. O código completo está disponível aqui - pyGraph.py

O resultado que temos é mostrado abaixo (clique para ampliar).

De imediato vemos que Pittsburgh Steelers (maior vencedor de Super Bowls, com 6 títulos), Green Bay Packers (4) e o San Francisco 49ers (5) são os únicos times que venceram em ambos as cidades. Interessante é que estes mesmos times estão entre os 4 maiores vencedores do Super Bowl. O segundo maior vencedor, Dallas Cowboys, já ganhou em New Orleans, mas não em Miami.

No código, comentamos cada processo. Vale a pena consultar a documentação da networkx, disponível em https://networkx.github.io/documentation.html, para entender como podemos fazer mais customizações em nossa rede.

Um abraço e até o próximo post!

0 comentários:

Postar um comentário