Categorias
Programação Programação

análise exploratória sobre arquivos de log de acessos do apache

Na tentativa de entender um pouco mais sobre o desempenho do nosso site fiz um script python 3 para uma analise preliminar dos arquivos.

def file_IPs(fname):
counter = 0;
IPs = {};
with open(fname) as f:
for linha in f.readlines():
counter += 1;
IP = linha.split()[0];
if IP in IPs:
IPs[IP] += 1;
else:
IPs[IP] = 1;
distinctIPs = 0;
maximo = 0
minimo = counter;
for ip, ipcount in IPs.items():
# print(ip, ipcount);
if (maximo < ipcount): maximo = ipcount; if (minimo > ipcount):
minimo = ipcount;
distinctIPs += 1;
# print("total = ", counter, "distintos = ", distinctIPs, "maximo = ", maximo, "minimo = ", minimo, "media = ", counter/distinctIPs);
print(fname[-8:], "; ", counter, "; ", distinctIPs, "; ", maximo, "; ", minimo, "; ", counter/distinctIPs, "\n");
return