No sé cómo hacerlo en Pandas, ¿alguien puede ayudarme?
lo siento estas queriendo df.groupby(['org','cluster']).mean()? esto no es tan significativo para su conjunto de datos a diferencia de esto: df.groupby(['cluster','org']).mean()
– EdChum
19 mayo 2015 a las 14:35
@EdChum gracias por su ayuda, pero no quiero ninguno de ellos. Pero el “promedio de tiempos promedio por organización”. Por favor vea el resultado esperado (editado)
– UsuarioYmY
19 mayo 2015 a las 16:17
Cero
Si desea tomar primero la media en la combinación de ['cluster', 'org'] y luego tomar media en cluster grupos, puede utilizar:
In [59]: (df.groupby(['cluster', 'org'], as_index=False).mean()
.groupby('cluster')['time'].mean())
Out[59]:
cluster
1 15
2 54
3 6
Name: time, dtype: int64
Si quieres la media de cluster solo grupos, entonces puedes usar:
In [58]: df.groupby(['cluster']).mean()
Out[58]:
time
cluster
1 12.333333
2 54.000000
3 6.000000
También puedes usar groupby en ['cluster', 'org'] y luego usar mean():
In [57]: df.groupby(['cluster', 'org']).mean()
Out[57]:
time
cluster org
1 a 438886
c 23
2 d 9874
h 34
3 w 6
Pero quiero un número por grupo (promedio del promedio de tiempo por organización). Entonces el resultado es solo clúster y tiempo promedio
– UsuarioYmY
19 mayo 2015 a las 15:24
Vince Payandeh
Simplemente haría esto, que literalmente sigue la lógica deseada:
Otra posible solución es remodelar el dataframe usando pivot_table() entonces toma mean(). Tenga en cuenta que es necesario pasar aggfunc="mean" (este promedio time por cluster y org).
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos.
Configurar y más información
lo siento estas queriendo
df.groupby(['org','cluster']).mean()
? esto no es tan significativo para su conjunto de datos a diferencia de esto:df.groupby(['cluster','org']).mean()
– EdChum
19 mayo 2015 a las 14:35
@EdChum gracias por su ayuda, pero no quiero ninguno de ellos. Pero el “promedio de tiempos promedio por organización”. Por favor vea el resultado esperado (editado)
– UsuarioYmY
19 mayo 2015 a las 16:17