¿Cuáles son las diferencias entre Pandas y NumPy+SciPy en Python? [closed]

3 minutos de lectura

ambos parecen extremadamente similar y tengo curiosidad por saber qué paquete sería más beneficioso para el análisis de datos financieros.

avatar de usuario
wes mckinney

pandas proporciona herramientas de manipulación de datos de alto nivel construidas sobre NumPy. NumPy por sí mismo es una herramienta de nivel bastante bajo, similar a MATLAB. pandas, por otro lado, proporciona una rica funcionalidad de series temporales, alineación de datos, estadísticas amigables con NA, métodos de agrupación, fusión y unión, y muchas otras comodidades. Se ha vuelto muy popular en los últimos años en aplicaciones financieras. Tendré un capítulo dedicado al análisis de datos financieros utilizando pandas en mi próximo libro.

  • Deberías haber mencionado que eres el autor principal de pandas. 🙂 El libro en cuestión: shop.oreilly.com/product/0636920023784.do

    – Yktula

    21 de agosto de 2013 a las 4:45


  • ¿Sería justo decir que numpy proporciona principalmente matrices eficientes, mientras que pandas proporciona diccionarios eficientes? (En ambos casos, limitado al tipo de datos consistente en lugar de la forma libre). Para mí (estoy comenzando a investigarlo ahora), esto me parece la diferencia subyacente: el manejo de datos emparejados por etiquetas (en 1d, también conocido como dictados y 2d también conocido como tablas). La alineación de datos, la unión, etc., todo se convierte en posible debido a esto, pero para las personas que no asimilan esa diferencia subyacente, ni siquiera está claro qué significan (por ejemplo, ¿qué es la “alineación de datos” de dos matrices numpy?).

    – Brandin

    22 de julio de 2014 a las 19:56


  • puede ser una pregunta tonta, pero ¿qué quieres decir con NA-friendly statisticsmencionado en su respuesta.

    – Adil Abbasi

    16 de septiembre de 2016 a las 5:40


  • Creo que se refiere a las estadísticas teniendo en cuenta los datos faltantes (NA, “No disponible”)

    – Siva-Sg

    22 de septiembre de 2016 a las 9:46

  • Hilo frío, pero ¿qué pasa con las diferencias de rendimiento en una operación compleja en numpy, por ejemplo, pero simplificada sintácticamente en pandas? ¿Hay un costo de rendimiento para seguir la ruta de sintaxis fácil y de alto nivel?

    – 3 hoyos

    24/03/2018 a las 20:14

Los pandas requieren Numpy (y prácticamente todas las herramientas numéricas para Python). Scipy no es estrictamente necesario para los pandas, pero aparece como una “dependencia opcional”. No diría que pandas es una alternativa a Numpy y/o Scipy. Más bien, es una herramienta adicional que proporciona una forma más simplificada de trabajar con datos numéricos y tabulares en Python. Puede usar estructuras de datos de pandas pero dibujar libremente en las funciones Numpy y Scipy para manipularlas.

avatar de usuario
iury simoes-sousa

Pandas ofrece una excelente manera de manipular tablas, ya que puede facilitar la clasificación (agrupar un marco de datos en pandas en Python) y calcular estadísticas. Otra cosa que es genial en pandas es la clase Panel que puede unir series de capas con diferentes propiedades y combinarlas usando la función groupby.

¿Ha sido útil esta solución?

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Configurar y más información
Privacidad