Xarray es un proyecto de código abierto y un paquete de Python que introduce etiquetas en forma de dimensiones, coordenadas y atributos sobre conjuntos de datos similares a NumPy, lo que permite una experiencia de usuario más intuitiva, más concisa y menos propensa a errores.
Xarray incluye una biblioteca grande y en crecimiento de funciones independientes del dominio para análisis y visualización avanzados con estas estructuras de datos.
Xarray proporciona modelos de datos para trabajar con conjuntos de datos etiquetados. Su conjunto de herramientas incluye un amplio conjunto de funciones independientes del dominio para análisis y visualización con estas estructuras de datos.
Interoperabilidad
Interoperabilidad con el ecosistema científico de Python, incluyendo NumPy, Dask, Pandas y Matplotlib.
Aplique operaciones sobre dimensiones etiquetadas
Seleccione valores por etiqueta en lugar de ubicación entera
Operaciones vectorizadas
Las operaciones matemáticas se vectorizan en múltiples dimensiones en función de los nombres de las dimensiones, no de la forma.
Operaciones de Agrupado Por
Operaciones flexibles de división, aplicación y combinación mediante Agrupado Por.
Operaciones similares a bases de datos
Alineación similar a una base de datos basada en etiquetas de coordenadas para el manejo de forma eficiente de valores faltantes.
Seguimiento de metadatos arbitrarios
Keep track of arbitrary metadata in the form of a Python dictionary.
API de Entrada y Salida del backend flexible y extensible
Lea y escriba datos desde y hacia NetCDF, HDF, Zarr, OpenDAP y GRIB.
¡Pruebe Xarray en un REPL directamente en su navegador (no necesita instalación)!
1"""
2To try Xarray in the browser,
3use the console located 👉 or 👇:
41. Type code in the input cell and press
5 Shift + Enter to execute
62. Or copy paste the code, and click on
7 the "Run" ▶ button in the toolbar
8"""
9import xarray as xr
10import pandas as pd
11import numpy as np
12
13data = xr.DataArray(
14 np.random.randn(3, 2, 3),
15 dims=("time", "lat", "lon"),
16 coords={
17 "lat": [10, 20],
18 "time": pd.date_range(
19 "2020-01", periods=3, freq="MS"
20 ),
21 },
22)
23
24# positional and by integer label, like numpy
25data[0, :]
26
27# loc or "location": positional and
28# coordinate label, like pandas
29data.loc[:, 10]
30
31# isel or "integer select": by dimension name
32# and integer label
33data.isel(lat=0)
34
35# sel or "select": by dimension name and
36# coordinate label
37data.sel(time="2020-01")
38
39# Data aggregations uses dimension names
40# instead of axis numbers
41data.mean(dim=["time", "lat"])
42
43# quick and convenient visualizations
44data.isel(lon=0).plot();
45
46# Pretty neat, eh? :)
47# For more, head over to the documentation pageXarray forma parte del ecosistema científico más amplio de Python. Está desarrollado sobre NumPy, Pandas y Dask y es compatible con una amplia gama de aplicaciones científicas específicas del dominio.
En esta sección se enumeran algunos de los paquetes independientes y proyectos desarrollados con xarray.
Xarray admite múltiples motores, lo que permite a los usuarios elegir los tipos de estructuras de datos que funcionan mejor para su aplicación.
NumPy
NumPy es el paquete fundamental para la computación de matrices/arreglos con Python.
Dask
Arreglos distribuidos y paralelismo avanzado para el análisis, lo que permite un rendimiento escalable.

CuPy
Biblioteca de matrices/arreglos compatible con NumPy para computación acelerada por GPU con Python.
Zarr
Una implementación de matrices N-dimensionales, fragmentadas y comprimidas para Python.

Sparse
Arreglos multidimensionales dispersos para el ecosistema PyData

Xarray es un proyecto patrocinado por NumFOCUS, una 501(c)(3) nonprofit charity En Estados Unidos. NumFOCUS proporciona a Xarray apoyo fiscal, legal y administrativo para garantizar la viabilidad y sostenibilidad del proyecto. Para más información, visitenumfocus.org
Si te gusta Xarray y quieres apoyar nuestra misión, considera hacer una donación para apoyar nuestros esfuerzos.