Xarray é um projeto de código aberto e pacote Python que introduz rótulos na forma de dimensões, coordenadas
e atributos em matrizes do tipo NumPy, que permitem uma experiência do usuário mais intuitiva, mais concisa e menos propensa a erros.
Xarray inclui uma grande e crescente biblioteca de funções agnósticas de domínio para análises avançadas e visualização com estas estruturas de dados.
Xarray fornece modelos de dados para trabalhar com matrizes e conjuntos de dados rotulados. Seu kit de ferramentas inclui um amplo conjunto de funções agnósticas de domínio para análise avançada e visualização com estas estruturas de dados.
Interoperabilidade
Interoperável com o ecossistema científico de Python, incluindo NumPy, Dask, Pandas e Matplotlib.
Aplicar operações sobre dimensões nomeadas
Selecione os valores por rótulo em vez do índice inteiro
Operações vetorizadas
Operações matemáticas são vetorizadas em várias dimensões (broadcasting de matrizes) com base em nomes de dimensão, não no formato da matriz.
Operações GroupBy
Operações flexíveis de combinação-aplicação com groupby.
Operações do tipo banco de dados
Alinhamento tipo banco de dados baseado em rótulos de coordenadas que lidam de maneira fácil com valores faltantes.
Rastreamento de metadados arbitrários
Keep track of arbitrary metadata in the form of a Python dictionary.
API de backend I/O flexível e extensível
Ler e gravar dados NetCDF, HDF, Zarr, OpenDAP e GRIB.
Experimente o Xarray em uma REPL diretamente no seu browser (não é necessário instalar nada)!
1"""
2To try Xarray in the browser,
3use the console located 👉 or 👇:
41. Type code in the input cell and press
5 Shift + Enter to execute
62. Or copy paste the code, and click on
7 the "Run" ▶ button in the toolbar
8"""
9import xarray as xr
10import pandas as pd
11import numpy as np
12
13data = xr.DataArray(
14 np.random.randn(3, 2, 3),
15 dims=("time", "lat", "lon"),
16 coords={
17 "lat": [10, 20],
18 "time": pd.date_range(
19 "2020-01", periods=3, freq="MS"
20 ),
21 },
22)
23
24# positional and by integer label, like numpy
25data[0, :]
26
27# loc or "location": positional and
28# coordinate label, like pandas
29data.loc[:, 10]
30
31# isel or "integer select": by dimension name
32# and integer label
33data.isel(lat=0)
34
35# sel or "select": by dimension name and
36# coordinate label
37data.sel(time="2020-01")
38
39# Data aggregations uses dimension names
40# instead of axis numbers
41data.mean(dim=["time", "lat"])
42
43# quick and convenient visualizations
44data.isel(lon=0).plot();
45
46# Pretty neat, eh? :)
47# For more, head over to the documentation pageXarray é parte do ecossistema científico de Python. É construído a partir da NumPy, do Pandas e do Dask e suporta uma ampla gama de aplicativos científicos específicos.
O Xarray suporta vários backends de matrizes, permitindo que os usuários escolham tipos de matrizes que funcionam melhor para sua aplicação.
NumPy
NumPy é o pacote fundamental para a computação de matrizes com Python.
Dask
Arrays distribuídas e paralelismo avançado para análises, permitindo desempenho em escala.

CuPy
Biblioteca de matrizes compatível com NumPy para computação acelerada pela GPU com Python.
Zarr
Uma implementação de matrizes N-dimensionais fatiadas e compactadas para Python.

Sparse
Matrizes esparsas multidimensionais para o ecossistema PyData

Xarray is a NumFOCUS Sponsored Project, a 501(c)(3) nonprofit charity in the United States. NumFOCUS provides Xarray with fiscal, legal,
and administrative support to help ensure the health and
sustainability of the project. For more information, visit numfocus.org
Se você gosta do Xarray e quer apoiar nossa missão, por favor
considere fazer uma doação para apoiar nosso trabalho.