Jika saya memiliki kerangka data Dask yang sudah diindeks dengan

>>> A.divisions
(None, None)
>>> A.npartitions
1

Dan saya ingin mengatur pembagian, sejauh ini saya lakukan

A.reset_index().set_index("index", divisions=sorted(divisions))

Karena A.repartition(divisions=sorted(divisions)) mengeluh "sisi kiri divisi lama dan baru berbeda". Apakah ada cara yang lebih baik?

3
astrojuanlu 17 Desember 2017, 00:33

1 menjawab

Jawaban Terbaik

Mulai dask.__version__ == '0.16.0' jika Anda mengetahui pembagian kerangka data yang ada, Anda dapat menetapkannya secara langsung.

A.divisions = tuple(divisions)
2
MRocklin 17 Desember 2017, 17:12