Saya memiliki kerangka data berukuran N =~ (3Million,79). Saya perlu membuat 1k kerangka data berukuran 3.000 di mana masing-masing adalah subset acak dari kerangka data yang dijelaskan sebelumnya. Selain itu, tanpa penggantian. Dengan begitu saya mendapatkan totalitas data tetapi dibagi secara acak menjadi 1k kerangka data.

0
Antonio López Ruiz 23 November 2017, 19:02

1 menjawab

Jawaban Terbaik

Setelah Anda memutuskan dalam berapa banyak bagian n Anda ingin membagi kerangka data Anda, Anda bisa melakukannya

import pandas as pd
import numpy as np

dfs = np.array_split(df.sample(frac=1), n)
2
rpanai 23 November 2017, 16:13