Misalnya kita ingin menghitung rata-rata daftar angka yang daftarnya sangat panjang. dan angka-angka itu ketika diurutkan hampir linier (atau kita dapat menemukan Model Regresi linier untuk data). Secara matematis kita dapat mengagregasikan maksud dengan

((arr[0] + arr[length(arr)]) / 2 )   + intercept

Atau dalam kasus ini, model linier hampir konstan (koefisien kemiringan hampir 1). kita dapat menghitung kira-kira:

mean(arr[n/const]) = mean(arr)

Konsep yang sama diterapkan untuk kedua kasus tersebut. dan sangat mendasar. Apakah ada cara: pola, fungsi (semoga dengan python), atau studi apa pun yang disarankan dan yang dapat membantu akan disambut dengan senang hati; tentu saja pola seperti itu jika ada harus bersifat umum dan tidak hanya untuk kasus rata-rata (mungkin fungsi apa pun atau setidaknya fungsi agregat seperti: jumlah, rata-rata ...). (karena saya tidak memiliki latar belakang matematika yang kuat, dan saya baru dalam pembelajaran mesin, mohon toleransi ketidaktahuan saya). Tolong beri tahu saya jika ada yang tidak jelas.

1
Curcuma_ 16 Agustus 2017, 14:49

2 jawaban

Jawaban Terbaik

Hukum Bilangan Besar menyatakan bahwa dengan bertambahnya ukuran sampel, rata-rata sampel pengamatan menjadi konvergen dengan rata-rata populasi sebenarnya dengan probabilitas 1.

Oleh karena itu, jika array hipotetis Anda terlalu besar untuk rata-rata, Anda setidaknya bisa mengambil rata-rata sampel besar dan tahu bahwa Anda dekat dengan rata-rata populasi sebenarnya.

Anda dapat mengambil sampel dari larik numpy menggunakan numpy.random.choice(arr,n) di mana arr adalah larik Anda dan n adalah elemen sebanyak yang Anda inginkan (atau mampu) untuk dijadikan sampel.

4
C8H10N4O2 25 Agustus 2017, 02:57

Ada solusi yang lebih umum untuk pekerjaan seperti paket Dask, misalnya: http://dask.pydata. org/id/terbaru/ Itu dapat mengoptimalkan grafik perhitungan, memparalelkan perhitungan dan banyak lagi.

2
CrazyElf 24 Agustus 2017, 14:52