Saya relatif baru di Python/Panda dan saya mencoba mencetak jenis nilai untuk setiap kolom dalam bingkai data saya. Namun, ketika saya mencoba menggunakan fungsi .dtypes() saya mendapatkan kesalahan seri.
Berikut adalah beberapa kode yang saya gunakan:
file = pd.read_csv('Nudge.csv', sep=",")
dat....
Saya memiliki objek pd.Series berikut.
ticker
date
2020-02-06 BKBR3
2020-02-06 BRKM5
2020-02-06 CNTO3
.......... ......
2020-02-06 BIDI11
2020-02-06 BRPR3
2020-02-06 CVCB3
2020-02-06 ELET3
2020-02-06 GFSA3
2022-01-26 QETH11
2022-01-2....
Saya memiliki kerangka data berikut yang mencantumkan informasi tentang pemberhentian jalan makanan cepat saji.
Masukan
first_stop second_stop third_stop
mcdonalds burger king popeyes
mcdonalds N/A N/A
wendys kfc N/A
taco bell kfc wendys
p....
Dengan asumsi saya memiliki kerangka data yang terlihat seperti di bawah ini:
import pandas as pd
import numpy as np
d = {'Column 1': [10, 12,13,43,np.nan],
'Column2':[np.nan,7,np.nan,49,8]}
df = pd.DataFrame(d)
Saya ingin membuat kolom ketiga dengan syarat untuk mengambil nilai dari Kolom 2 ....
26 Januari 2022, 18:09
Saya memiliki 2 file CSV:
CSV 1 - nama_asli.csv
Serial,Names
1,James
2,Stephen
3,Ben
4,Harry
5,Jack
6, Peter
CSV 2 - dup_names.csv
Serial,Names
1,James
2,Kate
3,Ben
4,Sara
Keluaran yang Diinginkan - new.csv
Serial,Names,flag
1,0,T
2,Kate,F
3,0,T
4,Sara,F
5,Jack,F
6,Peter,F
Seperti yang Anda l....
Saya memiliki kerangka data seperti:
Masukan:
IP Flag
101 Yes
101 Yes
101 No
103 Yes
103 Maybe
103 Yes
104 No
104 Yes
Bagaimana saya bisa mendapatkan daftar IP unik yang memiliki tanda Ya dan Tidak?
Keluaran yang Diharapkan:
IP
101
104
....
26 Januari 2022, 17:32
Saya memiliki nilai awal dan akhir berikut:
start = 0
end = 54
Saya perlu membuat himpunan bagian dari 4 bilangan bulat berurutan mulai dari start hingga end dengan spasi 20 di antara setiap himpunan bagian. Hasilnya harus seperti ini:
0, 1, 2, 3, 24, 25, 26, 27, 48, 49, 50, 51
Dalam contoh ini,....
Saya menggunakan kode berikut untuk mendapatkan baris dari kerangka data dan kemudian menemukan nilai maks.
def find_max(a):
return a.values.max()
row = df.iloc[0].astype(int)
max_value = find_max(a)
Itu bekerja dengan baik. Namun, jika saya melewatkan array seperti
ar = [1,2,3]
max_value = f....
Diberikan dua dataframes berikut:
df1 = pd.DataFrame(data={'unicorn': ['blue', 'red', 'piNk'], 'size': [3, 4, 6]})
df2 = pd.DataFrame(data={'unicorn': ['red'], 'size': [2]})
Df1:
unicorn size
0 blue 3
1 red 4
2 piNk 6
Df2 (selalu memiliki satu baris):
unicorn size
0 ....
Saya ingin menambahkan judul untuk setiap subplot. Saya ingin menetapkan judul terpisah untuk setiap subplot dari daftar judul dalam urutan yang sama.
Title_list = ['Table1', 'Table2',, 'Table3', 'Table4', 'Table5, 'Table6']
Oleh karena itu tetapkan judul untuk df1 sebagai 'Tabel1', df2 sebagai 'Ta....
26 Januari 2022, 16:09
Saya ingin menerapkan perubahan pada kolom kerangka data saya di mana sel tidak kosong. Ini adalah kerangka data yang saya gunakan:
df = pd.DataFrame ([{'name':None, 'client':None, 'fruit':'orange'},
{'name':'halley','client':'abana', 'fruit':'pear'},
{'name'....
Saya memiliki kerangka data yang berisi string dalam kolom yang seharusnya hanya mengapung. Saya melihat beberapa solusi tentang cara menjatuhkan baris dengan string atau bagian tertentu dari kolom individual.
Jadi untuk kolom individu saya kira orang bisa melakukannya seperti ini
new_df = df[df['C....
Berikut ini adalah data yang saya kerjakan di bawah ini adalah DataFrame di pandas di sini indeks baris adalah string
Openness Conscientiousness Extroversion Agreeableness Neuroticism
Root 0.139050 0.000000 0.325481 0.147281 0.169475
Hips 0.530089 0.477398 0.804....
Saya berjuang untuk memahami kode di bawah ini. Berdasarkan dokumentasi yang saya baca
apply memanggil fungsi partial pada setiap nilai dalam deret df['startdate'] selanjutnya, fungsi partial meneruskan argumen dayfirst=False ke fungsi date_change (Saya yakin mengapa fungsi parsial digunakan di sin....
Saya memiliki array 3D numpy dengan bentuk berikut: (688, 549, 3). Setiap dimensi adalah gambar. Semua dimensi dtype adalah 'float64', namun, yang ke-3 hanya memiliki bilangan bulat (tetapi karena dtype mereka disimpan sebagai float, misalnya. isntad dari 3 akan menjadi 3.0 ).
Saya mencoba menguba....
3
Konversi jumlah dalam format string dengan koma dan tanda minus tambahan menjadi numerik atau float
Saya memiliki kolom dengan nilai numerik dalam format string dengan koma pemisah seribu dan tanda minus yang dinyatakan di akhir string untuk nilai minus.
df1 = pd.DataFrame({'Name':['John', 'Tom', 'Simon', 'Jose','Jose'],
'Amount':['1,000.00','1,000.00-', '100.00', '100.00-','1....
26 Januari 2022, 13:51
Bagaimana cara mengekspor kerangka data panda ke excel dengan pemformatan bersyarat?
Contoh Data
from random import randint
x = [randint(0, 1) for p in range(0, 10)]
sample_dict = {"Col1": [randint(0, 1) for p in range(0, 10)],
"Col2": [randint(0, 1) for p in range(0, 10)],
....
26 Januari 2022, 13:50
Saya memiliki beberapa kesulitan untuk mengeksploitasi file pengikisan csv di pandas. Saya memiliki beberapa kolom, salah satunya berisi harga '1 800 €'
Setelah mengimpor csv sebagai kerangka data, saya tidak dapat mengonversi kolom saya di Integrer
Saya menghapus simbol euro tanpa masalah
data['pr....
26 Januari 2022, 13:03
Baru mengenal panda dan mencoba mencari tahu hasil pemfilteran dari kerangka data berdasarkan data di kerangka data lain.
df1 df2
v1 v2 v1 v2
1 2 1 3
1 3 2 3
1 4 3 4
2 2
2 4
3 ....
Saya ingin mengunggah csv sebagai file parket ke ember S3. Di bawah ini adalah cuplikan kode.
df = pd.read_csv('right_csv.csv')
csv_buffer = BytesIO()
df.to_parquet(csv_buffer, compression='gzip', engine='fastparquet')
csv_buffer.seek(0)
Di atas memberi saya kesalahan: TypeError: expected str, byt....
Saya sudah mendapatkan kerangka data berikut:
lst=[['01012021','A',10],['01012021','B',20],['02012021','A',12],['02012021','B',23]]
df2=pd.DataFrame(lst,columns=['Date','FN','AuM'])
Saya ingin menambahkan kolom dengan nilai sebelumnya oleh FN. Akibatnya saya harus mendapatkan kerangka data berikut....
26 Januari 2022, 10:57
Kerangka data saya terlihat seperti ini:
Saya ingin menghapus SEMUA baris (ditandai merah pada gambar) di mana setiap kolom memiliki nilai seperti:
"", "nan", "NaT"
Saya mencoba beberapa hal seperti dropna, mengganti dan menjatuhkan, tetapi saya tidak dapat membuatnya berfungsi untuk menghapusnya.....
Saya memiliki bingkai data seperti ini di mana bidang distCum menunjukkan jarak:
oid distCum
1472 0
1473 0.084116923
1565 0.157785132
1469 2.326473679
9567 4.156309659
1500 5.953545907
9544 6.157304401
1561 6.190537806
8823 7.503586809
4037 8.547562197
Kerangka dat....
Jadi saya bekerja dengan data centang dan saya mencoba untuk sampel ulang kerangka data ke menit bar, tetapi ketika sampel ulang disebut deret waktu dimulai dan berakhir contoh pertama yang ada centang. Bagaimana cara saya mengambil sampel ulang data ini sehingga waktu pertama dan terakhir dapat di....
Saya memiliki file CSV dengan nilai Lat dan panjang dari dua model (Model 1 dan Model 2) seperti yang ditunjukkan di bawah ini. Saya mencoba untuk mencapai yang berikut
Cari nilai Lat/ Long baris pertama dari model 1 di setiap baris nilai model 2 kolom Lat/ Long. Jika nilai Lat/ Long model 1 ditem....