import pandas
pandas.read_csv('./sehir_cinsiyet.csv')
df = pandas.read_csv('./sehir_cinsiyet.csv')
df
print(df)
df.head()
df.tail()
df.shape
df.columns
df.dtypes
df['boy']
df['cinsiyet']
cinsiyetler = df['cinsiyet']
cinsiyetler.head()
df[['boy','kilo']] # alt küme alır ve çift köşeli parantez!!! (köşeli parantez içerisine liste alıyor)
# df['boy','kilo'] # çalışmaz çünkü tek kolon değil
df[2:]
df[2:5]
df.shape
df.loc[1] # seri döndürür (zaman serisi vs.)
Seri döndürür, zaman serisi vs. dolayısıyla mesela df.loc[-1] çalışmaz.
df.loc[df.shape[0]-1] # -1 yerine bu yazılabilir
df.iloc[3]#verilen satırı alır (row number) , loc ise row name alır (isim ile)
df.ix[0] #eskiden kullanılıyordu artık iloc veya loc kullanılıyord
df.iloc[[2,5,6]]
Örnek 1: Cinsiyete göre boy ve kilo ortalamalarını almak istiyor olalım...
df.groupby('cinsiyet') # sonuç göstermez çünkü nasıl aggregate edeceği belirtilmemiş
df.groupby('cinsiyet')['boy'] # cinsiyete göre gruplanmış verinin sadece boy kolonunu alır
df.groupby('cinsiyet')['boy'].mean()
df.groupby('cinsiyet').mean()
df.groupby('cinsiyet').median()
df.groupby('cinsiyet').max()
df1 = pandas.read_csv('./pandas/data/concat_1.csv')
df2 = pandas.read_csv('./pandas/data/concat_2.csv')
df3 = pandas.read_csv('./pandas/data/concat_3.csv')
df1
pandas.concat([df1,df2,df3])
pandas.concat([df1,df3,df1,df2])
rdf=pandas.concat([df1,df3,df1,df2])
rdf.shape
pandas.concat([df1,df3,df1,df2],axis=1)
cdf = pandas.concat([df1,df3,df1,df2],axis=1)
cdf['A']
df1.columns
df1.columns = ['A', 'X','C','D']
df1
cdf
rdf
pandas.concat([df1,df3,df1,df2])
rdf.to_csv('birlesik.csv')
merged_data = site.merge(visited, left_on='name', right_on='site')
merged_data