데이터분석
(4) 데이터분석_데이터프레임 활용하기
빠스무
2023. 6. 13. 10:44
728x90
야구선수의 타율을 분석해보자
pandas를 쓰기위해 import를 시켜준다.
import pandas as pd
df = pd.read_html(url,index_col = 0)
df

df1 = pd.concat(df)
df1

'AVG1','AB', 'H', '2B', '3B', 'HR' 컬럼만 남기고 제거하기
df1 = df1[['AVG1','AB', 'H', '2B', '3B', 'HR']].drop('합계')

# '루타' 파생변수를 생성하여 열 계산하기
# H:1, 2B:2, 3B:3, HR:4
# 4월, 5월의 합계를 제거 후, 타율에 대한 날짜 라인 그래프를 생성
df1['루타'] = df1['H'] + (df1['2B']*2) +(df1['3B']*3) +(df1['HR']*4)
df1.plot(y = 'AVG1')
