파이썬 분석 실무, 유저 Funnel 분석 - (1) 데이터 불러오기

|

python 분석 실무, 유저 funnel 분석

데이터 불러오기

  • .read_csv() :csv 데이터 불러오기
  • 항상 불러오면 아래 내용을 확인하는 습관을 갖을 것
    • .shape : 데이터의 사이즈 확인
    • .head(),.tail() : 실제 데이터 앞뒤로 확인, 앞부분은 df[:10]로도 확인이 가능하다.
    • .info() : 데이터 타입, 결측치 확인
    • .isna().sum() : 데이터 결측값이 있는 것의 수 확인
df = pd.read_csv("df_funnel.csv", index_col = 0)

df.shape
# (301861, 7)

df.info()
# <class 'pandas.core.frame.DataFrame'>
# Int64Index: 301861 entries, 0 to 301860
# Data columns (total 7 columns):
# actiontype          301861 non-null object
# ismydoc             301861 non-null object
# ext                 301861 non-null object
# sessionid           301861 non-null object
# documentposition    301861 non-null object
# datetime            301861 non-null object
# screen              301861 non-null object
# dtypes: object(7)
# memory usage: 18.4+ MB

df.head(5) 
# actiontype	ismydoc	ext	sessionid	documentposition	datetime	screen
# 0	OPEN	NoView	PDF	9400fd2e43d7dc2d054ca78806236ee1	LOCALSTORAGE	2016.7.18	Per_Dir
# 1	CLOSE	NoView	PDF	9400fd2e43d7dc2d054ca78806236ee1	LOCALSTORAGE	2016.7.18	Per_Dir
# 2	OPEN	View	PDF	9400fd2e43d7dc2d054ca78806236ee1	MYPOLARISDRIVE	2016.7.18	Pub_Dir
# 3	CLOSE	View	PDF	9400fd2e43d7dc2d054ca78806236ee1	MYPOLARISDRIVE	2016.7.18	Pub_Dir
# 4	OPEN	NoView	PDF	f191063c562691041dfa935ff0876975	OTHERAPP	2016.7.6	Main

df.isna().sum()
# actiontype          0
# ismydoc             0
# ext                 0
# sessionid           0
# documentposition    0
# datetime            0
# screen              0
# dtype: int64

실습 파일 확인하기