목록kaggle (2)
WinGyu_coder
저번 1장에서 데이터를 가져왔는데 이제 EDA과정을 거칠때 사용하는 Pandas 판다스 라이브러리 일부 명령어를 설명하겠습니다. (EDA는 데이터 분석을 하기전 시각화 및 데이터 형태를 알아보는 것이라고 생각하면 편합니다. 추후에 정의할 예정) import pandas as pd test = pd.read_csv('/content/drive/MyDrive/데이터분석/titanic/test.csv') train = pd.read_csv('/content/drive/MyDrive/데이터분석/titanic/train.csv') 저번 시간에 Pandas을 사용해서 csv파일을 가져왔습니다. 이걸 간단하게 형태를 확인해 보도록 하죠. 1. head() train.head() head()는..
#구글 코랩을 사용해 진행하였습니다. (주피터 노트북) 최근 회사에서 AI 분야 업무를 많이 진행하다 보니 데이터 분석부터 머신러닝, 딥러닝까지 배워보고 싶었다. 그중 데이터 전문가의 놀이터라 불리는 Kaggle 캐글에서 기초공부할때 많이 쓰이는 타이타닉 데이터셋 분석하기를 진행해볼려고 한다. 1장에서는 필요한 데이터 준비 및 모듈에 대해 간단히 알아볼것이다. 우선 타이타닉 데이터를 캐글에서 가져온다 . 1. 데이터 준비 https://www.kaggle.com/ Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and re..