목록data (5)
WinGyu_coder
저번 1장에서 데이터를 가져왔는데 이제 EDA과정을 거칠때 사용하는 Pandas 판다스 라이브러리 일부 명령어를 설명하겠습니다. (EDA는 데이터 분석을 하기전 시각화 및 데이터 형태를 알아보는 것이라고 생각하면 편합니다. 추후에 정의할 예정) import pandas as pd test = pd.read_csv('/content/drive/MyDrive/데이터분석/titanic/test.csv') train = pd.read_csv('/content/drive/MyDrive/데이터분석/titanic/train.csv') 저번 시간에 Pandas을 사용해서 csv파일을 가져왔습니다. 이걸 간단하게 형태를 확인해 보도록 하죠. 1. head() train.head() head()는..
#ChatGPT가 작성하였습니다. np.array와 Python의 기본 리스트(list)는 데이터를 저장하고 처리하는 방식에 여러 차이점이 있습니다. 주요 차이점은 다음과 같습니다: 효율성: np.array: Numpy 배열은 고정된 타입의 데이터를 저장할 수 있어 메모리 사용이 효율적이며, 내부적으로 C로 구현된 연산들로 인해 계산이 빠릅니다. list: Python 리스트는 다양한 타입의 객체를 저장할 수 있지만, 이로 인해 메모리 사용이 덜 효율적이며 일반적인 연산에서 Numpy 배열보다 느릴 수 있습니다. 데이터 타입: np.array: 하나의 Numpy 배열은 동일한 데이터 타입만을 포함할 수 있습니다. list: Python 리스트는 다양한 데이터 타입의 원소를 동시에 포함할 수 있습니다. 연..
기본 html 코드 Hello 우선 변수를 지정할때 이런 형태로 합니다. const name = "WINGYU"; const age = 23; const height = 187.5; 하지만 체계적이지 않고 가독성이 떨어집니다. 양이 많아지면 많아질수록 정리해야할게 많아질것입니다. 그럴때 배열 array [] 을 사용합니다. const player1 = ["WINGYU", 23, 187.5]; 짜잔 훨씬 깔끔해졌습니다. 리스트 []를 통해 데이터를 가져올수있습니다. const player1 = ["WINGYU", 23, 187.5]; console.log(player1[0]); console.log(player1[1]); console.log(player1[2]); 배열을 통해 훨씬 편리하게 데이터를 가져..
#python을 사용했습니다. 시본 사이트 :https://seaborn.pydata.org/index.html seaborn: statistical data visualization — seaborn 0.12.1 documentation seaborn: statistical data visualization seaborn.pydata.org seaborn 사이트 각종 문서 및 예제, 데이터 분석, api등 열람 가능 seaborn 이란? Statistical Data Visualization library based on matplotlib. matplotlib 기반의 통계 데이터 시각화 라이브러리. 1. 파이썬 오픈소스 라이브러리 중에 가장 널리 사용되는 시각화 라이브러리입니다. 2. 2002년부터 ..
참고 문헌 : IT CookBook, 데이터 과학 기반의 파이썬 빅데이터 분석(이지영), 네이버api 문서 소스코드는 참고 문헌을 통해 가져왔습니다. Python 파이썬으로 api 로 네이버 기사 크롤링 Crawling하는 법을 배워보겠습니다. Python 파이썬을 통해 네이버 뉴스 기사 정보를 가져올 수 있습니다. 받은 정보로 데이터 분석을 통해 머신러닝까지 진행 해보겠습니다. 1. 네이버 개발자센터 들어가고 오픈API 권한 신청 우선 네이버 아이디가 필요합니다. 네이버 개발자센터를 검색하고 들어갑니다. 링크 올려두겠습니다. https://developers.naver.com/main/ NAVER Developers 네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API..