데이터 분석(Data Analysis)/쉽게 배우는 파이썬 데이터 분석 14

[둘째마당_본격실습! 데이터 갖고 놀기] 05 데이터 분석 기초! - 데이터파악하기, 다루기 쉽게 수정하기

분석할 데이터를 확보하면 가장 먼저 데이터의 특징을 파악하고 다루기 쉽게 변형하는 작업을 해야 함.이 장에서는 데이터를 다루는 기초적인 방법을 익힘.05-1 데이터 파악하기데이터가 주어졌을 때 가장 먼저 하는 일은 데이터의 전반적인 구조를 파악하는 것임.어떤 변수들이 있는지, 몇 행으로 구성되는 지 구조를 살펴보면서 데이터의 특징이 어떠한지 감을 잡음.이 과정에서 분석 방향의 힌트를 얻게 됨. 데이터를 파악할 때 사용하는 명령어데이터를 파악할 때는 기본적으로 다음 여섯 가지 명령어를 사용함.함수기능head()앞부분 출력tail()뒷부분 출력shape행, 열 개수 출력info()변수 속성 출력describe()요약 통계량 출력4장에서 사용한 exam.csv파일을 활용해 데이터를 파악하는 방법을 알아보겠음...

[둘째마당_본격실습! 데이터 갖고 놀기] 04 데이터 프레임의 세계로

이 장에서는 가장 많이 사용하는 데이터 형태인 ‘데이터 프레임’을 살펴봄. 데이터 프레임을 만들고, 저장하고, 외부에서 생성된 데이터를 불러와 데이터 프레임으로 변환하는 방법을 익혀 보겠음.04-1 데이터 프레임 이해하기 – 데이터는 어떻게 생겼나?데이터 프레임(data frame)은 데이터를 다룰 때 가장 많이 사용하는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표처럼 생겼음. 어떤 기업에서 연봉에 영향을 미치는 요인을 파악하기 위해 직원을 대상으로 조사했다고 가정해 보겠음. 조사 결과를 다음처럼 표로 정리했음이 표는 열 4개와 행 3개로 구성된 데이터 프레임임. 열은 성별, 연령, 학점, 연봉의 4가지 속성으로 되어 있음. 행은 3개이므로 3명의 정보가 정보를 담고 있음. 이 표는 ‘4개으이 속..

[첫째마당_파이썬이랑 친해지기] 03 데이터 분석에 필요한 연장 챙기기

03-1 변하는 수, ‘변수’ 이해하기변수상수소득성별학점국적1,000만 원남자3.8대한민국2,000만 원남자4.2대한민국3,000만 원여자2.6대한민국4,000만 원여자4.5대한민국 변수는 ‘변하는 수’다변수 : 다양한 값을 지닌 하나의 속성데이터: 변수들의 덩어리 변수는 데이터 분석의 대상데이터 분석: 변수간에 어떤 관계가 있는지 파악하는 작업데이터를 이용하면 성별에 따라 소득과 학점에 차이가 있는지, 학점과 소득은 어떤 관계가 있는지 분석할 수 있음 상수는 분석할 게 없다상수: 하나의 값으로만 되어 있는 속성ex) 국적은 다른 속성과 달리 ‘대한민국’이라는 고정된 값을 지님상수는 변수와 달리 분석 대상이 될 수 없음(이 데이터는 모든 사람의 국적이 같으므로 국적에 따른 소득 차이나 남녀 비율을 분석할..

[첫째마당_파이썬이랑 친해지기] 01 안녕, 파이썬?

01-1 데이터 분석과 파이썬 데이터 분석 분야에서 인기 있는 파이썬 파이썬은 데이터를 분석하는데 많이 사용되는 프로그래밍 언어기업. 학계, 언론 등 다양한 분야의 데이터 분석가들이 파이썬을 사용하고 있고, 이제 막 데이터 분석 공부를 시작한 입문자들도 파이썬을 익히고 있음파이썬은 수많은 데이터 분석 도구들 사이에서 큰 인기를 끌고 있으며 점유율도 계속 늘고 있음 파이썬은 어디에 쓰나요?많은 사람이 파이썬을 사용하는 가장 큰 이유는 파이썬으로 할 수 있는 일이 매우 다양하기 때문파이썬은 범용 도구이기 때문에 파이썬 하나만 잘 다뤄도 어떤 형태의 데이터든 자유롭게 분석할 수 있음 통계 분석데이터의 특징을 살펴보는 기초 통계 분석부터 가설 검증을 하는데 사용하는 고급 통계 분석 기법에 이르기까지 다양한 통계..