데이터 분석(Data Analysis)/쉽게 배우는 파이썬 데이터 분석

[넷째마당_다양한 데이터 분석의 세계] 13 마크다운으로 데이터 분석 보고서 만들기

Kim MyeongOk 2023. 12. 31. 16:54

넷째마당_13_마크다운으로데이터분석보고서만들기__쉽게배우는파이썬데이터분석.hwp
0.85MB

마크다운을 이용해 코드, 설명 글, 그래프가 잘 어우러진 데이터 분석 보고서를 만드는 방법을 알아봄.


13-1 신뢰할 수 있는 데이터 분석 보고서 만들기

데이터 분석 결과를 잘 전달하려면 코드와 결과물이 설명 글과 함께 어우러진 데이터 분석 보고서를 작성해야 함. 그래야만 독자가 분석 과정을 명확히 이해할 수 있고, 보고서의 코드를 직접 실행하면서 똑같은 결과가 출력되는지 확인하거나 자신의 분석 작업에 활용할 수 있음.

마크다운(markdown)을 활용하면 데이터를 분석하는 전 과정을 담은 보고서를 쉽게 만들 수 있음. HTML, 워드, PDF 등 다양한 포맷으로 저장할 수 있어서 문서 작성 소프트웨어를 따로 사용하지 않고도 훌륭한 데이터 분석 보고서를 만들 수 있음. 이 책도 마크다운을 이용해 만들었음.

신뢰받은 데이터 분석 보고서를 만들려면 똑같은 분석 과정을 거쳤을 때 똑같은 분석 결과가 반복되어 나오도록 재현성(reproducibility)을 갖춰야 함. 마크다운을 이용하면 분석 과정과 결과를 자세하게 기술할 수 있어서 재현성을 갖춘 데이터 분석 보고서를 만들 수 있음.


13-2 마크다운 문서 만들기

 

[Do it! 실습] 마크다운 문서 만들기

마크다운 문서를 만들려면 노트북의 셀 타입을 마크다운으로 변경하면 됨.

tip) 커맨드 모드에서 [M]을 누르면 셀이 마크다운 타입으로 바뀌고, [Y]를 누르면 코드 타입으로 바뀜.

 

마크다운 셀에는 마크다운 문법으로 문자를 입력할 수 있음. [Shift] + [Enter]로 셀을 실행하면 글자 양식이 적용되어 보기 좋게 바뀜.

마크다운 셀 입력 화면

 

[Do it! 실습] 마크다운 문법 이용하기

마크다운 문법은 문자 앞뒤에 특수 문자를 넣어 문자 양식을 정함.

- *은 기울임체, **은 강조체, ~~은 취소선을 만듦.

- #을 넣으면 제목을 만들고, # 개수에 따라 레벨이 결정됨.

- [HTML](http://ko.wikipedia.org/wiki/HTML)처럼 대괄호와 괄호를 이용해 하이퍼 링크를 삽입함.

- 문장 안에 코드를 입력할 때 코드 앞뒤에 백틱(backtick) 기호 `를 입력하면 음영을 넣음. 백틱 기호는 [Esc] 아래에 있는 키를 누르면 입력됨.

마크다운 셀에 문자를 입력하는 장면
마크다운 셀을 실행한 결과

 

[Do it! 실습] 마크다운으로 데이터 분석 보고서 만들기

마크다운을 이용해 간단한 데이터 분석 보고서를 만들어 보겠음. 다음 내용을 노트북의 셀에 입력해 보자. 첫 번째 셀은 마크다운 타입, 두 번째와 세 번째 셀은 코드 타입으로 설정해야 함.

import pandas as pd
df = pd.read_csv('mpg.csv')
df['drv'].value_counts()
import seaborn as sns
sns.countplot(data = df, x = 'drv')

 

셀을 실행하면 다음과 같이 보기 좋은 분석 보고서가 만들어짐.

 

[Do it! 실습] 문서 파일로 저장하기

노트북으로 작성한 데이터 분석 보고서를 문서 파일로 저장하면 파이썬과 JupyterLab이 설치되어 있지 않은 곳에서도 보고서를 열어볼 수 있음.

 

HTML 파일 만들기

[File Download As HTML]을 클릭하면 노트북을 HTML 파일로 저장함. HTML 파일은 크롬과 같은 웹 브라우저에서 열어볼 수 있음.

크롬에서 실행한 HTML 파일

 

PDF 파일 만들기

[File Print Preview [ctlr] + P '대상''PDF로 저장' 저장]을 클릭하면 노트북을 PDF 파일로 저장함.

 

워드 파일 만들기

1. pandoc.org/installing.html에서 pandoc 설치 파일을 다운로드 받아 설치함. 설치를 완료하면 JupyterLab을 재실행함. pandoc은 마크다운 문법으로 작성한 문서를 다양한 문서 파일 포맷으로 변환하는 소프트웨어임.

2. JupyterLab을 재실행한 다음 새 노트북에서 다음 명령어를 실행하면 노트북 파일을 워드 파일로 변환함. 변환한 워드 파일은 워킹 디렉터리에 만들어짐. 명령어에서 report.ipynb는 노트북 파일이고, report.docx는 저장할 워드 파일 이름임.

!pandoc report.ipynb -s -o report.docx

tip) 명령어 앞에 !를 불이면 프롬프트에서 명령어를 실행함.

 

{알아 두면 좋아요} 마크다운 활용하기

마크다운 목차

! pip install jupyter_contrib_nbextensions
! jupyter contrib nbextension install --user
 
#을 넣어 제목을 만든 다음 JupyterLab 사이브바에 있는
(Table of Contents)아이콘을 클릭하면 목차가 만들어짐.
목차를 클릭하면 노트북에서 제목이 있는 셀로 바로 이동함. 노트북을 작성할 때 중간중간 #을 이용해 제목을 만들어보자.
문서가 길더라도 헤매지 않고 원하는 위치로 빠르게 이동할 수 있어 편리함.

 

마크다운 치트 시트

마크다운 문법에 익숙해지면 데이터 분석 보고서를 보기 좋게 만들 수 있음. 치트 시트를 참고해 다양한 마크다운 문법을 익혀보자.

- Markdown Cheat Sheet: bit.ly/easypy_131

 

 

 

 

- 13장 END -