마크다운을 이용해 코드, 설명 글, 그래프가 잘 어우러진 데이터 분석 보고서를 만드는 방법을 알아봄.
13-1 신뢰할 수 있는 데이터 분석 보고서 만들기
데이터 분석 결과를 잘 전달하려면 코드와 결과물이 설명 글과 함께 어우러진 데이터 분석 보고서를 작성해야 함. 그래야만 독자가 분석 과정을 명확히 이해할 수 있고, 보고서의 코드를 직접 실행하면서 똑같은 결과가 출력되는지 확인하거나 자신의 분석 작업에 활용할 수 있음.
마크다운(markdown)을 활용하면 데이터를 분석하는 전 과정을 담은 보고서를 쉽게 만들 수 있음. HTML, 워드, PDF 등 다양한 포맷으로 저장할 수 있어서 문서 작성 소프트웨어를 따로 사용하지 않고도 훌륭한 데이터 분석 보고서를 만들 수 있음. 이 책도 마크다운을 이용해 만들었음.
신뢰받은 데이터 분석 보고서를 만들려면 똑같은 분석 과정을 거쳤을 때 똑같은 분석 결과가 반복되어 나오도록 재현성(reproducibility)을 갖춰야 함. 마크다운을 이용하면 분석 과정과 결과를 자세하게 기술할 수 있어서 재현성을 갖춘 데이터 분석 보고서를 만들 수 있음.
13-2 마크다운 문서 만들기
[Do it! 실습] 마크다운 문서 만들기
마크다운 문서를 만들려면 노트북의 셀 타입을 마크다운으로 변경하면 됨.
tip) 커맨드 모드에서 [M]을 누르면 셀이 마크다운 타입으로 바뀌고, [Y]를 누르면 코드 타입으로 바뀜.
마크다운 셀에는 마크다운 문법으로 문자를 입력할 수 있음. [Shift] + [Enter]로 셀을 실행하면 글자 양식이 적용되어 보기 좋게 바뀜.
[Do it! 실습] 마크다운 문법 이용하기
마크다운 문법은 문자 앞뒤에 특수 문자를 넣어 문자 양식을 정함.
- *은 기울임체, **은 강조체, ~~은 취소선을 만듦.
- #을 넣으면 제목을 만들고, # 개수에 따라 레벨이 결정됨.
- [HTML](http://ko.wikipedia.org/wiki/HTML)처럼 대괄호와 괄호를 이용해 하이퍼 링크를 삽입함.
- 문장 안에 코드를 입력할 때 코드 앞뒤에 백틱(backtick) 기호 `를 입력하면 음영을 넣음. 백틱 기호는 [Esc] 아래에 있는 키를 누르면 입력됨.
[Do it! 실습] 마크다운으로 데이터 분석 보고서 만들기
마크다운을 이용해 간단한 데이터 분석 보고서를 만들어 보겠음. 다음 내용을 노트북의 셀에 입력해 보자. 첫 번째 셀은 마크다운 타입, 두 번째와 세 번째 셀은 코드 타입으로 설정해야 함.
import pandas as pd
df = pd.read_csv('mpg.csv')
df['drv'].value_counts()
import seaborn as sns
sns.countplot(data = df, x = 'drv')
셀을 실행하면 다음과 같이 보기 좋은 분석 보고서가 만들어짐.
[Do it! 실습] 문서 파일로 저장하기
노트북으로 작성한 데이터 분석 보고서를 문서 파일로 저장하면 파이썬과 JupyterLab이 설치되어 있지 않은 곳에서도 보고서를 열어볼 수 있음.
HTML 파일 만들기
[File → Download As → HTML]을 클릭하면 노트북을 HTML 파일로 저장함. HTML 파일은 크롬과 같은 웹 브라우저에서 열어볼 수 있음.
PDF 파일 만들기
[File → Print Preview → [ctlr] + P → '대상'을 'PDF로 저장' → 저장]을 클릭하면 노트북을 PDF 파일로 저장함.
워드 파일 만들기
1. pandoc.org/installing.html에서 pandoc 설치 파일을 다운로드 받아 설치함. 설치를 완료하면 JupyterLab을 재실행함. pandoc은 마크다운 문법으로 작성한 문서를 다양한 문서 파일 포맷으로 변환하는 소프트웨어임.
2. JupyterLab을 재실행한 다음 새 노트북에서 다음 명령어를 실행하면 노트북 파일을 워드 파일로 변환함. 변환한 워드 파일은 워킹 디렉터리에 만들어짐. 명령어에서 report.ipynb는 노트북 파일이고, report.docx는 저장할 워드 파일 이름임.
!pandoc report.ipynb -s -o report.docx
tip) 명령어 앞에 !를 불이면 프롬프트에서 명령어를 실행함.
{알아 두면 좋아요} 마크다운 활용하기
마크다운 목차
! pip install jupyter_contrib_nbextensions
! jupyter contrib nbextension install --user
![]() |
![]() |
#을 넣어 제목을 만든 다음 JupyterLab 사이브바에 있는 | ![]() |
(Table of Contents)아이콘을 클릭하면 목차가 만들어짐. |
목차를 클릭하면 노트북에서 제목이 있는 셀로 바로 이동함. 노트북을 작성할 때 중간중간 #을 이용해 제목을 만들어보자. | ||
문서가 길더라도 헤매지 않고 원하는 위치로 빠르게 이동할 수 있어 편리함. |
마크다운 치트 시트
마크다운 문법에 익숙해지면 데이터 분석 보고서를 보기 좋게 만들 수 있음. 치트 시트를 참고해 다양한 마크다운 문법을 익혀보자.
- Markdown Cheat Sheet: bit.ly/easypy_131
- 13장 END -
'데이터 분석(Data Analysis) > 쉽게 배우는 파이썬 데이터 분석' 카테고리의 다른 글
[다섯째마당_데이터 과학의 세계] 15 머신러닝을 이용한 예측 분석 (0) | 2024.01.09 |
---|---|
[다섯째마당_데이터 과학의 세계] 14 통계 분석 기법을 이용한 가설 검정 (0) | 2024.01.01 |
[넷째마당_다양한 데이터 분석의 세계] 12 인터랙티브 그래프 (0) | 2023.12.31 |
[넷째마당_다양한 데이터 분석의 세계] 11 지도 시각화 (0) | 2023.12.31 |
[넷째마당_다양한 데이터 분석의 세계] 10 텍스트 마이닝 (0) | 2023.12.30 |