데이터분석4 [데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 2. 데이터 전처리 이전 글[데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 0. 분석 계기[데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 1. 데이터 수집ASN_Safety_Database.csvcrawler_asn_data.py 로 수집한 항공 사고 요약 데이터이다.데이터는 사고 날짜(acc. date), 기종(type), 항공편명(reg.), 항공사(operator), 사망자 수(fat), 사고 위치(location), 데미지(dmg) 컬럼이 있다. 우선 필드명에 기호 '.'와 공백이 들어가므로 변경하면 좋을거같다.그리고 type은 제조사 + 기종인거같은데 이거도 분리하면 분석에 더 용아할 것이다.location 필드에 '횜stan책' 이런 이상한 값이 있는데, 국가 기호 때문인 것 같다. 이거.. 2024. 12. 30. [데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 1. 데이터 수집 이전 글[데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 0. 분석 계기 다음 글[데이터 분석] 정말 비행기가 가장 안전한 교통 수단일까? 2. 데이터 전처리 1. 크롤러 Aviation Safty Network 에서 데이터를 크롤링하는 프로그램을 만들었다. Github 링크우선 주기능만 되도록 구현했다. README, 주석, 로깅, 예외처리는 제대로 안됐지만 기능은 잘 수행한다. 구성 파일은 crawler_asn_data.py와 crawler_asn_data_detail.py 가 있다. 1) crawler_asn_data.py (1) 설명 crawler_asn_data.py : 간략한 사고 리스트 데이터베이스를 크롤링하는 코드이다. 아래 사진은 크롤링할 페이지 캡쳐 화면이다.데이터는 사고 .. 2024. 12. 30. [ADP 실기 준비] 코로나19 - 인구대비 상위 5개국 구하기 + 시각화 In [1]: import pandas as pd import numpy as np import seaborn as sns import matplotlib as mpl import matplotlib.pyplot as plt from scipy import stats %matplotlib inline #그래프 격자로 숫자 범위 눈에 잘 띄도록 ggplot 스타일 적용 plt.style.use('ggplot') #마이너스 폰트 문자 깨짐 해결 mpl.rcParams['axes.unicode_minus'] = False #경고 숨기기 import warnings warnings.filterwarnings('ignore') #style.use('fivethirtyeight') sns.set(style='whi.. 2020. 8. 24. Jupyter Notebook 시작 디렉토리 변경 Jupyter Notebook 시작 디렉토리 변경하기 1. 1-1. 시작(윈도우버튼) -> jupyter notebook 검색 -> 오른쪽마우스 클릭 -> 파일 위치 열기 1-2. jupyter notebook 아이콘에 커서 갖다대고 오른쪽 마우스 클릭 후 아래 2가지 수정 대상(T)에 맨뒤 "%USERPROFILE%/" 제거 시작위치(S) 에 원하는 디렉토리 입력 2. 2-1. cmd창(anaconda의 경우 anaconda prompt) -> jupyter notebook --generate-config 위의 명령어 입력 -> y 입력, Enter 2-2. C:\Users\USERNAME\.jupyter 로 이동 -> jupjupyter_notebook_config.py 워크패드, 메모장 등으로 열기.. 2020. 8. 24. 이전 1 다음