본문 바로가기

PYTHON30

20200327 - 파이썬 머신러닝(얼굴 자동 모자이크, 당뇨병 예측, 분류 평가) 참고용 사이트 www.kdata.or.kr www.dbguide.net - 교육과정(기초교육) - 데이터 수집, 인공신경만 딥러닝, R을 이용한 통계분석 kmooc.kr udacity.com https://www.edx.org/ coursera.org 미국 석사 학위 취득 방법 : 학비 약 1,000만원(2년) https://www.cc.gatech.edu/future/masters/mscs/program 유튜브 : 성김 얼굴인식 오픈소스 https://github.com/opencv/opencv/tree/master/data/haarcascades 분류 평가 정확도만으로 불균형한 레이블 데이터 세트에서 평가지표로 사용하기에는 부적합 정확도가 가지는 분류 평가 지표로의 한계점을 극복하기 위해 여러 가지 .. 2020. 3. 27.
20200326 - 파이썬 머신러닝 - 타이타닉 생존자 예측 오른쪽 정렬오른쪽 정렬왼쪽 정렬왼쪽 정렬가운데 정렬가운데 정렬 삭제삭제 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 import pandas as pd import numpy as np pd.set_option('display.max_columns', 15) titanic_df=pd.read_csv('titanic3.csv') from sklearn.preprocessing import LabelEncoder # Null 처리 함수 def fillna(df): df['age'].fillna(df['age'].mean(), inplace=True) df['cabin'].fillna('N', inplace=True) df['fare'].fillna(.. 2020. 3. 26.
20200325 - 2 파이썬 통계기반 데이터 분석 지도학습(Supervised Learning) : 정답을 알려주며 학습하는 것. 고양이 사진을 주고(input data), 이 사진은 고양이(정답지 - label data)야. 사자 사진을 주고, 이 사진은 사자야. 라고 알려주는 학습 방식 회귀 : 어떤 데이터들의 특징(feature)을 토대로 값을 예측 분류 : 이진 분류, 다중 분류 K-최근접 이웃(k-Nearest Neigbors) 선형회귀(Linear Regression) 로지스틱 회귀(Logistic Regression) 서포트 벡터 머신(SVM, Support Vector Machine) 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest) 신경망 (Neural Network) 비지도학습(Unsupervised Le.. 2020. 3. 25.
20200325-1 파이썬 머신러닝 (CT 촬영(폐) 원하는 부분 추출) import numpy as np # 행렬연산 패키지 import matplotlib.pyplot as plt # 그래프 패키지 #딥러닝을 위한 keras 라이브러리 from keras.layers import Input, Activation, Conv2D, Flatten, Dense, MaxPooling2D,\ Dropout, Add, LeakyReLU, UpSampling2D from keras.models import Model, load_model from keras.callbacks import ReduceLROnPlateau Using TensorFlow backend. Load Dataset In [2]: # .npy 파일을 load 한다. x_train = np.load('dataset/x.. 2020. 3. 25.
20200324 - 파이썬 빅데이터 시각화 판다스 내장 그래프 도구 판다스는 Matplotlib 라이브러리의 기능을 일부 내장하고 있어서 별도로 import하지 않고 간단히 그래프를 그릴 수 있음. 선 그래프 : plot()메소드 적용 시 다른 옵션을 추가하지 않으며 가장 기본적인 선 그래프를 그림. 막대 그래프 : plot(kind='bar') 히스토그램 : plot(kind='hist') 산점도 : plot(x='', y='', kind='scatter'), 상관관계를 볼 수 있음. 박스플롯 : plot(kind='box'), 특정 변수의 데이터 분포와 분산 정도에 대한 정보를 제공 남북한 발전 전력량 Q.남한, 북한 발전량 합계 데이터만 추출, df_ns 이름으로 저장 및 출력하세요 (단, 행인덱스는 South, North로 열인덱스는 정수.. 2020. 3. 24.
20200323 - 파이썬 탐색적 데이터 분석 - 전처리, 그룹 연산 데이터프레임 병합 merge()함수는 sql의 join 명령과 비슷한 방식으로 어떤 기준에 의해 두 데이터프레임을 병합 하는 개념 기준이 되는 열이나 인덱스를 키라고 부름 키가 되는 열이나 인덱스는 반드시 양쪽 데이터프레임에 모두 존재함 In [12]: 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 import pandas as pd df1 = pd.read_excel('stock price.xlsx') df2 = pd.read_excel('stock valuation.xlsx') display(df1) display(df2) # eps : 주당 순이익 # per : 주가 수익비율로 주가를 주당 순이익(eps)으로 나눈 것 # bps : 기업의 현.. 2020. 3. 23.
20200321 - 파이썬(미래 예측 머신러닝 모델(삼성전자, 이더리움)) 이더리움 가격 예측 모델 과거데이터를이용해서 과거데이터를 예측하고 실제 과거 데이터로 검증해보는 방식¶ 모듈 import In [1]: 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 import pandas as pd import numpy as np import matplotlib.pyplot as plt from keras.models import Sequential from keras.layers import LSTM, Dropout, Dense, Activation # LSTM (Long Short Term Memory) 모델 사용 # 인공지능 모델 : 이전 데이터를 이용하여 이후 데이터를 예측하는 인공지능 모델 # from keras.ca.. 2020. 3. 21.
20200320 - 파이썬(타이타닉 생존자 예측 데이터 전처리) 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 import pandas as pd titanic_df = pd.read_csv('train_df.csv') 셀 병합 행 분할 열 분할 너비 맞춤 삭제 In [2]: 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 titanic_df.drop(['PassengerId', 'Name', 'Ticket'], axis=1, inplace=True) print(titanic_df.columns.values) # 컬럼 보기 : 1번 방법 print(titanic_df.columns) # 컬럼 보기 : 2번 방법 셀 병합 행 분할 열 분할 너비 맞춤 삭제 [.. 2020. 3. 20.
20200319 - 파이썬 (사이킷런, 판다스, 넘파이, 행렬, 희소행렬, 정규화, 표준화, 범주화) 데이터 전처리 누락 데이터 처리 중복 데이터 처리 데이터 표준화 범주형 데이터 처리 정규화 시계열 데이터 누락 데이터 처리 In [1]: 셀 전체 선택 0열 선택0열 다음에 열 추가 0행 선택0행 다음에 행 추가 열 너비 조절 행 높이 조절 import seaborn as sns # seaborn 은 그래프화 해주는 라이브러리. 얘가 dataset을 제공을 해준다. #titanic 데이터셋 가져오기 titanic_df = sns.load_dataset('titanic') display(titanic_df.head(3)) print(titanic_df.shape) # 891행, 15열 display(titanic_df.isnull().sum()) # null이 각각 몇개인지 display(titanic_d.. 2020. 3. 19.
728x90
반응형