전체 글

안녕하세요! 방문해주셔서 감사합니다!
딥러닝

NVIDIA GPU Setup (For Tensorflow)

Visual Studio 설치 .NET 데스크탑 개발 및 C++를 사용한 데스크탑 개발 설치하기 CUDA 설치 https://developer.nvidia.com/cuda-downloads Windows > x86_64 > 10 > exe(local) 선택 (링크) 빠른 설치로 설치하기 CuDNN 설치 https://developer.nvidia.com/rdp/cudnn-download NVIDIA 계정 가입 및 로그인 필요 zip 파일 다운받은 후, 적절한 경로에 압축해제하기 zlibwapi.dll 설정 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows 위의 사이트에서 Windows 사용자를 위..

머신러닝

딥러닝 개념 정리

딥러닝 다층이 아니라 심층을 의미함 모델은 학습된 파라미터의 집합이라고 할 수 있음 MLP (Multi Layer Perceptron) sklearn의 neural_network 층이 3개만 있음(input, hidden, output) 오차역전파 목적 : 수치미분을 수행하지 않고, 학습에 필요한 편미분값을 획득 원리 체인룰(연쇄법칙) : 합성 함수의 미분은 합성 함수를 구성하는 개별 함수 미분의 곱으로 처리 역전파 : 파라미터 업데이트를 위해 출력층의 오차값을 은닉층으로 전파 DNN 딥러닝 모델링 이슈 Vanishing Gradient → Activation 함수 sigmoid의 미분값이 0~0.25의 범위라서, 은닉층 증가에 따라서 미분값이 0이 되는 현상 relu, tanh(hyperbolic ta..

머신러닝

Classification 코드 정리

라이브러리 불러오기 import seaborn as sns import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from datetime import datetime from sklearn.linear_model import LogisticRegression from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier, AdaBoostCl..

머신러닝

Regression 코드 정리

라이브러리 불러오기 import seaborn as sns import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_diabetes from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from datetime import datetime from sklearn.linear_model import LinearRegression from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble im..

머신러닝

머신러닝 개념 정리

용어정리 AI 사람이 만든 예측모델 머신러닝, 딥러닝 머신러닝 회귀(Regression)와 분류(Classification) Train, Test, Validation 모델링 목적 : 일반화된 모델을 만드는 것 학습에 사용되지 않은 데이터에서도 비슷한 성능 함수형 - 경사하강법 접선의 기울기 or 편미분값 선형회귀(Linear Regression) y가 숫자 단순회귀 (Simple Regression), 다항회귀 (Polynomial Regression), 다중회귀 (Mutiple Regression) 함수 및 평가는 MSE(Mean Squared Error) MSE 작으면 데이터의 분포와 특징을 설명한다 Capacity : 데이터에 대한 설명력 파라미터 업데이트 상관계수를 활용한 EDA 인코딩 - La..

머신러닝

One Hot Encoding

개념 범주형 변수를 변환할때 사용하는 인코딩 방법으로, 0 또는 1의 값을 가진 하나 이상의 새로운 특성으로 변환한다. 혈액형에 따른 분류할 때, 0~3이 아니라 (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1)의 형태로 나누는 것을 의미한다. 숫자의 크고 작음에 따른 중요도를 없애기 위하여 사용된다. 다중공선성 문제가 있어서, n개의 변수보다는 n-1개의 변수를 만드는 것이 좋다. 혈액형의 변수를 4개가 아니라 3개로 처리하여, (1, 0, 0), (0, 1, 0), (0, 0, 1), (0, 0, 0)의 형태로 나타내는 것이다. 코드 라이브러리 불러오기 import numpy as np import pandas as pd import seaborn as..

머신러닝

numpy, pandas 코드 정리

라이브러리 및 데이터 불러오기 import numpy as np import pandas as pd Numpy 데이터 불러오기 items = np.array([[20, 12.34, True, "A"], [12, 34.1, False, "B"], [43, 55.3, True, "A"], [45, 64.2, False, "C"], [23, 65.1, False, "E"], [65, 22.3, True, "A"], [9, 44.1, True, "B"], [122, 67.1, False, "C"], [567, 34.2, False, "C"]], dtype=object) items 모양 출력 items.shape 모양 변경 new_items = items.reshape((1,36)) print("shape:", ..

개발

윈도우에서 리눅스 명령어 실행하기

1. MinGW 설치하기 MinGW Installation 프로그램을 Sourceforge를 통해서 다운받은 후, 설치한다. 2. msys 설치하기 MinGW 프로그램을 실행한다. Basic Setup의 msys-base를 선택한다. msys-base 선택 후 Mark for installation을 선택한다. Installation에서 Apply Changes를 선택한다. Apply를 눌러서 설치를 진행한다. 3. 환경변수 등록하기 C:\MinGW\msys\1.0\bin 경로에 리눅스 명령어 관련 파일이 있는지 확인한다. 해당 경로를 환경변수의 Path에 등록한다. 터미널을 열어서, 리눅스 명령어가 작동하는 것을 확인한다.

개발

주피터 노트북 편의기능

1. 캐글 데이터 다운받기패키지 설치!pip3 install kagglekaggle.json 설정캐글 홈페이지 > 로그인 > 계정 아이콘 > Account 선택하기API의 Create New API Token 버튼 클릭 후 kaggle.json 다운받기C 드라이브의 사용자/{계정} 폴더 하위에 .kaggle 폴더 생성 후 kaggle.json 넣어두기예시 : C:\Users\skim\.kaggle\kaggle.json터미널에서 kaggle 명령어 입력해서 설정 확인하기# 정상 결과 C:\Users\skim>kaggle usage: kaggle [-h] [-v] {competitions,c,datasets,d,kernels,k,config} ... kaggle: error: the following arg..

개발

Firestore 데이터 사용해보기

1. Firebase의 Firestore? 1. 소개 NoSQL 문서 데이터베이스로, 편리하게 DB를 구축하고 관리할 수 있다. 데이터는 보통 collection > document > field의 구조를 취하고 있다. 데이터에 쿼리를 적용하려면, field에 ArrayUnion을 활용한 배열방식보다는 collection에 document id를 자동 생성해서 올리는 편이 좋다. 쿼리를 적용할때는 offset 보다는 start_at, start_after 등의 cursor를 활용하는 것이 리소스 관리에 유리하다. 하지만 오프셋이 포함된 쿼리를 보내면 건너뛴 문서마다 읽기 요금이 부과됩니다. 예를 들어 10개의 오프셋을 사용하는 쿼리에서 문서 1개를 반환하면 읽기 11회에 대한 요금이 부과됩니다. 이 같은..

머신러닝

Linear Regression

💡 아래의 코드는 코랩 환경에서 테스트되었습니다. 라이브러리 불러오기 코드 import numpy as np import seaborn as sns import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.preprocessing import LabelEncoder, PolynomialFeatures from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error 데이터 불러오기 코드 DF = sns.load_dataset('mpg') DF.info() 데이터 전처리 코드 # nu..

머신러닝

이미지 분류 학습진행하기

1. 이미지 불러오기 1. 이미지 수집 및 분류 하나의 폴더 하위에, 여러 개의 폴더로 나누어서 이미지를 수집 및 분류한다. 폴더 구조 (식물 학습 정도에 따른 분류) resample 0 1 2 3 2. 라이브러리 불러오기 import matplotlib.pyplot as plt import numpy as np import os import PIL import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers from tensorflow.keras.models import Sequential 3. 이미지 불러오기 import pathlib fullPath = os.path.abspath("resample")..

개발일지
devskim