머신러닝 - 결정 트리
·
AI/Machine Learning
머신러닝 분야를 가장 앞서가고 있는 앙상블이라는 기법인데 이는 여러 모델한테 물어봐서 좋은 결과를 나타내는 기법입니다.이때 앙상블에 사용될 수 있는 가장 좋은 모델 중 하나가 Decision Trees입니다. 결정 트리는 다음과 같은 특징들이 있습니다.(현재) 가장 강력한 ML 알고리즘 중 하나분류, 회귀, 다중 출력 작업 등 많은 분야에서 활용되는 다재다능한 알고리즘매우 복잡한 데이터셋도 학습 가능랜덤 포레스트의 리본 구성 요소: Decision Trees가 엄청나게 많이 있는 앙상블 모델이 랜덤 포레스트(random forest)알고리즘이 매우 직관적이고 결정 방식을 이해하기 쉽습니다.직관적인 이유는 위에 그림을 보고 이해할 수 있습니다. 테니스를 치고 싶을 상황일 경우 결정하기 위한 조건을 트리로 ..
머신러닝 - 서포트 백터 머신
·
AI/Machine Learning
서포트 벡터 머신(SVM)은 매우 강력하고 선형이나 비선형 분류, 회귀, 이상치 탐색에도 사용할 수 있는 다목적 머신러닝 모델으로 머신러닝에서 가장 인기 있는 모델이기도 합니다. SVM은 특히 복잡한 분류 문제에 잘 들어맞으며 작거나 중간 크기의 데이터셋에 적합합니다. 서포트 벡터 머신 = 라지 마진 분류SVM의 기본 아이디어는 붓꽃 데이터셋으로 설명할 수 있습니다. 아래는 꽃의 종류인 Iris versicolor와 Iris setosa의 너비가 있습니다.  왼쪽에서 점선은 분류를 잘 못하고 나머지 2개는 완벽해보이지만 결정 경계가 샘플에 너무 가까워 새로운 샘플에는 잘 작동하지 못 할 것 입니다. 반면 오른쪽의 경우 2 직선은 두 개의 클래스를 잘 나누고 있을 뿐만 아니라 제일 가까운 훈련 샘플로부터 ..
머신러닝 - 모델 훈련, 선형회귀, 경사하강법
·
AI/Machine Learning
특정 값을 예측하기 위해서는 모델을 훈련시켜야 합니다 모델 훈련먼저 가장 간단한 모델 중 하나인 선형 회귀부터 시작합니다. 선형 회귀를 훈련시키는 2가지 방법이 있습니다.선형회귀란?한 개의 독립 변수와 한 개의 종속 변수 간의 관계를 나타내며, 그 관계는 직선으로 표현됩니다. 선형 회귀 훈련 방법1. 직접 계산할 수 있는 공식을 사용하여 훈련셋에 가장 잘 맞는 모델 파라미터(즉, 훈련셋에 대해 비용 함수를 최소화하는 모델 파라미터)를 구합니다2. 경사 하강법(GD)이라 불리는 반복적인 최적화 방식을 사용하여 모델 파라미터를 조금씩 바꾸면서 비용함수(RMSE)를 훈련셋에 대해 최소화시킵니다.   - RMSE(X, h)는 가설 h를 예제들에 적용해 측정한 비용 함수 -> 즉 모델 파라미터를 조절하면서 RMS..
머신러닝 - 로지스틱 회귀
·
AI/Machine Learning
머신러닝에서 로지스틱 회귀란 샘플이 특정 클래스에 속할 확률을 추정하는 데 널리 사용됩니다  이진 분류기는 추정 확률이 50%가 넘으면 모델은 해당 샘플을 True 50%를 넘지 못하면 False 로 만듭니다. 로지스틱 회귀을 사용하는 목적로지스틱 회귀의 주된 목적은 이진 분류입니다. 예를들어 이메일이 스팸인지 아닌지, 환자가 특정 질병에 걸릴 확률이 있는지 등을 예측할 수 있습니다. 이때 알 수 있는 것은 로지스틱 회귀는 회귀 알고리즘이만 분류에서도 회귀 알고리즘을 사용할 수 있다는 것을 알 수 있습니다.로지스틱 함수란로지스틱 회귀는 로지스틱 함수(또는 시그모이드 함수)를 사용하여 입력값을 0과 1 사이의 확률로 변환합니다. 다음은 t의 값에 따라서 데이터가 해당 클래스에 속할 확률을 나타내는 그래프입..
사이킷런 scikit-learn 이란?
·
AI/Machine Learning
scikit-learn 은 머신러닝에서 사용되는 패키지입니다 사이킷런(Scikit-learn)은 파이썬으로 작성된 머신러닝 라이브러리로, 데이터 마이닝과 데이터 분석을 위한 다양한 도구들을 제공합니다. Scikit-learn은 다양한 알고리즘과 도구를 제공하여 데이터 전처리, 모델 구축, 평가, 선택 등의 과정을 효율적으로 수행할 수 있게 해줍니다. 주요 특징 및 장점 광범위한 알고리즘   - 분류(Classification): SVM, k-NN, 랜덤 포레스트, 로지스틱 회귀, 나이브 베이즈 등 다양한 분류 알고리즘을 제공합니다.   - 회귀(Regression): 선형 회귀, 리지 회귀, 라쏘 회귀, 결정 트리 등 다양한 회귀 알고리즘을 지원합니다.   - 클러스터링(Clustering): K-평균,..
여러 개의 레이블을 갖는 하나의 데이터 분류하기 - 다중 레이블 분류
·
AI/Machine Learning
다중 레이블 분류 (Multi-label Classification)다중 레이블 분류는 하나의 입력 데이터에 대해 여러 개의 클래스를 동시에 할당할 수 있는 문제를 말합니다. 예를 들어, 하나의 영화가 여러 장르(예: 액션, 드라마, 코미디)로 분류될 수 있습니다. 여기서는 각 데이터가 여러 클래스에 동시에 속할 수 있습니다. 예시 1데이터: 영화 장르 정보 등클래스: 액션, 드라마, 코미디, 로맨스, SF설명: 하나의 영화가 주어졌을 때 이 영화가 액션, 드라마, 코미디, 로맨스, SF 중 어떤 장르들에 해당하는지를 동시에 분류하는 것         예를들어, 하나의 영화가 액션이면서 코미디일 수 있습니다.예시 2데이터: 한명 이상의 얼굴들을 포함한 사진클래스: 얼굴1, 얼굴2, 얼굴3 •••설명: 사..
ytw_developer
'AI/Machine Learning' 카테고리의 글 목록