머신러닝 분류 (숫자 예측)
·
AI/Machine Learning
머신러닝에서 분류는 특정 값이 O인지 X인지를 예측하는 것입니다 MNIST 데이터베이스MNIST 데이터베이스는 분류에 있어서 기본적인 데이터셋입니다.MNIST 데이터셋은 손글자 숫자 이미지 데이터 (70000개)를 포함하고 있습니다각 이미지는 대표하는 숫자 즉 '레이블'을 가집니다ML 분야의 "Hello, World" 라고 불립니다.데이터는 28 by 28 = 784 픽셀 데이터로 구성되어 있습니다한 픽셀은 0-255 값을 가지며, 해당 값은 픽셀 밝기를 의미합니다. (0은 흰색, 255은 검은색) 데이터 분석하기먼저 MNIST 데이터를 불러옵니다.from sklearn.datasets import fetch_openmlmnist = fetch_openml('mnist_784', as_frame=Fals..
머신러닝 모델 튜닝하기
·
AI/Machine Learning
학습시킨 모델은 튜닝을 통해서 전보다 정확도 높은 모델을 만들 수 있습니다 그리드 탐색튜닝을 하는 방법들 중 가장 단순한 방법은 만족할 만한 하이퍼파라미터 조합을 찾을 때까지 수동으로 하이퍼파라미터를 조정하는 것입니다. 예를 들어 for문을 통해서 가장 정확도 높은 하이퍼파라미터를 찾는 것입니다, 하지만 이는 많은 경우의 수를 탐색하기에는 시간이 부족할 수도 있습니다. 대신 sklearn의 GridSearchCV를 사용하는 것이 좋습니다. 탐색하고자 하는 하이퍼파라미터와 시도해볼 값을 지정하기만 하면 됩니다.그러면 가능한 모든 하이퍼파라미터 조합에 대해 교차 검증을 사용하여 평가하게 됩니다. 예를 들어 다음 코드는 RandomForestRegressor에 대한 최적의 하이퍼파라미터 조합을 탐색합니다.> ..
머신러닝 회귀 (집값 예측하기)
·
AI/Machine Learning
실제 데이터로 작업하기머신러닝을 배울 때는 인공적으로 만들어진 데이터셋이 아닌 실제 데이터로 실험해보는 것이 가장 좋습니다.현재 여러 분야에 걸쳐 공개된 데이터셋이 아주 많이 존재합니다. 다음은 데이터를 구하기 좋은 곳입니다.유명한 공개 데이터 저장소- UC 얼바인 머신러닝 저장소 (http://archive.ics.uci.edu/ml)- 캐글 데이터셋 (http://www.kaggle.com/datasets)- 아마존 AWS 데이터셋(https://registry.opendata.aws)메타 포털(공개 데이터 저장소가 나열되어 있습니다)- 데이터 포털 (http://dataportals.org)- 오픈 데이터 모니터 (http://opendatamonitor.eu)- 퀸들 (http://quandl.c..
머신러닝 시작하기
·
AI/Machine Learning
머신러닝을 통해서 기계를 학습시켜 결과물로 모델을 만들어 모델로 값을 예측시키는 것입니다 머신러닝이란?기계가 데이터로부터 학습하도록 프로그래밍하는 과학/기술 분야 입니다머신 러닝을 사용하면 대용량 데이터를 분석하여 인간이 보기 힘든 패턴을 발견할 수 있습니다 머신러닝이 뛰어난 분야머신러닝은 기존 솔루션이 많은 수동 조정 (hand-tuning) 또는 긴 규칙 리스트가 필요한 문제를 잘 해결할 수 있습니다유동적인 주변 환경에서 성능을 발휘할 수 있습니다복잡한 문제와 대량의 데이터에 관한 통찰을 얻을 수 있습니다 머신러닝 시스템의 종류앞서 머신러닝이 무엇이고 머신러닝이 어떤 방면에서 뛰어난지 확인하였습니다. 머신러닝은 여러 학습 방법이 있으며 각각의 학습 방법마다 특징이 서로 다릅니다.  ● 사람의 감독하에..
ytw_developer
'AI/Machine Learning' 카테고리의 글 목록 (2 Page)