본문 바로가기

기계학습5

Python 머신러닝 #분류하기 (K-최근접 이웃#2) 안녕하세요 IT`s닝겐입니다. 이전 글 K-최근접 이웃#1에 이어 진행하도록 하겟습니다. 이번 진행은 기존 생선데이터를 Numpy배열로 변환 한 뒤, 그 데이터를 분리하여, 각 훈련 데이터와, 테스트 데이터로 분리하고 K-최근접 이웃을 통해 훈련하고, 평가해보며, 임의의 데이터에 대한 산점도를 찍어 K-최근접 이웃이 어떠한 데이터를 참고하는지 확인해보록 하겠습니다. 1. 과정 - 기존 Bream, Smelt생선 데이터를 무게와 길이 별로 합칩니다. - 합쳐진 데이터를 기존과 동일하게 (길이, 무게)인 2차원 배열로 변환하고, Bream과, smelt에 대한 target 데이터를 생성합니다. - 생성된 2차원 배열데이터와 타겟데이터를 Numpy 배열로 변환하고, numpy의 random.shffle 메서드.. 2021. 4. 21.
Python 머신러닝 #분류하기 (K-최근접 이웃#1) 안녕하세요 IT`s 닝겐입니다. 전 글에서 사용한 생선 데이터를 가지고, 사이킷런에서 제공되는 K-최근접 이웃 알고리즘을 통해 임의의 생선 데이터가 Bream인지, Smelt인지 구분하는 코드를 알아보겠습니다. 그 전에 머신러닝 공부를 하시게 되면 Numpy와 Pandas에 대한 이야기를 많이 접하게 될 것입니다. 이는 데이터를 하기 쉽게 정리해놓는 수단이라고 여기시면 될 것같습니다. 저 또한 해당부분에 대해 깊이 공부한것은 아니지만, 자세히 알아두시면 데이터가 어떻게 저장되어 있는지 변환이 어떻게 되었는지 보다 잘 이해하실수 있지만, 모른다고 코딩이 불가능한것은 아닙니다. 1. 과정 - 준비된 Bream, Smelt 데이터는 길이와 무게가, Bream은 35개 데이터, Smelt는 14개 데이터임을 인.. 2021. 4. 20.
Python 머신러닝 #기계학습 이해하기 안녕하세요 IT`s닝겐 입니다. 제가 보는 교재인 '혼자 공부하는 머신러닝 + 딥러닝' 책의 좋은점은 머신러닝 초기 학습시 많은 데이터를 가지고 코딩하는것은 상당히 부담스런 부분이며, 이 많은 데이터로 뭘하는지 ? 이런 궁금증이 풀리지않았습니다. 맞습니다. 기계학습으로 뭘하는데? 이런 궁금증이 있었고, 위 교재는 이러한 궁금증을 아주 작은 데이터부터 시작하여, 기존의 IT환경에서 머신러닝이 무엇을 할수 있는지에 대한 내용을 알려줍니다. 1. 생선분류의 대한 문제. - 데이터 : www.kaggle.com/aungpyaeap/fish-market - 위 생선 데이터는 'Pike', 'Smelt', 'Perch', 'Bream', 'Roach', 'Whitefish' 생선 종류에 대한 길이와 무게 데이터를 .. 2021. 4. 19.
Python 머신러닝 #1 colab환경 준비 안녕하세요 IT`s닝겐 입니다. 아마 대부분의 교재들의 처음부분은 Python 머신러닝을 하기위한 준비 또는, 머신러닝이란 무엇인가, 인공지능은 무엇인가? 딥러닝은 뭔가?, 머신러닝의 역사 등 이런 내용들이 대부분을 이뤄져있습니다. 매우 지루한 부분이기도 하고, 역사적인 부분은 개인적으로 생각할때, 크게 의미가 있는것 같지는않으며, 머신러닝이 무엇인가? 딥러닝은 뭔가? 인공지능이란? 이러한 부분들 또한 IT업계에서 일한다면 누차 들리는? 그런이야기들로 구성되어 있어 그렇게 썩 시원히 의미를 알려주지 않습니다. 혹시 책을 통해 공부하시는분들은 궂이 이걸 신경쓰지말고 한귀로 듣고 한귀로 흘려들으시면됩니다. 저처럼 문외한이 처음부터 접근하기엔 코딩을 치면서 이해를 한다면, 그것이 곳 머신러닝에 대한 정의가 되.. 2021. 4. 19.