본문 바로가기
DAta 이론

[데이터 분석 알아보기] 2-1. 머신러닝_ML의 의미와 종류

by DAkimble 2024. 8. 12.

 

머신러닝은 인공지능과 함께 언제부턴가 우리에게 친숙한 단어가 되었습니다.

 

 적어도 2022년 말 즈음 챗GPT가 나온 이후로는 인공지능(Artificial Intelligence)의 시대가 일반인들에게도 성큼 다가온거죠. 하지만 프롬프트 서비스를 이용하는데 그치지 않고 데이터를 이용해 전문적인 작업을 해야하는 개발자나 데이터 분석가들에게는 AI보다 더 구체화된 개념인 머신러닝(Machine-Learning, ML)에 대한 이해와 활용이 필요합니다. 이번 페이지에서는 인공지능의 하위범주로서 머신러닝이 무엇인지에 대해 생각해보고 그 종류에는 무엇이 있는지 알아보겠습니다!

 


 

1. 머신러닝이란? 

 머신러닝에 대해 알아보기 위해 먼저 인공지능과 그 하위 개념들에 대해 알아보겠습니다.

  • AI: 인간의 지능을 모방하는 기술을 총칭. 휴먼애러(힘이나 지력의 부족, 실수 등) → 이를 하드웨어적으로 보완하는 기계(공장, 자동차) → 스프트웨어적으로 보완하는 것이 AI
  • ML: 인공지능을 구현하는 다양한 방법론 중 하나. 관측된 패턴을 기반으로 예측, 분류와 같은 의사 결정을 진행하는 알고리즘.
  • 딥러닝: 머신러닝의 한 종류로서 인공신경망을 이용. 

 AI 전반에서 ML을 거쳐 딥러닝으로 발전되는 과정에는 대규모의 데이터를 신속하게 처리할 수 있는 기술의 발전이 중요한 역할을 했습니다. 원래 AI의 역할 중 하나가 인간의 의사결정 과정에서 실수와 수고를 줄이기 위해서였다면 이전에는 기술의 한계로 소수의 데이터만을 다룰 수 있었다면 이제 대량의 데이터에서 보다 확실한 패턴을 확인하고 이후의 상황을 예측할 수 있게 된거죠. 

 그리고 데이터를 집계하고 통계 분석하는데 쓰이는 머신 러닝은 데이터 분석가들에게는 필수적인 기술이기도 합니다. 기존의 통계 기술이 모집단(전체집단)의 성질을 비교적 소수의 표본집단으로 추론하는 방법론으로서 여러가지 '휴먼 애러'를 낳았다면, 현대의 데이터 분석가들이 이용하는 머신러닝 및 딥러닝은 모집단 전반으로부터 인사이트를 도출하여 이를 보완하는 동시에 작업 시간과 비용도 획기적으로 줄인거죠.

2. 머신러닝의 종류

1) 지도학습: 문제와 정답을 알려주고 데이터를 학습시켜 다음 정답을 예측시키는 방법. 여기서 정답은 '레이블'(Label)이라 불리며 대표적으로 분류와 회귀와 같은 문제유형을 다룬다.

  • 분류: 데이터를 미리 정해진 레이블 범주 중 하나로 나눠서 배치하는 것 ex) 스팸 메일 탐지
  • 회귀: 과거의 연속된 데이터를 기반으로 미래의 값을 예측. 주로 숫자를 예측할 때 이용한다 ex) 기온과 아이스크림 판매량 간의 관계

2) 비지도 학습: 정답이 없는 데이터를 이용해 AI가 스스로 학습하여 구조나 패턴을 발견하는 방법.

  • 군집화(Clustering):  
  • 연관 규칙: ex) 남자가 맥주를 사면서 항상 기저귀를 사는 경향성을 보인다면 그에 따라 가게에서 두 상품을 가까이 배치

3) 강화 학습: 에이전트(Agent)라 불리는 인공지능이 환경과 상호작용 하며 보상을 최대화하는 방향으로 학습 및 행동하는 머신러닝 기법. 

 

3. 머신러닝의 적용분야

  • 금융: 신용 평가나 주식 예측
  • 헬스케어: 식습관 등 환자 데이터 바탕으로 질병 예측, 적합한 건강 습관 제시
  • 이커머스: 고객 구매, 관심 패턴을 분석해 상위 노출 제공
  • 자연어처리:  구글 번역, 챗GPT 등. 주로 딥러닝의 적용분야
  • 이미지 & 영상처리: 명령어에 따른 이미지 생성

 

4. 머신러닝과 데이터 분석가

  1) 데이터 분석가는 반드시 머신러닝을 할 줄 알아야 할까?

     → 데이터 분석은 데이터를 다뤄서 가치를 창출하는 활동 전반을 말한다. 

  2) 그렇다면 DA가 왜 머신러닝을 배워야 할까?

     → 앞서 살펴봤듯이 머신러닝에는 넓은 적용 분야가 있으며 이는 데이터 분석가의 실무 범위와 겹치는 종목들이다. 자신이 고도의 알고리즘을 다루지 못한다 하더라도 머신러닝에 대한 기본 지식은 관련 전문가들과의 협업에서 유용할 것이다. 

 

5. 앞으로 배울 내용

  1) 회귀 분석의 원리: 숫자(정형 데이터)를 맞추는 방법

  2) 분류 분석의 원리: 범주(비정형 데이터)를 맞추는 방법

       ⇒ 어떠한 데이터라도 비/정형이라는 점에서 지도학습 전반에 대한 학습 가능

  3) 머신러닝 전체 프로세스

  4) 더 많은 머신러닝 모델

  5) 딥러닝의 원리

 


 

참고자료

내일배움캠프 머신러닝 기초 강의

‘머신러닝’ 기초 지식 톺아보기