본문 바로가기

데이터분석4

[이론 정리]<실무로 통하는 인과추론> ①인과 추론이란? 무엇이며 왜 중요한가 1. 인과추론이란 무엇일까?연관관계는 인과관계가 아니다. ...하지만 여기서 중요한 점은 연관관계는 때로 인과관계가 될 수도 있다...35p ①인과추론의 개념 인과추론에 대해 알아보기 위해서는 우선 연관관계와 인과관계에 대해 알아야 한다.연관관계: 두 개의 수치나 확률변수(random variable)가 같이 움직이는 것. 이는 변인 x가 증가하면 변인 y가 증가할 때(양의 상관관계) 뿐만이 아니라 감소한다고 해도 성립될 수 있다(음의 상관관계).인과관계: 한 변수의 변화가 다른 변수의 변화를 일으키는 것.즉 연관관계는 인과관계의 필요조건이지만 충분조건은 아니다.두 변수 간에 상관성이 있어야 인과관계가 있겠지만, 변수 간에 아무리 강한 상관관계가 있다 하더라도 반드시 원인과 결과의 관계인 것은 아니다. .. 2025. 1. 3.
[내배캠 프로젝트]피드백 분석: 기초 프로젝트 회고와 개선점 운동도 본운동만큼 중요한 게 마무리 운동이죠 시작하며: 4% 아쉬웠지만 2%는 지금 채우자  나름대로 열심히 했던 기초 프로젝트에 튜터님들 피드백이 나왔습니다.  첫 술에 배부르겠습니까. 데이터 분석 프로젝트가 처음이었던 만큼 부족한 점이 많았지만, 나름대로 이것저것 시도해 보고 맡은 바는 해내서 만족했습니다. 그리고 이번에 피드백이 나온 김에 앞으로 문제를 반복하지 않기 위해 튜터님들이 말씀하신 프로젝트의 좋았던 점과 보완할 점을 생각해보고 앞으로 집중해서 공부할 점도 생각해보려 합니다.   1 좋았던 점들 1) 짧은 프로젝트 기간 내에 RFM [Recency(최근성), Frequency(구매 빈도), Monetary(구매 금액)] 같은 고객 분석 기법을 공부하고 분석에 적용해 본 점  → 이건 제가 .. 2024. 8. 31.
[데이터 분석 알아보기] 2-1. 데이터 시각화는 무엇이고 왜 필요할까? 데이터 시각화는 데이터 분석가 업무의 꽃입니다   저는 데이터 분석가가 하는 일을 크게 '의사소통, 데이터 작업 및 분석, 데이터 시각화'라고 이해하고 있어요. 여기서 의사소통이 회사 동료들과 만나 해결할 문제를 식별하고 결과로서 인사이트를 전달하는 업무의 시작과 끝이고 데이터 작업이 데이터를 수집, 정리, 의미화하는 과정이라면 데이터 시각화는 마지막 의사소통을 위해 분석결과와 인사이트를 차트, 그래프, 대화형 대시보드 등의 방식으로 담아내는 일이죠. 데이터 작업과 분석이 팀원들은 볼 수 없는, 분석가 혼자만의 지난한 과정이라면 시각화는 (여전히 작업 자체는 거의 혼자하겠지만..)비로소 결과를 발표하며 업무의 결과를 드러내려는 작업이예요. 백조로 비유하면 분석작업이 호수 아래의 쉼없는 발길질이라면 시각화.. 2024. 8. 15.
[데이터 분석 알아보기] 2-1. 머신러닝_ML의 의미와 종류 머신러닝은 인공지능과 함께 언제부턴가 우리에게 친숙한 단어가 되었습니다.  적어도 2022년 말 즈음 챗GPT가 나온 이후로는 인공지능(Artificial Intelligence)의 시대가 일반인들에게도 성큼 다가온거죠. 하지만 프롬프트 서비스를 이용하는데 그치지 않고 데이터를 이용해 전문적인 작업을 해야하는 개발자나 데이터 분석가들에게는 AI보다 더 구체화된 개념인 머신러닝(Machine-Learning, ML)에 대한 이해와 활용이 필요합니다. 이번 페이지에서는 인공지능의 하위범주로서 머신러닝이 무엇인지에 대해 생각해보고 그 종류에는 무엇이 있는지 알아보겠습니다!  1. 머신러닝이란?  머신러닝에 대해 알아보기 위해 먼저 인공지능과 그 하위 개념들에 대해 알아보겠습니다.AI: 인간의 지능을 모방하는 .. 2024. 8. 12.