
강의 소개
커리큘럼
90% 국비지원으로 부담 없이 시작하세요!
데이터를 봐도 무엇을 알아야 할지 막막하셨나요? 📊
파이썬으로 통계를 이해하고 전처리부터 모델링까지, 데이터 분석의 전 과정을 차근차근 배워보는 입문 코스예요.
타이타닉 생존자 예측, 캘리포니아 집값 분석 등 실제 데이터를 다루면서 숫자 뒤에 숨겨진 패턴과 인사이트를 찾아내는 재미를 느낄 수 있을 거예요!
이런 고민이 있나요?
통계를 배우지 못해 데이터 분석조차 엄두가 안 나요

데이터 분석 입문자
통계를 배웠지만 실제 데이터에 어떻게 적용해야 할지 모르겠어요

데이터 애널리스트 지망생
지저분한 데이터를 보면 어디부터 손대야 할지 막막해요

비즈니스 애널리스트
시각화와 통계 해석으로 인사이트를 뽑아내고 싶어요

데이터 사이언티스트 지망생
이렇게 성장할 수 있어요!
평균, 분산, 표준편차 등 핵심 통계 개념을 실제 데이터로 체득할 수 있어요

데이터 분석 입문자
결측치, 이상치, 중복 처리 등 전처리 루틴을 익혀 깨끗한 데이터셋을 만들어요

데이터 애널리스트 지망생
통계 기반 EDA로 패턴, 관계, 가설을 발견하는 방법을 배워요

비즈니스 애널리스트
선형회귀, 로지스틱회귀를 적용해 기본 모델링 흐름을 이해할 수 있어요

데이터 사이언티스트 지망생
프로젝트 맛보기
크리에이터

박형철
데이터를 '보는 눈'을 키우면 숫자는 스토리가 돼요. 통계와 파이썬으로 그 스토리를 함께 읽어봅시다!
• 현재 모두의연구소 데이터 사이언스 부트캠프 퍼실리테이터
• 연세대학교 수학과 석사
• 의료영상 EIT 논문, 대한응용수학회 포스터 발표 경험
• 신약개발 AI 및 비임상실험 기업 AI 솔루션 제공 사업 기획·연구
• 비전공자 대상 파이썬·머신러닝 실습 강의 다수 진행
커리큘럼
입문
11시간 51분
노드 01
데이터 분석, 왜 통계가 필요할까?
데이터를 활용해 세상을 이해하고 문제를 해결하는 사고방식을 익히며, 통계와 머신러닝의 역할과 차이를 개념적으로 이해합니다.
1-1
통계를 배워야 하는 이유
5분
1-2
나이팅게일의 장미 그래프: 데이터로 문제를 해결하다
20분
1-3
이번 과정에서 우리가 배우게 될 내용
5분
노드 02
데이터의 종류와 특징
데이터를 숫자형, 범주형 등으로 구분하고 각각의 특징을 이해함으로써, 문제에 맞는 분석 방법을 선택할 수 있는 기초를 다집니다.
2-1
데이터의 종류
10분
2-2
데이터의 특징
15분
노드 03
프로젝트 1: 주변 데이터로부터 얻는 통찰
우리가 주변에서 접하는 다양한 형태의 데이터를 관찰하고, 이를 정형/비정형, 수치형/범주형 등으로 분류해보며 실제 적용 가능성을 탐색합니다.
3-1
프로젝트 1: 주변 데이터로부터 얻는 통찰
1시간
노드 04
꼭 알아야 할 기초 통계 개념 익히기
평균, 중앙값, 표준편차 등 대표값과 산포도를 통해 데이터를 요약하고 해석하는 통계 기초 개념을 학습합니다.
4-1
평균 키를 구해보자!: 중앙값과 최빈값
15분
4-2
평균 값만 구하면 끝일까?: 분산과 표준편차
15분
4-3
데이터가 어떻게 퍼져있는데?: 데이터의 분포
5분
4-4
일부만 뽑아서 검증하자!: 표본검정과 가설검정
15분
노드 05
프로젝트 2: 나만의 통계 지표 리포트 만들기
우리 주변의 데이터를 활용해 평균, 중앙값, 최빈값, 분산, 표준편차, 분포, 표본검정 등 통계 개념을 직접 적용해보며 추상적이었던 통계 개념을 실제 데이터로 분석하며 개념을 체득합니다.
5-1
프로젝트 2: 나만의 통계 지표 리포트 만들기
1시간
노드 06
지저분한 데이터 정리하기: 데이터 전처리 기초
결측치, 이상값 등 지저분한 데이터를 정리하고 분석 가능한 형태로 가공하는 방법을 실습합니다.
6-1
타이타닉 탑승자 데이터 분석하기
5분
6-2
데이터에 에러가 있다면? 잘못된 데이터 대처하기
15분
6-3
스파이가 숨어있다! 이상값 처리하기
15분
6-4
데이터 에러 처리 방법 학습 마무리
3분
노드 07
프로젝트 3: 타이타닉 데이터를 깨끗하게 정리해보자!
결측치, 이상값, 중복값 등 ‘지저분한 데이터’를 직접 다뤄보고, 전처리 전/후 데이터의 차이를 관찰하며 데이터 분석의 신뢰성을 높이는 과정을 실습합니다.
7-1
프로젝트 3: 타이타닉 데이터를 깨끗하게 정리해보자!
1시간
노드 08
데이터를 시각화하자: 통계 기반 탐색(EDA)
통계값과 시각화를 통해 변수 간 관계와 숨은 패턴을 탐색하고, 인사이트를 도출하는 방법을 배웁니다
8-1
타이타닉 데이터 살펴보기
5분
8-2
어떤 값들을 봐야 할까?: 기초 통계 분석
5분
8-3
정량적인 이해를 원한다면?: 데이터 시각화
15분
8-4
변수 간 어떤 관계가 있을까?: 상관관계 분석
15분
노드 09
프로젝트 4: 타이타닉 생존 데이터를 분석해보자
탑승자의 성별, 나이, 객실 등급, 탑승 위치 등 다양한 변수를 시각화하여 생존율에 영향을 준 요인을 분석하는 과정을 통해, 데이터의 기초 통계량, 분포, 변수 간 상관관계를 시각화하고 인사이트를 도출해봅니다.
9-1
프로젝트 4: 타이타닉 생존 데이터를 분석해보자
1시간
노드 10
문제 해결을 위한 모델링: 머신러닝
예측하고자 하는 문제를 정의하고, 회귀/분류 모델을 선택하여 문제를 해결하는 전체 흐름을 익힙니다.
10-1
어떤 모델을 선택해야 할까?: 회귀 VS 분류
30분
10-2
모델이 좋은 대답을 하고 있나?: 모델 평가
30분
노드 11
캘리포니아 집값 예측하기: 선형 회귀 실습
캘리포니아 집값 데이터를 통해 회귀 모델을 직접 적용하고 성능을 평가해보는 실습을 진행합니다.
11-1
회귀 모델이란 무엇일까요?
15분
11-2
캘리포니아 집값 데이터 시각화하기
15분
11-3
이 데이터 이상한데?: 노이즈 제거 및 상관관계 분석
15분
11-4
머신러닝 마지막 스텝: 이상치 탐지하기
15분
노드 12
프로젝트 5: 나만의 모델링 실험 설계하기
새로운 실험을 설계하고 평가해보며, 모델의 성능에 영향을 주는 요인을 탐구하고 개선 방향을 찾아봅니다.
12-1
프로젝트 5: 나만의 모델링 실험 설계하기
1시간
노드 13
타이타닉 생존자 예측하기: 로지스틱 회귀 실습
타이타닉 데이터를 활용해 생존 여부를 예측하고, 분류 모델의 적용과 개선 과정을 체험합니다
13-1
분류 모델 이해: 다중분류와 이진분류
5분
13-2
회귀지만 분류다: 로지스틱 회귀
5분
13-3
타이타닉 생존자 예측실습
15분
13-4
모델 성능을 더 올려보자!: 이상치 제거
10분
13-5
아직 부족한 것 같다면?: 다른 모델 적용하기
3분
13-6
추가 실습 안내
5분
13-7
마무리하며
5분
노드 14
프로젝트 6: 타이타닉 생존자 데이터에서 인사이트 도출하기
타이타닉 생존자를 예측해보고, 자신만의 분석 관점과 인사이트를 정리해봅니다.
14-1
프로젝트 6: 타이타닉 생존자 데이터에서 인사이트 도출하기
1시간





