
강의 소개
커리큘럼
90% 국비지원으로 부담 없이 시작하세요!
데이터를 봐도 무엇을 알아야 할지 막막하셨나요? 📊
파이썬으로 통계를 이해하고 전처리부터 모델링까지, 데이터 분석의 전 과정을 차근차근 배워보는 입문 코스예요.
타이타닉 생존자 예측, 캘리포니아 집값 분석 등 실제 데이터를 다루면서 숫자 뒤에 숨겨진 패턴과 인사이트를 찾아내는 재미를 느낄 수 있을 거예요!
이런 고민이 있나요?
통계를 배우지 못해 데이터 분석조차 엄두가 안 나요

통계를 배웠지만 실제 데이터에 어떻게 적용해야 할지 모르겠어요

지저분한 데이터를 보면 어디부터 손대야 할지 막막해요

시각화와 통계 해석으로 인사이트를 뽑아내고 싶어요

이렇게 성장할 수 있어요!
평균, 분산, 표준편차 등 핵심 통계 개념을 실제 데이터로 체득할 수 있어요

결측치, 이상치, 중복 처리 등 전처리 루틴을 익혀 깨끗한 데이터셋을 만들어요

통계 기반 EDA로 패턴, 관계, 가설을 발견하는 방법을 배워요

선형회귀, 로지스틱회귀를 적용해 기본 모델링 흐름을 이해할 수 있어요

프로젝트 맛보기
크리에이터
박형철
데이터를 '보는 눈'을 키우면 숫자는 스토리가 돼요. 통계와 파이썬으로 그 스토리를 함께 읽어봅시다! • 현재 모두의연구소 데이터 사이언스 부트캠프 퍼실리테이터 • 연세대학교 수학과 석사 • 의료영상 EIT 논문, 대한응용수학회 포스터 발표 경험 • 신약개발 AI 및 비임상실험 기업 AI 솔루션 제공 사업 기획·연구 • 비전공자 대상 파이썬·머신러닝 실습 강의 다수 진행
커리큘럼
입문
11시간 51분
노드 01
데이터 분석, 왜 통계가 필요할까?
데이터를 활용해 세상을 이해하고 문제를 해결하는 사고방식을 익히며, 통계와 머신러닝의 역할과 차이를 개념적으로 이해합니다.
1-1
통계를 배워야 하는 이유
5분
1-2
나이팅게일의 장미 그래프: 데이터로 문제를 해결하다
20분
1-3
이번 과정에서 우리가 배우게 될 내용
5분
노드 02
데이터의 종류와 특징
데이터를 숫자형, 범주형 등으로 구분하고 각각의 특징을 이해함으로써, 문제에 맞는 분석 방법을 선택할 수 있는 기초를 다집니다.
2-1
데이터의 종류
10분
2-2
데이터의 특징
15분
노드 03
프로젝트 1: 주변 데이터로부터 얻는 통찰
우리가 주변에서 접하는 다양한 형태의 데이터를 관찰하고, 이를 정형/비정형, 수치형/범주형 등으로 분류해보며 실제 적용 가능성을 탐색합니다.
3-1
프로젝트 1: 주변 데이터로부터 얻는 통찰
1시간
노드 04
꼭 알아야 할 기초 통계 개념 익히기
평균, 중앙값, 표준편차 등 대표값과 산포도를 통해 데이터를 요약하고 해석하는 통계 기초 개념을 학습합니다.
4-1
평균 키를 구해보자!: 중앙값과 최빈값
15분
4-2
평균 값만 구하면 끝일까?: 분산과 표준편차
15분
4-3
데이터가 어떻게 퍼져있는데?: 데이터의 분포
5분
4-4
일부만 뽑아서 검증하자!: 표본검정과 가설검정
15분
노드 05
프로젝트 2: 나만의 통계 지표 리포트 만들기
우리 주변의 데이터를 활용해 평균, 중앙값, 최빈값, 분산, 표준편차, 분포, 표본검정 등 통계 개념을 직접 적용해보며 추상적이었던 통계 개념을 실제 데이터로 분석하며 개념을 체득합니다.
5-1
프로젝트 2: 나만의 통계 지표 리포트 만들기
1시간
노드 06
지저분한 데이터 정리하기: 데이터 전처리 기초
결측치, 이상값 등 지저분한 데이터를 정리하고 분석 가능한 형태로 가공하는 방법을 실습합니다.
6-1
타이타닉 탑승자 데이터 분석하기
5분
6-2
데이터에 에러가 있다면? 잘못된 데이터 대처하기
15분
6-3
스파이가 숨어있다! 이상값 처리하기
15분
6-4
데이터 에러 처리 방법 학습 마무리
3분
노드 07
프로젝트 3: 타이타닉 데이터를 깨끗하게 정리해보자!
결측치, 이상값, 중복값 등 ‘지저분한 데이터’를 직접 다뤄보고, 전처리 전/후 데이터의 차이를 관찰하며 데이터 분석의 신뢰성을 높이는 과정을 실습합니다.
7-1
프로젝트 3: 타이타닉 데이터를 깨끗하게 정리해보자!
1시간
노드 08
데이터를 시각화하자: 통계 기반 탐색(EDA)
통계값과 시각화를 통해 변수 간 관계와 숨은 패턴을 탐색하고, 인사이트를 도출하는 방법을 배웁니다
8-1
타이타닉 데이터 살펴보기
5분
8-2
어떤 값들을 봐야 할까?: 기초 통계 분석
5분
8-3
정량적인 이해를 원한다면?: 데이터 시각화
15분
8-4
변수 간 어떤 관계가 있을까?: 상관관계 분석
15분
노드 09
프로젝트 4: 타이타닉 생존 데이터를 분석해보자
탑승자의 성별, 나이, 객실 등급, 탑승 위치 등 다양한 변수를 시각화하여 생존율에 영향을 준 요인을 분석하는 과정을 통해, 데이터의 기초 통계량, 분포, 변수 간 상관관계를 시각화하고 인사이트를 도출해봅니다.
9-1
프로젝트 4: 타이타닉 생존 데이터를 분석해보자
1시간
노드 10
문제 해결을 위한 모델링: 머신러닝
예측하고자 하는 문제를 정의하고, 회귀/분류 모델을 선택하여 문제를 해결하는 전체 흐름을 익힙니다.
10-1
어떤 모델을 선택해야 할까?: 회귀 VS 분류
30분
10-2
모델이 좋은 대답을 하고 있나?: 모델 평가
30분
노드 11
캘리포니아 집값 예측하기: 선형 회귀 실습
캘리포니아 집값 데이터를 통해 회귀 모델을 직접 적용하고 성능을 평가해보는 실습을 진행합니다.
11-1
회귀 모델이란 무엇일까요?
15분
11-2
캘리포니아 집값 데이터 시각화하기
15분
11-3
이 데이터 이상한데?: 노이즈 제거 및 상관관계 분석
15분
11-4
머신러닝 마지막 스텝: 이상치 탐지하기
15분
노드 12
프로젝트 5: 나만의 모델링 실험 설계하기
새로운 실험을 설계하고 평가해보며, 모델의 성능에 영향을 주는 요인을 탐구하고 개선 방향을 찾아봅니다.
12-1
프로젝트 5: 나만의 모델링 실험 설계하기
1시간
노드 13
타이타닉 생존자 예측하기: 로지스틱 회귀 실습
타이타닉 데이터를 활용해 생존 여부를 예측하고, 분류 모델의 적용과 개선 과정을 체험합니다
13-1
분류 모델 이해: 다중분류와 이진분류
5분
13-2
회귀지만 분류다: 로지스틱 회귀
5분
13-3
타이타닉 생존자 예측실습
15분
13-4
모델 성능을 더 올려보자!: 이상치 제거
10분
13-5
아직 부족한 것 같다면?: 다른 모델 적용하기
3분
13-6
추가 실습 안내
5분
13-7
마무리하며
5분
노드 14
프로젝트 6: 타이타닉 생존자 데이터에서 인사이트 도출하기
타이타닉 생존자를 예측해보고, 자신만의 분석 관점과 인사이트를 정리해봅니다.
14-1
프로젝트 6: 타이타닉 생존자 데이터에서 인사이트 도출하기
1시간