kyejin0412 님의 블로그
[TIL] Week 7-2 파이썬 Pandas 심화 - melt, stack, unstack, transpose / 통계 시작 본문
내일배움캠프-데이터분석
[TIL] Week 7-2 파이썬 Pandas 심화 - melt, stack, unstack, transpose / 통계 시작
kyejin0412 2025. 12. 2. 22:14
오늘부터 조가 다시 편성되었고, 베이직반, 스탠다드반으로 선택 학습을 진행하게 되었다.
어제는 실력점검테스트와 밍글데이만 하고 끝이 나서 TIL을 적지 않았다. 연준 튜터님이 채점해주셨길래 오답노트를 하려고 틀린 게 있나 물어봤는데, 다행히도 틀린 게 없다고 하셨다!! 잘 따라가고 있구나 싶었고 더더 열심히 해야겠다고 생각했다.
발제가 끝나고 이번 데이터 분석 입문 주차 학습 계획을 세워봤다. 이번에도 라이브강의가 휘몰아치더라 ㅜㅜ
이번주까지 통계 녹강을 끝내고 다음주부터 프로젝트 시작 전날까지 머신러닝 강의를 들을 예정이다. 베이직반은 이 진도를 따라오면서 복습 라이브도 들어야 하는데 더 빡셀 것 같다 ㄷㄷ
조금 풀어졌었던 마음을 다잡고 다시 열심히 달려보자!! 벌써 3분의 1이 지났다~~~

[Pandas 심화]
1. Wide format vs Long format
- Wide format: 그룹화한 테이블이라고 쉽게 생각할 수 있다. 인덱스에 중복이 없이 그룹화되어 있다.
- Long format: 인덱스마다 변수들이 모두 표시되며, 변수들마다의 값들이 있다.

2. 데이터 고급 핸들링 기법 - melt, stack, unstack

- Transpose

- pivot table

- melt


- stack

- unstack

[통계]
1. 데이터 분석에 통계가 중요한 이유
- 데이터를 요약하고 패턴을 발견할 수 있다.
- 추론을 통해 결과를 도출할 수 있다.
- 즉, 데이터 기반의 의사결정을 할 수 있다.
2. 기술통계와 추론통계
- 기술통계: 평균, 중앙값, 분산 등 수치화된 대푯값을 통해 분석하는 것.
- 데이터의 대략적인 특징을 쉽고 간단하게 알 수 있다.
- 다만, 데이터에는 이상치가 있으며, 데이터의 모든 부분을 확인할 수 있는 것은 아니다.
- ex) 회사 매출 평균
- 추론통계: 표본 데이터를 통해 모집단을 추정하고 가설을 검정하는 것.
- 데이터의 일부(표본)로 전체(모집단)를 추정하는 것이 핵심
- 신뢰구간: 모집단의 평균이 특정 범위 내에 있을 것이라는 확률. 주로 95% 사용
- 가설검정-귀무가설: 원래 있던 가설. 대립가설: 내가 주장하는 가설. 원래 가설을 뒤엎을 가설.
- ex) 고객 만족도 설문조사
'내일배움캠프-데이터분석' 카테고리의 다른 글
| [TIL] Week 7-4 파이썬 Pandas 기본 과제 오답노트 / window function - shift, rolling, expanding / 상관관계 (0) | 2025.12.04 |
|---|---|
| [TIL] Week 7-3 파이썬 Pandas 기본 - 자주 쓰는 메소드, 함수 (0) | 2025.12.03 |
| Week 6-4, 6-5 기초 프로젝트 마무리 (0) | 2025.11.28 |
| Week 6-3 기초 프로젝트 - 그래프 개선, 피그마 작업 (0) | 2025.11.26 |
| [TIL] Week 6-2 기초 프로젝트 - 도메인 조사, 인사이트 찾기 (0) | 2025.11.25 |