| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- SQL
- 데이터리안
- 윈도우함수
- 윈도우 함수
- MYSQL
- 퍼널분석
- rank
- 독서
- 순위함수
- leetcode
- 그로스해킹
- Retention
- pandas
- 리텐션
- row_number
- 누적합
- 데이터분석
- regexp
- 서브쿼리
- funnel
- 신입 데이터분석가
- dense_rank
- SolveSQL
- python
- 취준
- LEFTJOIN
- 린분석
- 프로그래머스
- Datarian
- advent of sql
- Today
- Total
목록Python/Scipy (2)
데이터 분석
1) 등분산성 검정scipy의 stats에서 이를 위한 bartlett-killen, levene, fligner 등이 있음둘 이상의 정규성을 만족하는 데이터 집합에 대해 모분산이 같은 지 확인하기 위한 검정에는 bartlett 사용정규성을 만족하지 않는 경우 levene, fligner를 사용 2) 등분산성 검정의 가설H0(귀무가설) : 등분산성을 만족한다H1(대립가설) : 등분산성을 만족하지 못한다'p-value > 유의수준', '검정통계량 3) 등분산성 검정의 종류bartlett test : 정규성을 충족하며, 데이터셋의 크기가 서로 다른 2개 이상의 집단 간에도 사용 가능- 카이제곱 검정을 사용하여 그룹 간 분산 차이를 비교- 단, 정규성이 만족되지 않으면 검정 결과를 신뢰할 수 없음leven..
정규성 검정이란? ● 데이터셋의 분포가 정규분포를 따르는지 검정하는 것을 정규성 검정이라 한다.● 모수 검정은 데이터의 정규성을 확인하는 검정 과정을 진행한 후에 수행된다. ● 중심극한정리에 의해 표본의 크기가 30보다 크면 표본평균의 분포는 모집단의 분포 모양과는 관계없이 정규분포에 가까워진다.● 데이터 수가 30이 넘어도 데이터 특성에 따라 정규분포를 만족하지 않을 수 있어 확인하는 것이 좋다. 정규성 검정 종류에는?Shaprio-Wilks Test표본수가 5000미만인 데이터셋에 적합한 검정 방법, pvalue 반환shaprio(x)Kolmogorov-Smirnov Test두 개의 데이터셋이 같은 분포인지 아닌지 검정하는 방법, pvalue 반환kstest(x1, x2)Normal Test20개 ..