2017-06-07

자유게시판

[데이터 사이언스] 데이터 입력치가 많아지면 Lift 값이 1로 수렴하는 현상?

작성자
Keith
작성일
2018-04-03 11:16
조회
48
데이터가 많아지면 Lift가 1에 수렴하는 현상은 데이터 포인트가 증가하면서 randomness가 증가했기 때문이라고 보입니다.

수학 수업에서 언급했던 random data가 어느 특정 분포에 수렴하는 현상과 같은 맥락인데,

작은 샘플 데이터 셋 비교에서는 종속 사건으로 보였다가 (최소한 독립 사건으로 보이질 않았다가), 데이터 셋이 커지면서 각 그룹의 randomness가 두드러질 수 있습니다.

데이터 숫자가 증가하면서 정규분포, 포아송 분포 같은 random 분포에 수렴하는 현상이 점점 더 확연해지는 걸 눈으로 확인하는 맥락이라고 보면 됩니다.

두 데이터가 각각 random이면 서로간 종속관계가 없다는 말과 같은 말이니까, independence는 증가하고 Lift값은 1에 가까워 질 겁니다.

 

이런 스토리가 맞아들어가기 위해서는 원래 데이터가 random인데, 모델에 쓰인 샘플 데이터에서는 randomness가 강하게 나타나지 않은 경우라야하지 않을까 싶습니다.
전체 0

전체 20
번호 제목 작성자 작성일 추천 조회
공지사항
강의에 대해 궁금한 내용, 강의 중 궁금한 내용이 있으면 여기에 글 올려주세요
Keith | 2017.06.07 | 추천 0 | 조회 265
Keith 2017.06.07 0 265
12
[수학&통계} Simultaneity 를 test 할 수 있는 방법
Keith | 2018.04.03 | 추천 2 | 조회 65
Keith 2018.04.03 2 65
11
[데이터 사이언스] 데이터 입력치가 많아지면 Lift 값이 1로 수렴하는 현상?
Keith | 2018.04.03 | 추천 2 | 조회 48
Keith 2018.04.03 2 48
10
강의관련 질문입니다 (2)
aleveal | 2018.03.02 | 추천 0 | 조회 235
aleveal 2018.03.02 0 235
9
안녕하세요! 질문 있습니다. (3)
D4R6 | 2018.01.07 | 추천 0 | 조회 256
D4R6 2018.01.07 0 256
8
경영학과 출신, 데이터 사이언스 학원 과정 (3)
Keith | 2017.12.28 | 추천 1 | 조회 352
Keith 2017.12.28 1 352
Re:경영학과 출신, 데이터 사이언스 학원 과정
Keith | 2017.12.28 | 추천 0 | 조회 237
Keith 2017.12.28 0 237
7
Logistic regression - level 인식 에러
Keith | 2017.11.29 | 추천 0 | 조회 134
Keith 2017.11.29 0 134
Re:Logistic regression - level 인식 에러
Keith | 2017.11.29 | 추천 0 | 조회 122
Keith 2017.11.29 0 122
6
[모비 - 데이터 사이언스를 위한 확률과 통계] 수강문의
Keith | 2017.11.01 | 추천 -1 | 조회 214
Keith 2017.11.01 -1 214
Re:[모비 - 데이터 사이언스를 위한 확률과 통계] 수강문의
Keith | 2017.11.01 | 추천 -1 | 조회 259
Keith 2017.11.01 -1 259
5
[모비 - 데이터 사이언스] 신경망 - Overconfidence
Keith | 2017.10.16 | 추천 0 | 조회 197
Keith 2017.10.16 0 197
Re:[모비 - 데이터 사이언스] 신경망 - Overconfidence
Keith | 2017.10.16 | 추천 0 | 조회 169
Keith 2017.10.16 0 169
4
[모비 - 데이터 사이언스] Auto encoder
Keith | 2017.10.16 | 추천 0 | 조회 107
Keith 2017.10.16 0 107
Re:[모비 - 데이터 사이언스] Auto encoder
Keith | 2017.10.16 | 추천 0 | 조회 133
Keith 2017.10.16 0 133
3
[모비 - 데이터 사이언스] Factor Analysis
Keith | 2017.10.16 | 추천 0 | 조회 130
Keith 2017.10.16 0 130
Re:[모비 - 데이터 사이언스] Factor Analysis
Keith | 2017.10.16 | 추천 0 | 조회 117
Keith 2017.10.16 0 117
X