본문 바로가기

numpy

(2)
9. 통계적 분석(분포, 가설 검정)_ python 데이터마이닝 Coursera.org 에서 Michigan University의 Applied Data Science with Python의 강의를 토대로 정리한 내용입니다. 이제 어느정도 Python에서 pandas나 numpy를 이용해서 데이터를 어떻게 다루는 지 익숙해지셨다면 한번 통계적 분석을 해보도록 하죠. 이제부터는 pandas와 numpy는 어느정도 다 이해한다는 전제하에 설명을 이어가볼게요. 혹시 이항분포나 정규분포 등 확률적인 개념이 이해가 안 가시는 분들은 구글링을 통해서 학습 후 보시면 좋을 것 같네요. 먼저 파이썬에서 데이터들의 분포에 대해서 어떻게 분석하고 다루는 지 알아볼까요? #numpy 라이브러리는 아래처럼 다양한 분포에 대한 함수를 제공하기도 한답니다 np.random.binomial(1..
3. Numpy 기초 Coursera.org 에서 Michigan University의 Applied Data Science with Python의 강의를 토대로 정리한 내용입니다. 오늘은 Numpy라는 파이썬을 활용한 데이터마이닝에셔 결코 빠질 수 없는 아주 기본적인 라이브러리에 대해서 알아보도록 할게요. import numpy as np #이런식으로 라이브러리를 불러오면 된답니다. mylist = [1, 2, 3] x = np.array(mylist) # x가 array([1, 2, 3])와 같은 형식으로 저장이 됩니다. m = np.array([[7, 8, 9], [10, 11, 12]]) #array([[ 7, 8, 9], # [10, 11, 12]]) 와 같은 형식으로 저장이 됩니다. m.shape # (2,3)이 ..