본문 바로가기
대학교/데이터분석개론

3.Python Numpy

by YS_LEE 2020. 6. 8.
반응형

Numpy란?

pandas와 matplotlib 사용에 있어서 꼭 필요한 라이브러리

기본적으로 array 단위로 "데이터 연산" 을 돕는다.

 

array 정의하기

1. 리스트 이용

    arr = np.array(list)

2. numpy 함수이용

    np.zeros(10) # 0이 10개짜리 array

    np.ones((2,10)) # 0이 2*10 개짜리 array

    np.eye(3) # diagonal matrix

    np.arange() # 1차원 array

 

array 관련함수

arr.shape # 형태(크기) 확인

arr.dtype #자료형 확인

arr.astype(np.float64) # 자료형 바꿈

 

array operations

1. array끼리 연산

    사칙연산이 각 요소별로 진행

2. 스칼라 연산

    각 요소에 대해 연산처리

 

array indexing and slicing

    리스트 인덱싱과 동일

 

array boolean indexing(마스크)

    filter같은거

 

data = np.array([[ 3181816,  413,  213,  6,  9],

                 [ 1,  2,  71810,  7,  0111311],

                 [121113,  212,  9,  017,  211],

                 [1915,  6,  1,  815,  518,  8,  4]])

select = [TrueFalseTrueFalse]

print(data[select, :])

array([[ 3, 18, 18, 16, 4, 13, 2, 13, 6, 9],

        [12, 11, 13, 2, 12, 9, 0, 17, 2, 11]])

 

Reshaping and transposing

data.reshape(2,3)) # data를 2*3 배열로 바꿈

data.T # 2*3을 3*2로 전환

 

Matrix operations

data.dot([])

np.matmul(data,weight)

 

data.sum(axis=0) #같은 행끼리 더함

data.sum(axis=1) #같은 열끼리 더함

data.max(axis=0) #같은 행 중에서 max

반응형

'대학교 > 데이터분석개론' 카테고리의 다른 글

5.2-Python Pandas_DataFrame  (0) 2020.06.12
5-1.Python Pandas_Series  (0) 2020.06.12
4.Pyplot Visualization  (0) 2020.06.08
2.파이썬의 제어문, 함수  (0) 2020.06.08
1. 파이썬의 자료구조  (0) 2020.06.08

댓글