Numpy란?
pandas와 matplotlib 사용에 있어서 꼭 필요한 라이브러리
기본적으로 array 단위로 "데이터 연산" 을 돕는다.
array 정의하기
1. 리스트 이용
arr = np.array(list)
2. numpy 함수이용
np.zeros(10) # 0이 10개짜리 array
np.ones((2,10)) # 0이 2*10 개짜리 array
np.eye(3) # diagonal matrix
np.arange() # 1차원 array
array 관련함수
arr.shape # 형태(크기) 확인
arr.dtype #자료형 확인
arr.astype(np.float64) # 자료형 바꿈
array operations
1. array끼리 연산
사칙연산이 각 요소별로 진행
2. 스칼라 연산
각 요소에 대해 연산처리
array indexing and slicing
리스트 인덱싱과 동일
array boolean indexing(마스크)
filter같은거
data = np.array([[ 3, 18, 18, 16, 4, 13, 2, 13, 6, 9],
[ 1, 2, 7, 18, 10, 7, 0, 11, 13, 11],
[12, 11, 13, 2, 12, 9, 0, 17, 2, 11],
[19, 15, 6, 1, 8, 15, 5, 18, 8, 4]])
select = [True, False, True, False]
print(data[select, :])
array([[ 3, 18, 18, 16, 4, 13, 2, 13, 6, 9],
[12, 11, 13, 2, 12, 9, 0, 17, 2, 11]])
Reshaping and transposing
data.reshape(2,3)) # data를 2*3 배열로 바꿈
data.T # 2*3을 3*2로 전환
Matrix operations
data.dot([])
np.matmul(data,weight)
data.sum(axis=0) #같은 행끼리 더함
data.sum(axis=1) #같은 열끼리 더함
data.max(axis=0) #같은 행 중에서 max
'대학교 > 데이터분석개론' 카테고리의 다른 글
5.2-Python Pandas_DataFrame (0) | 2020.06.12 |
---|---|
5-1.Python Pandas_Series (0) | 2020.06.12 |
4.Pyplot Visualization (0) | 2020.06.08 |
2.파이썬의 제어문, 함수 (0) | 2020.06.08 |
1. 파이썬의 자료구조 (0) | 2020.06.08 |