4.1 NumPy

Numpy는 파이썬이 계산과학분야에 이용될때 핵심 역할을 하는 라이브러리입니다. Numpy는 고성능의 다차원 배열 객체와 이를 다룰 도구를 제공합니다.

NumPy는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리입니다. NumPy는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공합니다.

파이썬으로 수치해석, 통계 관련 기능을 구현하려고 할 때 Numpy는 가장 기본이 되는 모듈입니다. 그만큼 Numpy는 수치해석/ 통계 관련 작업시 중요한 역할을 하므로, 파이썬으로 관련 분야에 도전하고자 한다면 반드시 이에 대한 기초를 잘 쌓아 두고 가야 합니다.

NumPy의 주요 객체는 동일한 자료형의 다차원 배열입니다. NumPy의 차원은 축(axes)이라 합니다.

Numpy 배열은 동일한 자료형을 가지는 값들이 격자판 형태로 있는 것입니다. 각각의 값들은 튜플(이때 튜플은 양의 정수만을 요소값으로 갖습니다.) 형태로 색인 됩니다. rank는 배열이 몇 차원인지를 의미합니다; shape는 는 각 차원의 크기를 알려주는 정수들이 모인 튜플입니다.

파이썬의 리스트를 중첩해 Numpy 배열을 초기화 할 수 있고, 대괄호를 통해 각 요소에 접근할 수 있습니다:

예를 들어 아래 예제에서 배열에는 2 개의 축이 있습니다. 첫 번째 축은 길이가 2이고 두 번째 축은 길이가 3이 됩니다.

[[ 1., 0., 0.],
 [ 0., 1., 2.]]

NumPy의 배열 클래스를 ndarray라고 하며 그냥 array 라고도 합니다. numpy.array는 표준 Python 라이브러리 클래스인 array.array와 다릅니다. array.array는 일차원 배열 만 처리하고 기능이 별로 없습니다.

NumPy는 “Numerical Python“의 약자로 대규모 다차원 배열과 행렬 연산에 필요한 다양한 함수를 제공합니다. NumPy에 포함된 함수들은 다음과 같습니다.

  • zeros(int): int 개수만큼의 0으로 이루어진 array를 만들어 줍니다. Np.zeors(10)은 (10,) 형태의 0으로 이루어진 벡터를 생성합니다. 만약 특정한 형상으로 만들길 원한다면 뒤에 .reshape(x,y..)를 더하면 됩니다.

  • arange(): 흔히 쓰이는 range 함수와 유사합니다. 범위와 간격 설정이 가능. 원하는 범위의 어레이를 만들 수 있습니다. 형태와 차원을 원하는 대로 설정하고 싶으면 .reshape()를 쓰자.

  • shape: 어떤 어레이 뒤에 이걸 붙이면 그 어레이의 형상을 출력합니다. 각 차원의 배열 크기를 나타내는 정수의 튜플입니다. n 행과 m 열이 있는 행렬의 경우 shape는 (n, m)이 됩니다.

  • ndarray.ndim: 배열의 축(axe)수 (차원)

  • ndarray.dtype : 배열 내의 요소의 형태를 기술합니다. 표준 파이썬 유형을 사용하여 dtype을 만들거나 지정할 수 있습니다.

  • ndarray.itemsize: 배열의 각 요소의 바이트 단위의 사이즈.

  • ndarray.data: 배열의 실제의 요소를 포함한 버퍼. 일반적으로 색인화 기능을 사용하여 배열의 요소에 액세스하기 때문에 이 속성을 사용할 필요가 없다.

  • size: 차원 정보는 없이 원소의 개수만을 출력합니다.

  • argmax(): 입력 값으로 들어온 매트릭스의 각 행/열별 최댓값의 인덱스를 산출합니다. Axis = 를 추가하면 열별(0) 혹은 행별(1) 최댓값 위치를 알 수 있습니다.

  • T: 벡터의 전치(transpose)를 수행합니다. 단 1차원 어레이는 상황에 따라 행백터 혹은 열벡터로 바뀌므로 굳이 T를 붙일 이유는 없다.

 import numpy as np
 a = np.arange(15).reshape(3, 5)
 print(a)
 print(a.shape)
 print(a.ndim)
 print(a.dtype.name)
 print(a.itemsize)
 print(a.size)
 print(type(a))

 b = np.array([6, 7, 8])
 print(b)
 print(type(b))

위의 코드를 실행하면 다음과 같은 결과를 출력합니다.

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
(3, 5)
2
int32
4
15
<class 'numpy.ndarray'>
[6 7 8]
<class 'numpy.ndarray'>

참조 사이트 : https://docs.scipy.org/doc/numpy/user/quickstart.html

Last updated