2.2. 텐서플로(Tensorflow)

텐서플로우[TensorFlow]는 구글에서 개발했으며 2015년 오픈 소스로 공개됐습니다. 2세대 머신러닝 시스템으로도 불리는 텐서플로우는 파이썬[Python] 기반 라이브러리로 여러 CPU 및 GPU와 모든 플랫폼, 데스크톱 및 모바일에서 사용할 수 있습니다.

텐서플로(TensorFlow)는 안드로이드와 iOS같은 모바일 환경은 물론 64비트 리눅스, MacOS 의 데스크탑이나 서버 시스템의 여러 개의 CPU와 GPU에서 구동될 수 있습니다. 텐서플로 연산은 상태를 가지는 데이터 흐름(stateful dataflow) 그래프로 표현됩니다. 또한 C++ 과 R 과 같은 다른 언어도 지원하며 딥러닝 모델을 직접 작성하거나 케라스(keras)와 같은 래퍼 라이브러리를 사용하여 직접 작성할 수 있습니다. 지금 텐서플로는 독자적인 생태계를 갖출 정도로 발전했습니다. 텐서플로 전문 블로거도 나오고, 텐서플로를 테마로 한 사용자 커뮤티들도 생겨났습니다. 따라서 학습 자원도 많고 튜토리얼도 풍부합니다. 텐서플로 사이트(https://www.tensorflow.org/)에만 들어가도 충분한 정보를 얻을 수 있습니다.

Tensor = Multidimensional Arrays = Data 딥러닝에서 텐서는 데이터를 의미합니다. 다차원 배열로 나타내는 데이터입니다. 플로는 데이터의 흐름을 의미합니다. 텐서플로우에서 계산은 데이터 플로우 그래프(dataflow graph)로 행해집니다.

텐서플로우는 여러 머신러닝 프레임워크와 경쟁합니다. 파이토치(PyTorch), CNTK, MXNet은 텐서플로우와 상당 부분 용도가 비슷한 주요 경쟁 프레임워크입니다. 그러나 텐서플로는 다양한 커뮤니티를 지원하고 있어 다른 딥러닝 프레임워크보다 인기가 있습니다. 커뮤니티가 활성화되어 있으면 실무에 적용했을 때 생기는 문제점들을 해결하거나, 라이브러리 자체에 버그가 있을 때 얼마나 빠르게 수정되는가 하는 그런 요인들이 실무를 하는 엔지니어에게는 가장 중요한 부분이라고 할 수 있을 것입니다. 그런 점에 있어 현존하는 머신러닝 라이브러리 중 커뮤니티가 가장 북적이는 것이 바로 텐서플로 입니다. 깃허브의 텐서플로 저장소나 각종 애플리케이션, 클라우드 서비스 등은 물론, 새로운 논문이 나올 때마다 텐서플로로 구현된 버전이 가장 먼저 나올 정도로 텐서플로 커뮤니티는 놀라울 만큼 활발하게 움직이고 있습니다.

텐서플로우는 크게 2가지 유형의 버전으로 제공됩니다.

CPU만을 지원하는 버전

만약 NVIDIA의 GPU를 사용하고 있지 않을 경우 반드시 CPU만 지원하는 버전으로 설치하셔야 합니다. GPU를 지원하는 텐서플로우 보다 설치하기 쉽다는 장점이 있어, 처음 텐서플로우를 설치하는 경우 CPU만 지원되는 버전을 추천합니다.

GPU를 함께 지원하는 버전

NVIDIA GPU를 지원하는 버전의 경우 CPU에서 실행되는 버전보다 월등히 빠른 성능을 나타낸다. 따라서, 텐서플로우를 실행하기 위한 사양의 NVIDIA GPU를 갖고 계신 경우 GPU를 지원하는 버전으로 설치해야 보다 빠르게 처리 할 수 있습니다. CPU만 지원하는 텐서플로우 버전보다 성능차이가 크기 때문에 궁극적으로는 GPU를 지원하는 버전으로 사용하는 것이 좋습니다.

NVIDIA GPU에서 지원되는 Compute capability는 아래의 페이지에서 확인 하실 수 있습니다.

https://developer.nvidia.com/cuda-gpus

Tensorflow는 구글에서 상업적 지원은 하지 않고 있으며, 앞으로도 계획은 없다고 합니다. 그리고 사전 학습 모델이 많지 않다는 단점이 있으며, 다른 딥러닝 프레임워크보다 늦게 개발되었기 때문에 아직 다양한 플랫폼에서의 최적화가 부족한 경우가 있습니다.

2019년 10월에 Tensorflow 2.0 발표되었습니다. 업데이트 스크립트로 1.x 에서 2.x 로 Conversion 가능합니다.

Last updated