텐서플로 2.0 시작하기: 초보자용

AI를 이용하기 위해서 텐서플로를 사용하기로 결정하고 본격적으로 알아가보기로 합니다.

저는 AI를 이용한 주식투자에 관심이 있습니다. 

생각이 확장되는대로 한번 제가 공부해 가는 것을 여기에 올려가 보도록 하겠습니다.



텐서플로 2.0 시작하기: 초보자용

이걸 하려다 보니 일단 저는 환경이 윈도즈인데 WSL(윈도우에서 리눅스를 지원하는 환경)이 생겼고, 그 환경에서 텐서플로의 원활한 지원이 된다고 해서 먼저 WSL의 구축을 하였습니다. 저와는 다른 환경에 계신분들은 또 다른 방법으로 환경을 구축하시면 되겠습니다. 


이 짧은 소개 글은 Keras를 사용하여 다음을 수행합니다.

  1. 사전에 빌드한 데이터세트를 로드합니다.
  2. 이미지를 분류하는 신경망 머신 러닝 모델을 빌드합니다.
  3. 이 신경망을 훈련합니다.
  4. 모델의 정확도를 평가합니다.



TensorFlow 설정하기

시작하려면 TensorFlow를 프로그램으로 가져옵니다.

import tensorflow as tf
print("TensorFlow version:", tf.__version__)

각 명령문의 실행결과는 아래쪽 이미지에 다 올려놓았습니다. 

MNIST 데이터셋을 로드하여 준비합니다. 샘플 값을 정수에서 부동소수로 변환합니다:

참고: 자체 개발 환경을 사용하는 경우에 TensorFlow 2 패키지를 설치하려면 최신 pip로 업그레이드했는지 확인합니다. 자세한 내용은 설치 가이드를 참조합니다.

데이터세트 로드하기

MNIST 데이터세트를 로드하고 준비합니다. 샘플 데이터를 정수에서 부동 소수점 숫자로 변환합니다.

mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

머신 러닝 모델 빌드하기

층을 차례대로 쌓아 tf.keras.Sequential 모델을 만듭니다. 훈련에 사용할 옵티마이저(optimizer)와 손실 함수를 선택합니다:

모델의 구축에 대한 방법은 오늘 주제는 아닙니다. 오늘은 전반적으로 진행하는 방법에 대한 예시입니다.
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dense(10, activation='softmax')


각 예시에서 모델은 각 클래스에 대해 하나씩, logits 또는 log-odds 스코어 벡터를 반환합니다.


predictions = model(x_train[:1]).numpy()

tf.nn.softmax 함수는 다음과 같이 이러한 로짓을 각 클래스에 대한 확률로 변환합니다.


참고: tf.nn.softmax 함수를 네트워크의 마지막 레이어에 대한 활성화 함수로 베이킹할 수 있습니다. 이렇게 하면 모델 출력을 더 직접적으로 해석할 수 있지만 이 접근법은 소프트맥스 출력을 사용할 경우 모든 모델에 대해 정확하고 수치적으로 안정적인 손실 계산을 제공하는 것이 불가능하므로 권장하지 않습니다.

losses.SparseCategoricalCrossentropy를 사용하여 로짓의 벡터와 True 인덱스를 사용하고 각 예시에 대해 스칼라 손실을 반환하는 훈련용 손실 함수를 정의합니다.

loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)

이 손실은 실제 클래스의 음의 로그 확률과 같습니다. 모델이 올바른 클래스를 확신하는 경우 손실은 0입니다.

이 훈련되지 않은 모델은 무작위에 가까운 확률(각 클래스에 대해 1/10)을 제공하므로 초기 손실은 -tf.math.log(1/10) ~= 2.3에 근접해야 합니다.

loss_fn(y_train[:1], predictions).numpy()

훈련을 시작하기 전에 Keras Model.compile을 사용하여 모델을 구성하고 컴파일합니다. optimizer 클래스를 adam으로 설정하고 loss를 앞에서 정의한 loss_fn 함수로 설정합니다. metrics 매개변수를 accuracy로 설정하여 모델에 대해 평가할 메트릭을 지정합니다.


모델 훈련 및 평가하기

모델을 훈련하고 평가합니다:, y_train, epochs=5)

Model.evaluate 메서드는 일반적으로 "Validation-set" 또는 "Test-set"에서 모델 성능을 확인합니다.


훈련된 이미지 분류기는 이 데이터셋에서 약 98%의 정확도를 달성합니다.

모델이 확률을 반환하도록 하려면 다음과 같이 훈련된 모델을 래핑하고 여기에 소프트맥스를 첨부할 수 있습니다.

이곳에서 Keras API를 사용하는 사전에 빌드한 데이터세트를 사용하여 머신 러닝 모델을 훈련했습니다.


 위 코드를 실행하면 아래와 같이 나옵니다.



WSL 환경에서 실행한 결과

WINDOWS에서 WSL을 실행합니다. 

WSL의 설치와 실행은 아래를 참고하세요

이제 WSL을 실행합니다.

> WSL 환경에 파이썬을 설치합니다.

WSL 환경에 텐서플로를 설치합니다.

> 파이썬을 실행합니다.

one@DESKTOP-G28A5LG:/mnt/c/Users/boas9$ python3
Python 3.8.10 (default, Jun 22 2022, 20:18:18)
[GCC 9.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.


위 예제 문장들을 차례대로 실행하고 결과값을 확인합니다.

>>> import tensorflow as tf
2022-12-03 18:55:49.020539: I tensorflow/core/platform/] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 AVX512F AVX512_VNNI FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2022-12-03 18:55:49.132243: I tensorflow/core/util/] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2022-12-03 18:55:49.136025: W tensorflow/compiler/xla/stream_executor/platform/default/] Could not load dynamic library ''; dlerror: cannot open shared object file: No such file or directory
2022-12-03 18:55:49.136071: I tensorflow/compiler/xla/stream_executor/cuda/] Ignore above cudart dlerror if you do not have a GPU set up on your machine.
2022-12-03 18:55:49.739860: W tensorflow/compiler/xla/stream_executor/platform/default/] Could not load dynamic library ''; dlerror: cannot open shared object file: No such file or directory
2022-12-03 18:55:49.739943: W tensorflow/compiler/xla/stream_executor/platform/default/] Could not load dynamic library ''; dlerror: cannot open shared object file: No such file or directory
2022-12-03 18:55:49.739950: W tensorflow/compiler/tf2tensorrt/utils/] TF-TRT Warning: Cannot dlopen some TensorRT libraries. If you would like to use Nvidia GPU with TensorRT, please make sure the missing libraries mentioned above are installed properly.
>>> print("TensorFlow version:", tf.__version__)
TensorFlow version: 2.11.0
>>> mnist = tf.keras.datasets.mnist
>>> (x_train, y_train), (x_test, y_test) = mnist.load_data()
Downloading data from
11490434/11490434 [==============================] - 0s 0us/step
>>> x_train, x_test = x_train / 255.0, x_test / 255.0
>>> model = tf.keras.models.Sequential([
...   tf.keras.layers.Flatten(input_shape=(28, 28)),
...   tf.keras.layers.Dense(128, activation='relu'),
...   tf.keras.layers.Dropout(0.2),
...   tf.keras.layers.Dense(10, activation='softmax')
... ])
2022-12-03 19:06:19.863517: W tensorflow/compiler/xla/stream_executor/platform/default/] Could not load dynamic library ''; dlerror: cannot open shared object file: No such file or directory
2022-12-03 19:06:19.863564: W tensorflow/compiler/xla/stream_executor/cuda/] failed call to cuInit: UNKNOWN ERROR (303)
2022-12-03 19:06:19.863579: I tensorflow/compiler/xla/stream_executor/cuda/] kernel driver does not appear to be running on this host (DESKTOP-G28A5LG): /proc/driver/nvidia/version does not exist
2022-12-03 19:06:19.863798: I tensorflow/core/platform/] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 AVX512F AVX512_VNNI FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
>>> model.compile(optimizer='adam',
...               loss='sparse_categorical_crossentropy',
...               metrics=['accuracy'])
>>>, y_train, epochs=5)
Epoch 1/5
1875/1875 [==============================] - 5s 2ms/step - loss: 0.2943 - accuracy: 0.9144
Epoch 2/5
1875/1875 [==============================] - 5s 2ms/step - loss: 0.1424 - accuracy: 0.9574
Epoch 3/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.1085 - accuracy: 0.9665
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.0895 - accuracy: 0.9718
Epoch 5/5
1875/1875 [==============================] - 5s 3ms/step - loss: 0.0753 - accuracy: 0.9759
<keras.callbacks.History object at 0x7fe6ac7e42e0>
>>>, y_train, epochs=5)
.evaluate(x_test,  y_test, verbose=2)Epoch 1/5
1875/1875 [==============================] - 5s 3ms/step - loss: 0.0657 - accuracy: 0.9792
Epoch 2/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.0589 - accuracy: 0.9809
Epoch 3/5
1875/1875 [==============================] - 5s 3ms/step - loss: 0.0536 - accuracy: 0.9826
Epoch 4/5
1875/1875 [==============================] - 5s 3ms/step - loss: 0.0494 - accuracy: 0.9837
Epoch 5/5
1875/1875 [==============================] - 5s 3ms/step - loss: 0.0448 - accuracy: 0.9852
<keras.callbacks.History object at 0x7fe6584afc10>
>>> model.evaluate(x_test,  y_test, verbose=2)
313/313 - 1s - loss: 0.0738 - accuracy: 0.9785 - 503ms/epoch - 2ms/step
[0.07380447536706924, 0.9785000085830688]
>>> probability_model = tf.keras.Sequential([
...   model,
...   tf.keras.layers.Softmax()
... ])
>>> probability_model(x_test[:5])
<tf.Tensor: shape=(5, 10), dtype=float32, numpy=
array([[0.08533678, 0.08533677, 0.08533684, 0.08533688, 0.08533677,
        0.08533677, 0.08533677, 0.23196891, 0.08533677, 0.08533679],
       [0.08533682, 0.08533734, 0.23196809, 0.08533682, 0.08533682,
        0.08533682, 0.08533682, 0.08533682, 0.08533682, 0.08533682],
       [0.08534653, 0.2318142 , 0.08534732, 0.08534654, 0.08534744,
        0.08534654, 0.08534655, 0.08541019, 0.08534808, 0.08534655],
       [0.231831  , 0.08534548, 0.0854026 , 0.08534565, 0.08534549,
        0.08534551, 0.08534762, 0.08534563, 0.08534551, 0.08534557],
       [0.08533975, 0.08533959, 0.08533959, 0.08533959, 0.2319243 ,
        0.08533959, 0.0853396 , 0.08534116, 0.08533959, 0.08535728]],

여러분의 발전을 기원합니다. 
