01. ์ค์ต ํ๊ฒฝ ์ค๋นํ๊ธฐ
01. ์ค์ต ํ๊ฒฝ ์ค๋นํ๊ธฐ ๊ด๋ จ
01. ์๋์ฝ๋ค์ Colab
๋จธ์ ๋ฌ๋ ์ค์ต์ ํ๊ธฐ ์ํด์๋ ๋ง์ ํจํค์ง๊ฐ ํ์ํฉ๋๋ค. ์ด๋ฅผ ์ผ์ผํ ์ค์นํ๋ ๊ฒ๋ณด๋ค๋ ํ์ํ ํจํค์ง๋ค์ ๋ชจ์๋์ ํ์ด์ฌ ๋ฐฐํฌํ '์๋์ฝ๋ค'๋ฅผ ์ค์นํ๋ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค. ์๋์ฝ๋ค๋ Numpy, Pandas, Jupyter Notebook, IPython, scikit-learn, matplotlib, seaborn, nltk ๋ฑ ์ด ์ฑ ์์ ์ฌ์ฉํ ๋๋ถ๋ถ์ ํจํค์ง๋ฅผ ์ ๋ถ ํฌํจํ๊ณ ์์ต๋๋ค.
์ฌ๊ธฐ์๋ ์๋์ฐ ํ๊ฒฝ์ ๊ธฐ์ค์ผ๋ก ๋๊ณ ์๋์ฝ๋ค๋ฅผ ์ค์นํ๋ ๋ฐฉ๋ฒ๊ณผ ์ธํฐ๋ท์ ํตํด ํธํ๊ฒ ์ฌ์ฉํ ์ ์๋ ํ์ด์ฌ ์ค์ต ํ๊ฒฝ์ธ ๊ตฌ๊ธ์ ์ฝ๋ฉ(Colab)์ ์๊ฐํฉ๋๋ค.
์๋์ฝ๋ค(Anaconda) ์ค์น
๐๋งํฌ: https://www.anaconda.com/distribution/
์ ์ฌ์ดํธ ๋งํฌ๋ก ์ด๋ํ์ฌ ์ฌ์ดํธ ํ๋จ์ผ๋ก ์ด๋ํ๋ฉด (์ ์๊ฐ ์ด ์ฑ ์ ์์ฑํ ๋น์ ๊ธฐ์ค) ์ข์ธก์ ํ์ด์ฌ 3.7 ๋ฒ์ ๊ณผ ์ฐ์ธก์ ํ์ด์ฌ 2.7 ๋ฒ์ ์ ์๋์ฝ๋ค ์ค์น ํ์ผ์ด ์์ต๋๋ค. ์ฌ๊ธฐ์๋ ํ์ด์ฌ 3.7 ๋ฒ์ 64 ๋นํธ๋ฅผ ์ค์นํฉ๋๋ค.
์ค์น ํ์ผ์ ์คํํ ํ์ ๋ค๋ฅธ ์๋์ฐ ํ๋ก๊ทธ๋จ์ ์ค์นํ๋ ๊ฒ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก Next >
๋ฅผ ๋๋ฅด๋ฉด์ ์ค์น๋ฅผ ์๋ฃํ๋ฉด ๋ฉ๋๋ค. ์๋์ฝ๋ค๋ฅผ ์ค์นํ๋ฉด ๋จธ์ ๋ฌ๋์ ์ํ ๊ธฐ๋ณธ์ ์ธ ํ์ด์ฌ ํจํค์ง๋ค์ ์๋์ผ๋ก ์ค์น๊ฐ ๋ฉ๋๋ค. ๋ค๋ง ํ
์ํ๋ก์ฐ, ์ผ๋ผ์ค, ์ ์ฌ, ์ฝ์์ํ์ด์ ๊ฐ์ ํจํค์ง๋ค์ ๋ณ๋ ์ค์น๊ฐ ํ์ํ๋ฐ ์ด์ ๋ํด์๋ ๋ค์์ ์ถ๊ฐ์ ์ผ๋ก ์ค๋ช
ํ๊ฒ ์ต๋๋ค.
์๋์ฝ๋ค๋ฅผ ๋ค ์ค์นํ๋ค๋ฉด ์๋์ฝ๋ค ํ๋กฌํํธ๋ฅผ ์คํํ๊ฒ ์ต๋๋ค.
์๋์ฝ๋ค ํ๋กฌํํธ๋ฅผ ์ด์๋ค๋ฉด ์๋์ฝ๋ค ํ๋กฌํํธ์ ์๋์ ์ปค๋งจ๋๋ฅผ ์ ๋ ฅํ์ฌ ์๋์ฝ๋ค ํ์ด์ฌ ํจํค์ง๋ฅผ ์ ๋ถ ์ต์ ๋ฒ์ ์ผ๋ก ์ ๋ฐ์ดํธ ํฉ๋๋ค.
conda update -n base conda
conda update --all
์ด ์ฑ ์ด ์์ฑ๋์์ ๋น์์๋ ํ์ด์ฌ 3.7 ๋ฒ์ ์ด ์ต์ ๋ฒ์ ์ด์์ง๋ง, ๋ ์๋ถ๋ค์ด ํ์ด์ฌ์ ์ค์นํ๊ธฐ ์ํด์ ์๋์ฝ๋ค ํ์ด์ง์ ์ ์ํ์์ ๋๋ 3.7๋ณด๋ค ๋์ฑ ์ต์ ๋ฒ์ ์ผ๋ก ์ ๋ฐ์ดํธ๊ฐ ๋์์ ์ ์์ต๋๋ค. ์ด ๊ฒฝ์ฐ ๋ฌด์์ ํ์ด์ฌ ์ต์ ๋ฒ์ ์ ์ค์นํ๋ ๊ฒ์ ์ข์ ๋ฐฉ๋ฒ์ด ์๋๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์๋์ ๋งํฌ์์ ํ์ด์ฌ ๋ฒ์ ๊ณผ ํธํ๋๋ ํ ์ํ๋ก์ฐ ๋ฒ์ ์ ๋ํ ์๋ด๊ฐ ๋์์์ผ๋ ๋ฐ๋์ ์ค์น ์ ํ์ธ์ด ํ์ํฉ๋๋ค.
๐๋งํฌ: https://www.tensorflow.org/install/pip?hl=ko
์๋ฅผ ๋ค์ด ์ ํ์ด์ง์์ 'Python 3.9 ์ง์์๋ Tensorflow 2.5 ์ด์์ด ํ์ํฉ๋๋ค.' ๋ผ๊ณ ๊ธฐ์ฌ๋์ด์ ธ ์๋ค๋ฉด, ํ์ด์ฌ 3.9๋ฅผ ์ค์นํ์์ ๋๋ ๋ฐ๋์ Tensorflow๋ 2.5 ์ด์์ ์ค์นํด์ผ๋ง ํฉ๋๋ค.
๊ตฌ๊ธ์ ์ฝ๋ฉ(Colab)
ํ ์ํ๋ก์ฐ๋ ๊ธฐ๋ณธ์ ์ผ๋ก 64๋นํธ ํ๋ซํผ๋ง์ ์ง์ํ๋ฏ๋ก 32๋นํธ ํ๊ฒฝ์์๋ ๋ฅ ๋ฌ๋ ์ค์ต ํ๊ฒฝ์ ๊ตฌ์ถํ๊ธฐ์๋ ๋ง์ ์ ๋ก ์ฌํญ์ด ์์ต๋๋ค. ๋๋ ๊ฐ์ธ์ ์ปดํจํฐ ์ฌ์์ด๋ ๋ค๋ฅธ ์ด์ ๋ก ์๋์ฝ๋ค๋ ์ฌ๋ฌ ํจํค์ง ์ค์น๊ฐ ์ด๋ ค์ด ๊ฒฝ์ฐ๋ ์์ ๊ฒ์ ๋๋ค. ์ด๋ฐ ๊ฒฝ์ฐ์๋ ์ธํฐ๋ท๋ง ๋๋ค๋ฉด ๋ฐ๋ก ํ์ด์ฌ์ ์ค์ตํ ์ ์๋ ๊ตฌ๊ธ์ ์ฝ๋ฉ(Colab)์ด ์์ต๋๋ค. ๊ตฌ๊ธ์ Colab์ ๋ค์์ ์ค๋ช ํ๊ฒ ๋ '์ฃผํผํฐ ๋ ธํธ๋ถ'๊ณผ ๋งค์ฐ ์ ์ฌํ ์ค์ต ํ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
Colab ์ฃผ์: https://colab.research.google.com
๊ตฌ๊ธ์ Colab์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ ์์ URL์ ํตํด์ ์ ์ํ๊ฑฐ๋, ๊ตฌ๊ธ http://www.google.co.kr์์ Colab์ด๋ผ๊ณ ๊ฒ์ํด์ ์ ์ํ ์ ์์ต๋๋ค.
A. ํ์ด์ฌ ์ค์ตํ๊ธฐ
Colab ์ฌ์ฉ ์์๋ ๊ตฌ๊ธ ๊ณ์ ์ด ํ์ํ๋ฏ๋ก ๊ตฌ๊ธ ์์ด๋๊ฐ ์์ผ์ ๋ถ๋ค์ ๋จผ์ ํ์๊ฐ์ ํ ๋ก๊ทธ์ธ๋ถํฐ ํด์ฃผ์ธ์.
๋ก๊ทธ์ธ ํ ์ข์ธก ์๋จ์์ ํ์ผ > ์ ๋
ธํธ
๋ฅผ ํด๋ฆญํฉ๋๋ค. ์กฐ๊ธ๋ง ๊ธฐ๋ค๋ฆฌ๋ฉด ํ์ด์ฌ์ ์ค์ตํ ์ ์๋ ์ค์ต ํ๊ฒฝ ์ฐฝ์ด ๋จ๊ฒ ๋ฉ๋๋ค.
์ด๋ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด Colab์์ ์ฝ๋๋ฅผ ์์ฑํ๋ ๋ถ๋ถ์ ๋จ์๋ฅผ '์ '์ด๋ผ๊ณ ํฉ๋๋ค. ๊ทธ๋ฆผ์์ ๋ณด์ด๋ ์ข์ธก ์๋จ์ '+ ์ฝ๋' ๋ฒํผ์ ํด๋ฆญํ์ฌ ์๋ก์ด ์ ์ ์ถ๊ฐํ ์ ์์ผ๋ฉฐ, ์ ์์ ์ฝ๋๋ฅผ ์์ฑํ๊ณ Shift+Enterํค๋ฅผ ๋๋ฌ์ ์ฝ๋๋ฅผ ์คํํ ์ ์์ต๋๋ค.
์
์ 3 + 5
๋ผ๋ ์ฝ๋๋ฅผ ์์ฑํ๊ณ , Shift+Enter๋ฅผ ๋๋ฅด๋ฉด 8์ด๋ผ๋ ๊ฒฐ๊ณผ๊ฐ ๋์ค๊ฒ ๋ฉ๋๋ค. ์ข์ธก์ [1]์ ํด๋น ์ฝ๋๊ฐ ๋ช ๋ฒ์งธ๋ก ์คํ๋์๋์ง๋ฅผ ์๋ฏธํฉ๋๋ค. ์
์ ์ถ๊ฐํด๋ณด๋ฉด์ ๋ค๋ฅธ ํ์ด์ฌ ์ฝ๋๋ ์ถ๊ฐ์ ์ผ๋ก ์์ฑํด๋ณด์ธ์.
B. ๋ฌด๋ฃ๋ก GPU ์ฌ์ฉํ๊ธฐ
๋ฅ ๋ฌ๋์์๋ CPU๋ณด๋ค๋ GPU๋ฅผ ์ฌ์ฉํฉ๋๋ค. Colab์์ ์ค์ตํ ๋์ ์ฅ์ ์ GPU๋ฅผ ๋ฌด๋ฃ๋ก ์ฌ์ฉํ ์ ์๋ค๋ ์ ์ ๋๋ค. GPU๊ฐ ์ฅ์ฐฉ๋ ์ปดํจํฐ๊ฐ ์๋ ๋ฅ ๋ฌ๋ ์ ๋ฌธ์๋ค์ ํฅํ ์ด ์ฑ ์ ์ค์ต์ ์งํํ ๋ Colab์์ GPU๋ฅผ ์ฌ์ฉํ๋ฉด์ ๋ฅ ๋ฌ๋์ ๊ณต๋ถํ๋ ๊ฒ์ ๊ฐํ๊ฒ ๊ถ์ฅ๋๋ฆฝ๋๋ค. GPU๋ฅผ ์ฌ์ฉํ์ง ์๊ณ ์ค์ต์ ์งํํ๋ฉด ๋ฅ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ตํ๋ ์๊ฐ์ด ์ง๋์น๊ฒ ์์๋ ์ ์์ต๋๋ค.
Colab์์ GPU๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ ๋
ธํธ์ ์ง์
ํ์ ๋ ์๋จ์์ ๋ฐํ์ > ๋ฐํ์ ์ ํ ๋ณ๊ฒฝ
์ ํด๋ฆญํฉ๋๋ค.
๋
ธํธ ์ค์ ์ ํ๋์จ์ด ๊ฐ์๊ธฐ > GPU
๋ฅผ ์ ํ ํ ์ ์ฅ์ ๋๋ฆ
๋๋ค. ์ดํ ์ค์ต์ ์งํํฉ๋๋ค.
C. ํ์ผ ์ ๋ก๋
๊ตฌ๊ธ์ Colab์์ ๋ฐ์ดํฐ๋ฅผ ์
๋ก๋ํ์ฌ ํด๋น ๋ฐ์ดํฐ๋ก ์ค์ต์ ํ๊ณ ์ ํ๋ค๋ฉด, ์ข์ธก ์๋จ์์ ํด๋ ๋ชจ์์ ๋ฒํผ์ ํด๋ฆญํฉ๋๋ค. ๊ทธ ํ ์ ๋ฐฉํฅ์ ํ์ดํ(โ)๊ฐ ๊ทธ๋ ค์ง ๋ฒํผ์ ํด๋ฆญํ์ฌ ํ์ผ์ ์
๋ก๋ ํ ์ ์์ต๋๋ค. ์ ๊ทธ๋ฆผ์์ ์ซ์ 1๋ฒ ๋ฒํผ๊ณผ ์ซ์ 2๋ฒ ๋ฒํผ์ด ๊ฐ๊ฐ ์ด์ ํด๋นํฉ๋๋ค. ์๋ฅผ ๋ค์ด test.txt
ํ์ผ์ ์
๋ก๋ํ๋ค๊ณ ํด๋ด
์๋ค.
์
๋ก๋ ํ์๋ ํ์ผ ๋ชฉ๋ก์ test.txt
ํ์ผ์ด ๋ณด์
๋๋ค.
์ฝ๋ฉ์ ์ฌ์ฉ๋ฒ์ ์๋ ๋์์์์ ๋ฐฐ์ธ ์ ์์ต๋๋ค.
์ฝ๋ฉ์ ์ฌ์ฉ๋ฒ์ ์ค๋ช ํ๋ ๊นํ์๋ ๋ธ๋ก๊ทธ์ ๊ฒ์๋ฌผ๋ ์ถ์ฒํฉ๋๋ค.
์ฝ๋ฉ์์ ํ์ผ์ ์ ๋ก๋, ๋ค์ด๋ก๋ ํ๋ ๋ฐฉ๋ฒ์ ์๋ ๊ฒ์๋ฌผ์ ์ถ์ฒํฉ๋๋ค.
02. ํ์ ํ๋ ์์ํฌ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
์๋์ฝ๋ค๋ฅผ ์ค์นํ๋ค๋ฉด ๊ธฐ๋ณธ์ ์ผ๋ก Numpy, Pandas, Jupyter notebook, scikit-learn, matplotlib, seaborn, nltk ๋ฑ์ด ์ด๋ฏธ ์ค์น๋์ด์ ธ ์์ต๋๋ค. ๊ทธ๋์ ์๋์ฝ๋ค์ ํฌํจ๋์ด์์ง ์์ tensorflow, keras, gensim๊ณผ ๊ฐ์ ํจํค์ง๋ง ๋ณ๋๋ก pip๋ฅผ ํตํด ์ค์นํฉ๋๋ค.
ํ์ง๋ง ์ปดํจํฐ์ ์๋์ฝ๋ค๋ฅผ ์ค์นํ์ง ์๊ณ ๋จ์ํ ํ์ด์ฌ๋ง ์ค์น๋ ์ํ๋ผ๋ฉด ์์์ ์ธ๊ธํ ๋ชจ๋ ํจํค์ง๋ฅผ pip๋ก ์ค์นํด์ผ ํฉ๋๋ค. ์ฌ๊ธฐ์๋ ์๋์ฐ ํ๊ฒฝ์ ๊ธฐ์ค์ผ๋ก ์ค๋ช ํฉ๋๋ค.
ํ ์ํ๋ก์ฐ(Tensorflow)
ํ ์ํ๋ก์ฐ๋ ๊ตฌ๊ธ์ด 2015๋ ์ ๊ณต๊ฐํ ๋จธ์ ๋ฌ๋ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ ๋ฌ๋์ ์ง๊ด์ ์ด๊ณ ์์ฝ๊ฒ ํ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค. ๋ค์ ๋ฅ ๋ฌ๋ ์ค์ต์ ์ํด์ ํ ์ํ๋ก์ฐ๋ฅผ ์ค์นํด์ผ ํฉ๋๋ค.
์๋์ฝ๋ค ํ๋กฌํํธ(Anaconda Prompt) ๋๋ ๋ช ๋ น ํ๋กฌํํธ๋ฅผ ํตํด์ ์ค์นํ ์ ์์ต๋๋ค. ์๋์ฝ๋ค ํ๋กฌํํธ๋ฅผ ์ด์๋ค๋ฉด ์๋์ฝ๋ค ํ๋กฌํํธ์ ์๋์ ์ปค๋งจ๋๋ฅผ ์ ๋ ฅํ์ฌ ํ ์ํ๋ก์ฐ๋ฅผ ์ค์นํฉ๋๋ค.
pip install tensorflow
์ด์ ipython ์์ ์คํํ์ฌ ํ ์ํ๋ก์ฐ๊ฐ ์ ์ ์ค์น๋์๋์ง ํ์ธํ๋ ์๋ฏธ์์ ํ ์ํ๋ก์ฐ๋ฅผ ์ํฌํธํ๊ณ ๋ฒ์ ์ ํ์ธํฉ๋๋ค.
# > ipython
# ...
import tensorflow as tf
tf.__version__
# '2.0.0'
ํ ์ํ๋ก์ฐ 2.0์ด ์ค์น๋์์ต๋๋ค. ์ดํด๋ฅผ ๋๊ธฐ ์ํด ์ ์ปดํจํฐ ํ๋ฉด์ ์คํฌ๋ฆฐ์ท์ ์๋์ ์ฒจ๋ถํ์์ต๋๋ค.
์์ ๋์ฌ๋๋ exit
๋ผ๋ ์ปค๋งจ๋๋ก ๋์ฌ ์ ์์ต๋๋ค. ๋ค๋ฅธ ํจํค์ง๋ค๋ ๋์ผํ ๋ฐฉ์์ผ๋ก ์ค์น ๋ฐ ์ ์์ ์ผ๋ก ์ค์น๊ฐ ๋์๋์ง ๋ฒ์ ์ ํ์ธํ๋ฉด ๋ฉ๋๋ค. ์์ผ๋ก ์ ์๊ฐ ๊ฐ ํจํค์ง์ ๋ฒ์ ๋ค์ ๊ธฐ์ฌํ๋ ์ด์ ๋ ์ ์๊ฐ ํด๋น ๋ฒ์ ์ผ๋ก ์ค์ตํ์ผ๋ฏ๋ก ์ฐธ๊ณ ํ๋ผ๋ ์๋ฏธ์์ ๊ณต๊ฐํ๋ ๊ฒ์ด์ง, ๋
์๊ฐ ๋ ๋์ ๋ฒ์ ์์๋ ์ ์๊ฐ ๊ณต๊ฐํ ๋ฒ์ ๋ค๊ณผ ๋์ผํด์ผ ํ๋ค๋ ์๋ฏธ๋ ์๋๋๋ค.
ํ ์ํ๋ก์ฐ๋ ์ฃผ๋ก tf๋ผ๋ ๋ช ์นญ์ผ๋ก ์ํฌํธํ๋ ๊ฒ์ด ๊ด๋ก์ ๋๋ค.
์ผ๋ผ์ค(Keras)
์ผ๋ผ์ค(Keras)๋ ๋ฅ ๋ฌ๋ ํ๋ ์์ํฌ์ธ ํ ์ํ๋ก์ฐ์ ๋ํ ์ถ์ํ ๋ API๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ผ๋ผ์ค๋ ๋ฐฑ์๋๋ก ํ ์ํ๋ก์ฐ๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์ข ๋ ์ฝ๊ฒ ๋ฅ ๋ฌ๋์ ์ฌ์ฉํ ์ ์๊ฒ ํด์ค๋๋ค. ์ฝ๊ฒ ๋งํด, ํ ์ํ๋ก์ฐ ์ฝ๋๋ฅผ ํจ์ฌ ๊ฐ๋จํ๊ฒ ์์ฑํ ์ ์์ต๋๋ค.
pip install keras
์ผ๋ผ์ค๋ฅผ ์ค์น ํ์ ์ฌ์ฉํ ์๋ ์์ง๋ง, ํ
์ํ๋ก์ฐ์์ ์ผ๋ผ์ค๋ฅผ ์ฌ์ฉํ ์๋ ์์ต๋๋ค. ์์ด ์ปค๋ฎค๋ํฐ์์๋ ์์ ์ผ๋ผ์ค๋ฅผ keras๋ผ๊ณ ํ๊ธฐํ๋ค๋ฉด, ํ
์ํ๋ก์ฐ์์ ์ผ๋ผ์ค API๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๋ tf.keras
๋ผ๊ณ ํ๊ธฐํฉ๋๋ค. ์ด ๋ ๊ฐ์ง๋ ์ค์ ๋ก ๋ฌธ๋ฒ๋ ๋ง์ ๋ฉด์์ ๊ฐ์์ keras ์ฝ๋๋ฅผ tf.keras
๋ก ๋ณ๊ฒฝํ๋ ๊ฑด ์์ฃผ ์ฝ๊ณ , keras๋ฅผ ํ์ตํ์๋ค๋ฉด tf.keras
๋ ๊ธ๋ฐฉ ์ต์ํ๊ฒ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ผ๋ผ์ค ๊ฐ๋ฐ์์ธ ํ๋์์ ์๋ (Franรงois Chollet)๋ ์์ผ๋ก๋ keras๋ณด๋ค๋ tf.keras
๋ฅผ ์ฌ์ฉํ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค. ์ด ์ฑ
์์๋ ์ฃผ๋ก tf.keras
๋ฅผ ์ฌ์ฉํฉ๋๋ค.
# > ipython
# ...
import keras
keras.__version__
# '2.3.1'
์ ์ฌ(Gensim)
์ ์ฌ(Gensim)์ ๋จธ์ ๋ฌ๋์ ์ฌ์ฉํ์ฌ ํ ํฝ ๋ชจ๋ธ๋ง๊ณผ ์์ฐ์ด ์ฒ๋ฆฌ ๋ฑ์ ์ํํ ์ ์๊ฒ ํด์ฃผ๋ ์คํ ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ์ด ์ฑ ์์๋ ์ ์ฌ์ ์ฌ์ฉํ์ฌ Word2Vec ๋ฑ ๋ค์ํ ๋ชจ๋ธ๋ค์ ํ์ตํด๋ณผ ๊ฒ์ ๋๋ค.
pip install gensim
# > ipython
# ...
import gensim
gensim.__version__
# '3.8.1'
์ฌ์ดํท๋ฐ(Scikit-learn)
์ฌ์ดํท๋ฐ(Scikit-learn)์ ํ์ด์ฌ ๋จธ์ ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ์ฌ์ดํท๋ฐ์ ํตํด ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ, ์ํฌํธ ๋ฒกํฐ ๋จธ์ ๋ฑ ๋ค์ํ ๋จธ์ ๋ฌ๋ ๋ชจ๋์ ๋ถ๋ฌ์ฌ ์ ์์ต๋๋ค. ๋ํ, ์ฌ์ดํท๋ฐ์๋ ๋จธ์ ๋ฌ๋์ ์ฐ์ตํ๊ธฐ ์ํ ์์ด๋ฆฌ์ค ๋ฐ์ดํฐ, ๋น๋จ๋ณ ๋ฐ์ดํฐ ๋ฑ ์์ฒด ๋ฐ์ดํฐ ๋ํ ์ ๊ณตํ๊ณ ์์ต๋๋ค. ์ฌ์ดํท๋ฐ์ ์ ํจํค์ง๋ค๊ณผ ๋ฌ๋ฆฌ ์๋์ฝ๋ค๋ก ์๋ ์ค์น๋์ง๋ง ์๋์ฝ๋ค๋ฅผ ์ค์นํ์ง ์์๋ค๋ฉด ์๋์ ์ปค๋งจ๋๋ก Scikit-learn์ ๋ณ๋ ์ค์นํ ์ ์์ต๋๋ค.
pip install scikit-learn
# > ipython
# ...
import sklearn
sklearn.__version__
# '0.21.3'
์ฃผํผํฐ ๋ ธํธ๋ถ(Jupyter Notebook)
์ฃผํผํฐ ๋ ธํธ๋ถ์ ์น์์ ์ฝ๋๋ฅผ ์์ฑํ๊ณ ์คํํ ์ ์๋ ์คํ์์ค ์น ์ดํ๋ฆฌ์ผ์ด์ ์ ๋๋ค. ์ด ์ฑ ์ ๋ชจ๋ ์ฝ๋๋ค์ ๊ธฐ๋ณธ์ ์ผ๋ก ๋ณธ์ธ์ ์ปดํจํฐ์ ์ค์น๋ ์ฃผํผํฐ ๋ ธํธ๋ถ ๋๋ ์ฃผํผํฐ ๋ ธํธ๋ถ๊ณผ ์ค์ต ํ๊ฒฝ์ด ์ ์ฌํ ๊ตฌ๊ธ์ ์ฝ๋ฉ(Colab)์ ์ฌ์ฉํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. ์ฃผํผํฐ ๋ ธํธ๋ถ๋ ์๋์ฝ๋ค๋ฅผ ์ค์นํ๋ฉด ์๋์ผ๋ก ์ค์น๋์ด์ ธ ์์ต๋๋ค. ์๋์ฝ๋ค๋ฅผ ์ค์นํ์ง ์์๋ค๋ฉด ์๋์ ์ปค๋งจ๋๋ก Jupyter notebook์ ๋ณ๋ ์ค์นํ ์ ์์ต๋๋ค.
pip install jupyter
์ค์น๊ฐ ์๋ฃ๋์์ผ๋ฉด ํ๋กฌํํธ์์ ๋ค์ ๋ช ๋ น์ด๋ฅผ ํตํด ์ฃผํผํฐ ๋ ธํธ๋ถ์ ์คํํ ์ ์์ต๋๋ค.
jupyter notebook
ํด๋น ๋ช
๋ น์ด๋ฅผ ์น๋ฉด ์น ๋ธ๋ผ์ฐ์ ๊ฐ ์๋์ผ๋ก ์ด๋ฆฌ๋ฉด์ ์ฃผํผํฐ ๋
ธํธ๋ถ์ด ์คํ๋ฉ๋๋ค. ๋ง์ฝ ์คํ๋์ง ์๋๋ค๋ฉด, ์ง์ ์คํ์์ผ์ผ ํฉ๋๋ค. ์น ๋ธ๋ผ์ฐ์ ๋ฅผ ์ด๊ณ ํ๋กฌํํธ์์ ๋์ค๊ณ ์๋ ์ฃผ์์ธ "http://localhost:8888
"์ ์ ์ํฉ๋๋ค.
1) ์๋ก์ด ๋ ธํธ ์คํ
์ฃผํผํฐ ๋ ธํธ๋ถ์์๋ ๋ ธํธ๋ฅผ ์์ฑํด์ ํด๋น ๋ ธํธ์ ์ฝ๋๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. ํ๋ฉด ์ฐ์ธก์ New ๋ฒํผ์ ๋๋ฅด๊ณ , Python3์ ๋๋ฌ์ ์๋ก์ด ๋ ธํธ๋ฅผ ์คํํด๋ด ์๋ค.
2) ์ ์ ์ฝ๋ ์์ฑํด๋ณด๊ธฐ
๋
ธํธ๊ฐ ์คํ๋๋ฉด In [ ]
์ด๋ผ๋ ๋ฌธ์๊ฐ ์ ํ ํ
์คํธ ์์๊ฐ ๋์ต๋๋ค. ์ฃผํผํฐ ๋
ธํธ๋ถ์์๋ ํด๋น ํ
์คํธ ์์์ ๋จ์๋ฅผ ์
(cell)์ด๋ผ๊ณ ๋ถ๋ฆ
๋๋ค. ํด๋น ์
์ ์ฝ๋๋ฅผ ์
๋ ฅํ๊ณ [Cell] โ [Run Cells]
๋ฅผ ํด๋ฆญํ๋ฉด ์คํ๋ฉ๋๋ค. ๋ง์ฝ, ๋ง์ฐ์ค๋ก ์ผ์ผํ ์คํํ๋ ๊ฒ์ด ๋ฒ๊ฑฐ๋กญ๊ฒ ๋๊ปด์ง๋ค๋ฉด ํค๋ณด๋์ Shift+Enter๋ฅผ ํตํด์ ํ์ฌ ์
์คํ ํ ๋ค์ ์
๋ก ์ด๋ํฉ๋๋ค. ์ด๋ ๊ตฌ๊ธ์ Colab์์ ์ค๋ช
ํ๋ ์คํ ๋ฐฉ์๊ณผ ๋์ผํ ๋ฐฉ์์
๋๋ค.
๋ค์ ๋ง์๋๋ฆฌ์ง๋ง ์์ผ๋ก์ ๋ชจ๋ ์ค์ต์ Colab ๋๋ ์ฃผํผํฐ ๋ ธํธ๋ถ์์ ์คํํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. ์ด๋ฅผ ์ ๋ ํด์ฃผ์ธ์.