
AI μ€λ§νΈν°μ ν΅μ¬, LLM κ²½λν ν ν¬λ
AI μ€λ§νΈν°μ ν΅μ¬, LLM κ²½λν ν ν¬λ κ΄λ ¨
μ΅κ·Ό κ°€λμ S24λ₯Ό μμμΌλ‘ μλ²λ ν΄λΌμ°λμ μ°λν νμ μμ΄ μ€λ§νΈν°μμ μ§μ μμ±ν AI κΈ°λ₯μ νμ©ν μ μλ βAI μ€λ§νΈν°βμ΄ κ΄μ¬μ λͺ¨μΌκ³ μμ΅λλ€. μΌμ±μ μλ κ°€λμ μ€λ§νΈν° κΈ°κΈ°μ μ체 κ°λ°ν μ΄κ±°λμΈμ΄λͺ¨λΈ(μ΄ν LLM) μΌμ± κ°μ°μ€(Gauss)λ₯Ό νμ¬νμ¬ μ€μκ° μλ λ²μ, μ±ν , μ¬μ§ νΈμ§ λ± λ€μν κΈ°λ₯μ μ 곡νκ³ μμ΅λλ€. μ ν μμ μμ¬ AI νλ«νΌ βμ ν μΈν 리μ μ€βμ GPT, μ λ―Έλμ΄(Gemini), ν΄λ‘λ(Claude) λ± λ€μν LLMμ νμ©ν μλΉμ€λ₯Ό μ 곡ν κ³νμ λ°νμ£ .
LLMμ κ·Έ μ΄λ¦μμ μ μ μλ― κ±°λν λͺ¨λΈ μ¬μ΄μ¦μ λ°©λν μμ νλ ¨ λ°μ΄ν°μμ λμ€λ μλμ μΈ μ±λ₯μ΄ νΉμ§μ λλ€. μΌλ°μ μΌλ‘ μΈμ΄ λͺ¨λΈμ μ¬μΈ΅μ κ²½λ§(DNN)μ κ°μ€μΉ(weight)μ νΈν₯(bias)μ μ 보λ₯Ό λ΄κ³ μλ λ§€κ° λ³μ(parameter)κ° λ§μΌλ©΄ λ§μμλ‘ μ±λ₯μ΄ μ’μ΅λλ€. μ΄λ₯Ό ν΅ν΄ μΈμ΄μ λ¬Έλ§₯κ³Ό μΈλΆμ μΈ λμμ€κΉμ§ νμ ν΄ μΆλ‘ ν μ μμ£ . κ·Έμ λ°λΌ μμ°μ€λ½κ² LLMμ λ§€κ° λ³μμ μμ λλ €κ°λ λ°©μμΌλ‘ λ°μ ν΄ μμ΅λλ€.
λ§€κ° λ³μ νλλ‘ μ±λ₯ κ°μ μ λ Έλ¦¬λ κ²½ν₯μ λΉλ¨ GPT-4oλ ν΄λ‘λ μλ·(Sonnet)μ²λΌ APIλ‘ μ 곡λλ©° μμ²λ ν¬κΈ°λ₯Ό κ°μ§ λͺ¨λΈμμλ§ λνλμ§ μμ΅λλ€. μΌλ§ μ μΆμλ λ©νμ LLaMA 3.1μ κ²½λνμ κ°μ±λΉλ₯Ό μΆκ΅¬νλ μ€ν μμ€ λͺ¨λΈλ‘μλ λ€μ ν격μ μΌλ‘ 4,050μ΅ κ°(405B)μ λ§€κ° λ³μλ₯Ό μλνλ©° κ°λ°μλ€ μ¬μ΄μμ νμ κ° λμμ΅λλ€.

<μΆμ²: Meta>
μ΄λ¬ν LLMμ νμ©νλ €λ©΄ μ²λ¬Ένμ μΈ μμ μ°μ°μ μ²λ¦¬νκΈ° μν λ³λ ¬ μ²λ¦¬ κΈ°μ κ³Ό κ³ μ±λ₯ GPUλ‘ λ¬΄μ₯ν μλ²/λ°μ΄ν° μΌν°κ° νμμ λλ€. κ·Έλ°λ° μ¬κΈ°μ μλ¬Έμ΄ μκΉλλ€. μ΄ μ»€λ€λ LLM λͺ¨λΈμ΄ μ΄λ»κ² κ·Έ μμ μ€λ§νΈν° μμΌλ‘ λ€μ΄κ° μ μμμκΉμ? κ·Έ ν΄λ΅μ λ°λ‘ βLLM κ²½λν ν ν¬λβμ μμ΅λλ€.
λνμ μΈ LLM κ²½λν ν ν¬λ
LLMμ 컀λ€λ μ¬μ΄μ¦λ‘ λ°μνλ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μΈμ΄ λͺ¨λΈ μ°κ΅¬μμ κ°λ°μλ€μ λͺ¨λΈμ μ¬μ΄μ¦λ₯Ό μ€μ΄λ©΄μλ μ±λ₯μ λΉμ·νκ² μ μ§ν λ°©λ²μ κ³ μ¬νκΈ° μμνμ΅λλ€. 곧 βλ§€κ° λ³μκ° ν° λͺ¨λΈμ κ²½λνν΄μ μ¬μ©νλ κ²μ΄ λμ²΄λ‘ λ§€κ° λ³μκ° μμ λͺ¨λΈμ κ·Έλλ‘ μ¬μ©νλ κ²λ³΄λ€ μ±λ₯μ΄ μ’λ€.βλΌλ κ²°λ‘ μ λ΄λ¦¬κ² λ©λλ€.
LLM κ²½λν ν ν¬λμ κΈ°μ΄λ₯Ό μ΄ν΄νλ €λ©΄ μ°μ λ³μ νν λ³νμΌλ‘ λͺ¨λΈ μ±λ₯μ κ±°μ λμΌνκ² μ μ§νλ©΄μ ν¬κΈ°λ₯Ό μ€μ΄λ βμμν(quantization)β κ°λ μ μλ κ²μ΄ μ€μν©λλ€. κ·Έλ€μμΌλ‘ μ΅κ·Ό μ€μ μμ λ§μ΄ μ°μ΄λ λνμ μΈ κ²½λν ν ν¬λμΈ νμΈνλ κΈ°μ , βPEFT(Parameter Efficient Fine-Tuning)β κ°λ μ μκ°νκ² μ΅λλ€.
μμν(quantization)λ?
λ§λΈ(Marble) μν βμ€νΈλ§¨βμ μ£ΌμΈκ³΅ μ€μ½§μ μνΈμ λ¬λ¦° λ²νΌμΌλ‘ βν μ μβλ₯Ό νμ±νν΄ λͺΈμ ν¬κΈ°λ₯Ό μ€μΌ μ μμ΅λλ€. μΌμμ λ²νΌμΌλ‘ μΆμνλ€ μ€λ₯Έμμ λ²νΌμΌλ‘ λμκ°λ κ²μ΄ κ°λ₯νμ£ . κ°λ―Έλ§ν ν¬κΈ°λ‘ μμμ§ μ€νΈλ§¨μ λ§μΉ μ΄μΈκ³Ό κ°μ νμ λ λλ€. λ¨μ± ν λͺ μ μ 체 μ§λμ μ μ§ν μνμμ κ·Ήλλ‘ μ’μμ§ ν격 λ©΄μ μ μ§κ²©νλ©΄ μμ²λ μλ ₯μ λΌ μ μκΈ° λλ¬Έμ λλ€.
LLMλ λ§μΉ μ€νΈλ§¨μ²λΌ μκ² μ€μΌ μ μλ€λ μ¬μ€μ μμλμ? μμνλ κ°λ ₯ν LLMμ λ³΄λ€ μμ ν¬κΈ°λ‘ μΆμν΄ νμ©ν μ μκ² ν΄μ€λλ€. μ νν μ΄ν΄λ₯Ό μν΄ μ‘°κΈ λ κΈ°μ μ κ΄μ μμ μμνμ λν΄ μ΄μΌκΈ°ν΄λ³΄λλ‘ νκ² μ΅λλ€.
**μμν(quantization)**λ LLMμ λ§€κ° λ³μλ₯Ό μ€μν λ³μ(floating-point type)μμ μ μν λ³μ(integer or fixed point)λ‘ λ³νν΄ λ μμ λΉνΈλ‘ λ°κΎΈλ κ³Όμ μ λ§ν©λλ€. μμνλ₯Ό κ±°μΉ LLMμ κ±°μ λμΌν μ±λ₯μ κ°μ§μ§λ§ μ€μ μ¬μ΄μ¦λ³΄λ€ μμ λͺ¨λΈμ²λΌ 보μ΄λλ‘ λ³νλ©λλ€. μλ₯Ό λ€μ΄ μλ 32λΉνΈ λΆλ μμμ μ κ°μ§κ³ μλ λͺ¨λΈμ λ§€κ° λ³μλ₯Ό 8λΉνΈ μ μλ‘ λ³ννλ κ²μ²λΌ, μΈμ΄ λͺ¨λΈμ΄ κ°μ§ κ°κ°μ λ§€κ° λ³μ λΉνΈ μλ₯Ό μ€μ¬μ£Όλ κ²μ λλ€.

<μΆμ²: Florian June λ―Έλμ λΈλ‘κ·Έ>
μ΄λ κ² μμνλ₯Ό κ±°μΉ LLMμ ν¬κΈ°κ° μ€μ΄λ€ λΏλ§ μλλΌ κ³μ° ν¨μ¨μ± μμ μ’μμ§λλ€. λ³΄ν΅ λΉνΈ μλ₯Ό Nλ°° μ€μ΄λ©΄ κ³±μ 볡μ‘λλ NxN λ§νΌ μ€μ΄λ€μ£ . μμμ²λΌ float32 λμ int8μ μ°λ©΄ λ¨μ κ³μ°λ§μΌλ‘λ λͺ¨λΈ ν¬κΈ°κ° 1/4κΉμ§ μμμ§λλ€. μ΄μ λ°λΌ μΆλ‘ μλ μμ 2λ°°μμ 4λ°°κΉμ§ λΉ¨λΌμ§λλ€. λ§μ°¬κ°μ§λ‘ 2λ°°μμ 4λ°°κΉμ§ μ μ λ©λͺ¨λ¦¬λ‘λ λΉμ·ν μ±λ₯μ LLM μ°μ°μ΄ κ°λ₯ν΄μ§λλ€.
μ΄μ²λΌ μμνλ LLM ν¬κΈ°λ₯Ό μ€μ¬ μ£Όκ³ κ³μ° ν¨μ¨μ±μ ν₯μμμΌ μ€λλ€. κ·Έλ¬λ μμνλ‘ λͺ¨λΈμ μ±λ₯ μ νκ° μκΈΈ μ μλ€λ μ μ μΌλμ λ¬μΌ ν©λλ€. μμνμ λͺ©μ μ νλ ¨ λ° κ³μ° λΉμ©μ μ€μ΄λ©΄μλ μ±λ₯μ μ μ§νλ κ²μΌλ‘ λ§€κ° λ³μμ μΌλΆλ§μ μ‘°μ νμ¬ νμ©νκΈ° λλ¬Έμ μλ λͺ¨λΈκ³Ό λμΌν μ±λ₯μ 보μ₯νμ§λ μμ΅λλ€. λ°λΌμ μμν λͺ¨λΈμ μ΄λκΉμ§λ κ°μ±λΉμ μ€μ μ λμ΄μΌ νλ©° μ¬μ© μ μ μ² μ ν λͺ¨λΈ νκ°κ° νμν©λλ€.

<μΆμ²: Olga Zem λ―Έλμ λΈλ‘κ·Έ>
PEFT(Parameter Efficient Fine-Tuning)λ?
μμ±ν AI μ΄νμΌλ‘ μ΅κ·Ό βνμΈνλ(Fine-tuning)βμ΄λΌλ λ¨μ΄λ₯Ό ν λ²μ―€ λ€μ΄λ΄€μ κ²μ λλ€. GPTμ κ°μ LLM κΈ°μ΄ λͺ¨λΈμ λ κ°μ§ λ¨κ³λ₯Ό κ±°μ³ λ§λ€μ΄μ§λλ€. 첫째, λ°±μ§μν λͺ¨λΈμ λ°©λν μμ ν μ€νΈ λ°μ΄ν°λ₯Ό νμ΅μμΌ μ λ°μ μΈ μΈμ΄ λ₯λ ₯ λ° μμ± λ₯λ ₯μ ν₯μμν€λ μ¬μ νμ΅(pre-training)κ³Ό λμ§Έ, λΉκ΅μ μ μ λ°μ΄ν°μ μ νμ©ν΄ LLMμ νΉμ λΆμΌμ μ λ¬Έ μ§μκ³Ό νμ€ν¬μ νΉνμν€λ νμΈνλμ΄μ£ .
PEFT(Parameter Efficient Fine-Tuning)λ μ μ μμ λ§€κ° λ³μ νμ΅λ§μΌλ‘ λΉ λ₯Έ μκ°μ μλ‘μ΄ λ¬Έμ λ₯Ό ν¨κ³Όμ μΌλ‘ ν΄κ²°νλ νμΈνλ κΈ°λ²μ λ§ν©λλ€. μ΅κ·Ό μ κ²λ μμ²μ΅ κ°μμ λ§κ²λ μ‘° λ¨μ μ΄μμ λ§€κ° λ³μλ₯Ό κ°μ§ LLMλ νλΌλ―Έν° μΌλΆλ§ μ‘°μ νμ¬ μ μ¬ν μ±λ₯μ λΌ μ μλ€λ μ°κ΅¬ κ²°κ³Όκ° μμμ΅λλ€. μ΄λ₯Ό κΈ°λ°μΌλ‘ PEFT λ°©λ²λ‘ μ°κ΅¬κ° νλ°ν μ§νλλ μ€μ΄μ£ .

<μΆμ²: kanika adik λ―Έλμ λΈλ‘κ·Έ>
PEFTμ μ€μν νΉμ§μ νμΈνλ μ μ 체 λͺ¨λΈμ μ‘°μ νλ κ²λ³΄λ€ μ μ κ³μ° μμκ³Ό λ°μ΄ν°λ§μ μ¬μ©νλ€λ μ μ λλ€. μ΄λ λ€μν μΈμ΄μ λλ©μΈ λ°μ΄ν°μ λͺ¨λΈμ μ μ©ν λ νΉν μ μ©ν©λλ€. κ° μΈμ΄ λλ λλ©μΈλ³λ‘ μμ 체ν¬ν¬μΈνΈλ§ λ‘컬μ μ μ₯νλ©΄ ν¨μ¨μ μΌλ‘ μλνκΈ° λλ¬Έμ΄μ£ . λ°λΌμ AI μ€λ§νΈν°μ²λΌ λ€μ΄λ‘λλ μ λ°μ΄νΈμ μ νμ΄ μλ νκ²½μμ λͺ¨λΈμ λ€μμ±μ μ μ§νλ λ°μ ν° λμμ΄ λ©λλ€.
λν PEFTλ λ€μν νμ€ν¬μ λͺ¨λΈμ μ μν μ μ©νκ³ μ νλ μ°κ΅¬μλ κ°λ°μμκ² νΉν μ μ©ν©λλ€. κΈ°μ‘΄μ νμ΅λ LLM μμ μΆκ° λ μ΄μ΄λ₯Ό λ§λΆμ¬ λ―ΈμΈ μ‘°μ νλ©° μλ‘μ΄ μμ μ λν λͺ¨λΈ μ μ© λ° νκ°κ° κ°λ₯νκΈ° λλ¬Έμ λλ€.
λ§μΉλ©°: LLM κ²½λν ν ν¬λμ λ§λ₯μ΄ μλλ€
μ΄μ²λΌ LLM κ²½λν ν ν¬λμ λͺ¨λ°μΌ κΈ°κΈ°λ κΈ°ν μ νλ μμμ μ¬μ©νλ νκ²½μμ μμ±ν AI κΈ°λ₯μ ν¨μ¨μ μΌλ‘ νμ©νλ λ° λ§€μ° ν¨κ³Όμ μ λλ€. νΉν μ€μκ° μλ λ²μ, μ±ν , μ¬μ§ νΈμ§ λ± λ€μν κΈ°λ₯μ μ 곡ν΄μΌ νλ AI μ€λ§νΈν°μμλ λͺ¨λΈ κ²½λν ν ν¬λμ΄ νμμ£ . μ΄ κΈ°μ μ΄ κ±°λν λͺ¨λΈ μ¬μ΄μ¦λΌλ LLMμ κ³ μ§μ μΈ λ¬Έμ μ μ ν΄κ²°ν΄ μμ±ν AI νμ°μ κΈ°μ¬ν μ μμ κ²μΌλ‘ κΈ°λλ©λλ€.
κ·Έλ¬λ μμνλ PEFT κ°μ LLM κ²½λν ν ν¬λμ λ§λ₯μ΄ μλλλ€. κΈ°μ μ νμ©ν λ κ·Έ νκ³μ μ μ΄ν΄νλ κ²μ λ§€μ° μ€μν©λλ€.
μλ₯Ό λ€μ΄ μμνμ κ²½μ°, λͺ¨λΈμ λ§€κ° λ³μλ₯Ό μ μνμΌλ‘ λ³ννλ κ³Όμ μμ μΌλΆ μ 보 μμ€μ΄ λ°μν μ μμ΅λλ€. λ°λΌμ νΉν 볡μ‘ν μΈμ΄ μ΄ν΄λ μμ± μμ μμλ μ΄λ‘ μΈν μ±λ₯ μ νκ° μκΈΈ μ μμμ μΆ©λΆν μΈμ§νκ³ νμ©ν΄μΌ ν©λλ€. λ§μ°¬κ°μ§λ‘ PEFT μμ μ μ μμ λ§€κ° λ³μλ§μ μ‘°μ νκΈ° λλ¬Έμ μ 체 λͺ¨λΈμ νλνλ κ²λ³΄λ€ νΉμ νμ€ν¬μμμ μ΅μ μ±λ₯μ λ¬μ±νκΈ° μ΄λ €μΈ μ μμ΅λλ€. κ²½λν ν ν¬λμ λ΄ μ νμ νμ©ν μμ μΈ κ°λ°μλΌλ©΄ μ΄ μ¬μ€μ κΌ μΌλμ λκ³ μ μ© λ°©λ²μ λͺ¨μνκΈ° λ°λλλ€.