반응형 GPT1 ChatGPT가 촉발한 '더 크게' 전쟁, 이제는 '더 작게' 전쟁의 시작 '더 크게' 전쟁의 서막 ChatGPT로 대표되는 LLM(Lagre Language Models), 이름에서 알 수 있듯이 대량의 언어 파라미터를 학습 시킨 모델을 말합니다. 지금까지는 파라미터 수가 많으면 많을수록 성능이 높아지는 모습을 보여주었기에 거대 빅테크 기업들은 '더 많이, 더 크게 경쟁'을 벌여왔습니다. 그 결과 모델의 크기가 굉장히 비대해져 갔습니다. 그러나 모델의 크기가 비대해질수록 개발 및 운용 비용도 같이 증가하였고, 딥러닝의 복잡성으로 인해 모델을 이해하는 것이 점점 더 어려워졌습니다. 기업들도 이에 대해 인지하고 있었으나 높은 성능이 시장 점유율을 확보하는 데 중요했으므로, 비용을 쏟아부을 수밖에 없었습니다. 아이러니하게도 이런 경쟁 속에서 이득을 보는 것은 NVIDIA 뿐이었습니.. 2023. 6. 10. 이전 1 다음 반응형