본문 바로가기

Lulu-_-

Notice

Who is mate?

Recent Posts

Popular Posts

Recent Comments

Link

250x250

Calendar

Tags

더보기

Archives

Visits

Today

Yesterday

전체 글

AI-ML/LLM 2025. 10. 6. LLM 평가의 4가지 주요 접근법 이해하기 https://magazine.sebastianraschka.com/p/llm-evaluation-4-approaches 번역입니다!LLM을 실제로 어떻게 평가할까?간단한 질문이지만, 훨씬 더 큰 논의를 불러일으키는 경향이 있습니다. 프로젝트 자문이나 협업 시 가장 자주 받는 질문 중 하나는 다양한 모델 간 선택 방법과 공개된 평가 결과를 해석하는 방법입니다. (물론 자체 모델을 튜닝하거나 개발할 때 진척도를 측정하는 방법도 포함됩니다.) 이 질문이 자주 제기되기에, 사람들이 LLM을 비교하는 데 사용하는 주요 평가 방법에 대한 간략한 개요를 공유하면 도움이 될 것 같습니다. 물론 LLM 평가는 단일 자료로 완전히 다루기에는 너무 방대한 주제이지만, 이러한 주요 접근법을 명확히 이해하면 벤치마크, 리더보..

AI-ML/LLM 2025. 10. 5. 논문 읽어보기 - Learning to Reason as Action Abstractions with Scalable Mid-Training RL https://arxiv.org/html/2509.25810v1 논문 읽기Learning to Reason as Action Abstractions with Scalable Mid-Training RL: 종합 분석1. 논문의 취지 (Research Purpose/Motivation)본 논문은 대규모 언어 모델(LLM)의 성능을 극대화하기 위한 mid-training 단계의 이론적 기반을 최초로 제시하고자 한다. 현재 LLM 훈련은 pre-training, mid-training, post-training RL의 3단계 파이프라인으로 이루어지는데, mid-training은 경험적으로 효과적임이 입증되었지만 그 작동 원리와 post-training RL에 미치는 영향이 이론적으로 명확히 규명되지 않았다는 문..

AI-ML/Vibes Coding 2025. 8. 21. Augmented Coding: Beyond the Vibes https://tidyfirst.substack.com/p/augmented-coding-beyond-the-vibes by Kent Beck최근에 야심찬 프로젝트인 BPlusTree3 라이브러리 개발을 위해 증강 코딩을 활용하는 과정에서 좋은 중단점을 찾았습니다. 그 결과물은 BPlusTree3 - Rust와 Python으로 구현된 성능 경쟁력 있는, 아마도 생산 환경에 적용 가능한 구현체입니다. 친구와 함께 앉아 이 과정을 이야기하고, 이 경험이 GenAI 시대의 프로그래밍 미래에 대해 무엇을 시사하는지 반추해 보았습니다.처음에 BPlusTree3를 구현하게 된 계기는 무엇인가요?증강 코딩의 놀라운 힘을 깨닫기 시작하면서 기술적으로 불가능했던 과거의 프로젝트를 떠올리기 시작했습니다. 그 중 하나가 특..

AI-ML/LLM 2025. 8. 21. GPT-OSS 시각화 https://newsletter.languagemodels.co/p/the-illustrated-gpt-oss 번역글 입니다.OpenAI의 GPT-OSS 공개는 6년 전 GPT-2 이후로 주요 오픈소스 LLM 공개입니다. 이 기간 동안 LLM의 성능은 급속히 발전했습니다. 그러나 이 모델 자체는 DeepSeek, Qwen, Kimi 등 기존 오픈소스 모델과 비교해 성능 면에서 획기적인 개선을 보여주지는 않습니다. 그럼에도 불구하고, 이 모델은 이 기간 동안 LLM이 어떻게 변화했는지 재검토하는 좋은 기회를 제공합니다.이전 오픈소스 GPT 모델과의 차이점GPT-OSS는 이전 모델들과 마찬가지로 자동 회귀형 트랜스포머(autoregressive Transformer)로, 한 번에 하나의 토큰을 생성합니다...

AI-ML/LLM 2025. 8. 11. LLM에서 Self-Attention, Multi-Head Attention, Causal-Attention, 및 Cross-Attention의 이해와 Code 해석 https://magazine.sebastianraschka.com/p/understanding-and-coding-self-attention 글 번역했습니다.이 게시글에서는 트랜스포머 아키텍처와 GPT-4, Llama와 같은 대규모 언어 모델(LLM)에서 사용되는 자기 주의 메커니즘에 대해 설명합니다. 자기 주의와 관련된 메커니즘은 LLM의 핵심 구성 요소로, 이러한 모델을 다루는 데 있어 이해하는 것이 유용한 주제입니다.그러나 단순히 자기 주의 메커니즘을 논의하는 대신, Python과 PyTorch를 사용하여 기본부터 코딩해 보겠습니다. 제 생각에 알고리즘, 모델, 기술을 기본부터 코딩하는 것은 학습에 매우 효과적인 방법입니다!참고로, 이 글은 옛 블로그에 게시한 "Understanding and C..

AI-ML/LLM 2025. 8. 10. GPT-2에서 gpt-oss로: 아키텍처적 개선점 분석 https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the 글 번역했습니다.OpenAI는 이번 주에 2019년 GPT-2 이후 첫 번째 오픈 웨이트 모델인 gpt-oss-120b와 gpt-oss-20b라는 새로운 오픈 웨이트 LLM을 출시했습니다. 그리고 몇 가지 영리한 최적화 덕분에 로컬에서 실행할 수 있습니다(자세한 내용은 나중에 설명합니다). OpenAI가 완전 개방형 대형 모델을 공개한 것은 GPT-2 이후 이번이 처음입니다. 이전 GPT 모델은 트랜스포머 아키텍처가 어떻게 확장되는지를 보여주었습니다. 그 후 2022년 ChatGPT 릴리스는 글쓰기 및 지식(그리고 이후 코딩) 작업에 대한 구체적인 유용성을 입증함으로써 ..

AI-ML/LLM 2025. 7. 22. 추론 능력(Reasoning) 이해를 위한 대규모 언어 모델(LLMs) 추론 모델의 구축 및 개선을 위한 방법과 전략https://magazine.sebastianraschka.com/p/understanding-reasoning-llms 글 번역했습니다.이 글은 추론 모델을 구축하는 네 가지 주요 접근 방식, 즉 LLMs에 추론 능력을 강화하는 방법을 설명합니다. 이 내용이 유용한 통찰을 제공하며, 이 주제를 둘러싼 빠르게 변화하는 연구 동향과 과대 광고를 이해하는 데 도움이 되길 바랍니다.2024년에는 LLM 분야에서 전문성이 더욱 강화되었습니다. 사전 훈련과 미세 조정 beyond, RAG부터 코드 어시스턴트에 이르는 전문적인 응용 사례들이 등장했습니다. 2025년에는 이 트렌드가 가속화될 것으로 예상되며, 특히 도메인 및 응용 분야별 최적화(즉, "전문성")에 더욱 ..

AI-ML/LLM 2025. 7. 22. 대규모 언어 모델(LLM) 아키텍처 비교 DeepSeek-V3에서 Kimi K2로: 현대적 LLM 아키텍처 설계 분석https://magazine.sebastianraschka.com/p/the-big-llm-architecture-comparison 글 번역했습니다.GPT 아키텍처가 개발된 지 7년이 되었습니다. GPT-2(2019)를 되돌아보고 DeepSeek-V3와 Llama 4(2024-2025)를 전망해 보면, 이 모델들이 구조적으로 여전히 유사하다는 점에 놀라움을 느낄 수 있습니다.물론, 위치 임베딩은 절대적에서 회전형(RoPE)으로 진화했으며, Multi-Head Attention은 주로 Grouped-Query Attention으로 대체되었고, 더 효율적인 SwiGLU가 GELU와 같은 활성화 함수를 대체했습니다. 하지만 이러한 ..

이전 1 2 3 4 ··· 14 다음

티스토리툴바