↓
快轉到主要內容
Wentong’s Blog
Wentong’s Blog
About
Posts
Projects
原神啟動 !
About
Posts
Projects
原神啟動 !
2025
揭秘 LLM 大型語言模型的訓練過程:一場精密的植物栽培之旅
2025年8月25日
·
1 分鐘
AI 概論
Transformer
AI
知識科普
本文簡潔的介紹了 LLM 大型語言模型的訓練過程,並以植物栽培之旅為比喻,讓讀者更容易理解。
多頭注意力機制 (Multi-Head Attention) 核心筆記
2025年8月25日
·
1 分鐘
深度學習
多頭注意力機制
Transformer
學習筆記
本文深入探討多頭注意力機制的核心原理與實作細節。