2026年6月16日 #LLM#AI#Learning#Dataset#Compliance#Translation 初探 LLM 訓練:從零開始的學習紀錄 (二) —— 語料工程與合規性 高品質的資料是孕育精良模型的基石。這篇記錄了我如何透過資料處理、初步去重與分析檢查,提煉出專用於翻譯訓練的高品質語料。
2026年6月15日 #LLM#AI#Learning 初探 LLM 訓練:從零開始的學習紀錄 (一) —— AI 是怎麼學習的? 這是我開始學習訓練大型語言模型 (LLM) 的第一篇筆記,先來聊聊幾個最基本、但也最重要的核心概念。