2026年6月16日 #LLM#AI#Learning#Dataset#Compliance#Translation 初探 LLM 訓練:從零開始的學習紀錄 (二) —— 語料工程與合規性 高品質的資料是孕育精良模型的基石。這篇記錄了我如何透過資料處理、初步去重與分析檢查,提煉出專用於翻譯訓練的高品質語料。