CodeGemma 的預訓練過程中使用了一個名為 “CodeSearchNet” 的數據集。該數據集包含了數百萬行代碼和與其相關的注釋,用于訓練代碼搜索和代碼摘要生成模型。這個數據集涵蓋了多種編程語言和領域,使得模型可以在不同的代碼庫和任務上進行泛化和遷移學習。
億速云公眾號
手機網站二維碼
Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權所有
廣州億速云計算有限公司粵ICP備17096448號-1 粵公網安備 44010402001142號增值電信業務經營許可證編號:B1-20181529