StableVicuna は、Stable Diffusion を開発した会社 StabilityAI による、ヒューマン フィードバックからの強化学習 (RLHF) でトレーニングされた初の大規模なオープンソース チャットボットです。 StableVicuna は、命令を微調整した LLaMA 130 億モデルである Vicuna v0 13b のさらなる命令微調整および RLHF トレーニング バージョンです。
関連ナビゲーション
コメントはありません…
StableVicuna は、Stable Diffusion を開発した会社 StabilityAI による、ヒューマン フィードバックからの強化学習 (RLHF) でトレーニングされた初の大規模なオープンソース チャットボットです。 StableVicuna は、命令を微調整した LLaMA 130 億モデルである Vicuna v0 13b のさらなる命令微調整および RLHF トレーニング バージョンです。