初めてのLoRA
VRM形式のアバターを、VRM Automatic Photographingでポーズと表情をつけて撮影し、kohya_ssでLoRA(追加学習データ)を自作してみた。
上が学習元の画像。今回は60枚程度撮影し、Epoch数を20に設定して生成に2時間程度かかった。テストなので、取り敢えずキャプション・データはなしで。
元画像がアニメ調のアバターなので、アニメ系のモデルとは相性がいいですね。いろいろ作業を省略したにもかかわらず、それなりに特徴を捉えて画像を生成してくれている感じ。
しかし、実写系はかなり厳しいですね。多数の失敗作の中から、何とか鑑賞に堪えられる「奇跡の一枚」w をチョイス。でも、まあ、初めてにしてはそれなりかなと思ったり。
上が学習元の画像。今回は60枚程度撮影し、Epoch数を20に設定して生成に2時間程度かかった。テストなので、取り敢えずキャプション・データはなしで。
元画像がアニメ調のアバターなので、アニメ系のモデルとは相性がいいですね。いろいろ作業を省略したにもかかわらず、それなりに特徴を捉えて画像を生成してくれている感じ。
しかし、実写系はかなり厳しいですね。多数の失敗作の中から、何とか鑑賞に堪えられる「奇跡の一枚」w をチョイス。でも、まあ、初めてにしてはそれなりかなと思ったり。
コメント
コメントを投稿