FlowTune Media

「きれいな画像」ではなく「美しい画像」を出すAI — Krea 2が選んだMidjourneyと真逆のアプローチ

Midjourney V8は「プロンプトに忠実」であることを売りにしている。GPT Image 2は「テキストを正確にレンダリング」することで差別化した。では、Kreaが自社の基盤モデルで勝負したのは何か。

「美的感覚」だ。

Kreaが5月12日にリリースした「Krea 2(K2)」は、プロンプトの再現精度を最優先にしない。代わりに、視覚的な調和、照明の一貫性、色彩バランス——つまり「この画像を壁に飾りたいか」で判断される品質を追求する。

他のモデルと何が違うのか

画像AIには大きく2つの設計思想がある。

ひとつは「プロンプト忠実度」を最大化するアプローチ。Midjourney V8やDALL·E 3はここに属する。指示通りの構図、指示通りのオブジェクト、指示通りのスタイル。結果として「言った通りのもの」が出てくるが、曖昧なプロンプトには曖昧な結果を返す。

もうひとつが「美的判断をモデルに埋め込む」アプローチ。Krea 2はこちらだ。報酬信号を視覚的な調和や照明の一貫性に寄せてチューニングしているため、「海辺の女性」のような漠然としたプロンプトでも、構図・光・色彩に「意図」が感じられる画像を出す。

実際に使ってみると、この差は予想以上に体感できる。Midjourneyで同じプロンプトを入れると4枚のバリエーションが出て「どれもそこそこ」になることが多いが、K2は1枚の出力が最初から完成度が高い。もちろんそれは「Kreaの美意識」というバイアスでもあるので、意図的にダサくしたい場面では不自由になりうる。

ムードボード機能

K2の目玉は「ムードボード」だ。最大250枚の参照画像をアップロードすると、モデルがそれらの共通するスタイル——パレット、テクスチャ、照明、構図——を抽出し、新しい画像の生成に適用する。

単純なスタイルトランスファーとは違う。色だけ真似るのではなく、画像群の背後にある「コンセプト」まで読み取ろうとする。たとえば雑誌の表紙を5枚渡せば、「エディトリアルフォトグラフィの文法」そのものを学習して適用する。

これが意味するのは、ブランドの視覚言語をAIに覚えさせられるということだ。デザインエージェンシーがクライアントのブランドガイドラインをムードボードとして登録すれば、以降は誰がプロンプトを書いてもブランドに合致した画像が出てくる。品質のバラつきがチーム内で消える。

生成速度と料金

K2の生成速度は15秒以内。Midjourney V8の30〜60秒と比較すると明確に速い。リアルタイムキャンバス機能と組み合わせれば、描きながら調整するワークフローが成立する。

料金体系は4プラン:

プラン 月額 年払い月額 主な内容
Free $0 毎日の無料生成(制限あり)
Basic $10(約1,500円) $8 720枚/月、商用利用可
Pro $35(約5,300円) $28 大容量、優先生成
Max $60(約9,000円) $48 最大容量、K2先行アクセス

Midjourney Pro($30/月)やDALL·E(ChatGPT Plus $20/月に含む)と比べてもほぼ同価格帯。Basicプランの720枚/月は、SNS用画像を毎日作るクリエイターなら十分な枠だ。

正直な評価

良い点。 漠然としたプロンプトでも「雰囲気のある」画像が出る。ムードボードは唯一無二の機能で、ブランド一貫性の課題を根本から解決する。15秒の生成速度も快適。

微妙な点。 「プロンプト通りの構図を正確に再現したい」場合は向いていない。K2は美的判断を優先するので、「右上に赤い丸、左下に青い四角」のような指示的なプロンプトではMidjourneyやFlux 2に負ける。テキストレンダリングもGPT Image 2ほど正確ではない。

もうひとつ、Krea自体のプラットフォームにロックインされる点は注意が必要だ。K2はAPIが限定的で、現時点ではKreaのWebアプリ内でしか使えない。ComfyUIやAutomatic1111のようなオープンソースワークフローに組み込むことはできない。

どう使い分けるか

結局のところ、万能な画像AIは存在しない。用途で使い分けるのが正解だ。

  • ブランド一貫性が命 → Krea 2(ムードボードで視覚言語を固定)
  • プロンプトの精密再現 → Midjourney V8(構図指示に忠実)
  • テキスト・ロゴ込みの画像 → GPT Image 2(文字レンダリング最強)
  • カスタムワークフロー → Flux 2(オープンソース、ComfyUI対応)

K2が最も輝くのは「ブランドのある制作物」だ。LP用のビジュアル、SNSの投稿画像、プレゼン資料のイメージ写真——「見た目の統一感」が求められる場面で、ムードボードの価値は跳ね上がる。逆に、1回限りのラフスケッチやアイデア出しなら他のモデルでも十分だ。

関連記事