AIが描いた日本語テキスト、ついに崩れなくなった — Nano Banana Proがポスターもマンガも変える

AI画像生成で日本語を入れると、高確率で崩壊する。

Nano Banana Pro

これは2025年までの常識だった。MidjourneyもDALL-Eも、英語のテキストはそこそこ読めるのに日本語になった途端に「惜しいけど読めない」文字列を量産した。ポスターに「黒金セール最大50%OFF」と入れたいのに、出てくるのは「黒全セ〜ル最大5Q%OFF」のような、記号とも文字ともつかない何か。実務には使えないからPhotoshopでテキストだけ手打ちする、という二度手間が当たり前になっていた。

GoogleのNano Banana Proが変えたのは、まさにこの部分だ。

Nano Banana Pro（正式名称: Gemini 3 Pro Image）は2025年11月にGoogle DeepMindが発表した画像生成・編集モデルで、Gemini 3 Proの推論能力を画像生成に転用している。2026年4月現在もGeminiアプリやGoogle AI Studio、Vertex AIを通じて順次ロールアウト中だ。

日本語テキストが「読める」とはどういうことか

Nano Banana Proの日本語テキスト生成能力は、他のモデルと明確に一線を画している。

具体的にいうと、ひらがな・カタカナ・漢字の混在テキストを画像内に正確にレンダリングできる。「黒金セール最大50%OFF」のようなキャッチコピーが、文字として崩れずに出力される。さらに、マンガの擬音語（「ドドドド」「ゴゴゴゴ」）や吹き出しの中のセリフまで、ほぼ判読可能なレベルで生成できるという報告がSNSで相次いでいる。

「ほぼ」と書いたのには理由がある。複雑な漢字（「鬱」「薔薇」のような画数の多い字）や、フォントサイズが極端に小さい場合は、まだ崩れることがある。完璧ではないが、「実用に耐えるレベルに初めて到達した」という評価は妥当だと思う。

スペック面で何が強いか

テキスト生成以外にも、Nano Banana Proには注目すべきスペックが並ぶ。

4K解像度に対応。 ベースラインで4メガピクセルの画像を出力できる。1024×1024が上限だった競合モデルとは、印刷用途での実用性が段違いだ。ポスターやバナー広告をAIで作る場合、「生成してから拡大」というステップが不要になる。

14枚の参照画像を同時に読み込める。 既存の画像を参考にしながら新しい画像を生成する際、14枚まで一度に指定できる。ブランドガイドラインの複数ページを読ませて、トーンを揃えた画像を出す、といった使い方が考えられる。

最大5人のキャラクター一貫性。 同じ人物を複数シーンで描かせたとき、顔や服装の特徴を維持できる。マンガやストーリーボード制作で「ページをまたいでも同じキャラに見える」という要求に応えられる可能性がある。

速度。 公式によれば、既存の主要モデルと比較して最大8倍高速。生成待ちのストレスが減るのは、特に試行錯誤を繰り返すクリエイティブ作業で効いてくる。

無印Nano Bananaとの違い

Googleの画像生成AIには「Nano Banana」（無印）と「Nano Banana Pro」がある。混乱しやすいので整理しておく。

Nano Banana（無印） はGemini 2.5 Flash Imageベース。軽快で、SNS投稿やカジュアルな画像編集向き。Geminiアプリの無料ユーザーが標準で使えるのはこちら。

Nano Banana Pro はGemini 3 Pro Imageベース。推論能力が格段に高く、テキスト描画・構図の複雑さ・キャラクター一貫性・解像度のすべてで無印を上回る。Geminiアプリで「Thinking」モードを選択すると使える。無料ユーザーにも限定クォータが割り当てられるが、本格的に使うならGoogle AI Plus（$20/月）以上が必要になる。

用途で使い分けるなら、「ちょっとした画像の修正や遊び」は無印、「仕事で使うポスター・バナー・プレゼン資料の画像」はProという切り分けが妥当だ。

競合とどう比べるか

2026年4月時点の画像生成AI市場は混戦状態にある。

Midjourney V8はアーティスティックな表現力で依然として強い。ただし日本語テキストの生成精度ではNano Banana Proに及ばない。美しい写真やイラストを作りたいならMidjourney、テキスト入りのポスターやインフォグラフィックならNano Banana Pro、という棲み分けが現実的だ。

FLUX 2はオープンソースの強みでローカル実行やカスタマイズに対応する。プライバシーを理由にクラウドに画像を送りたくない場合や、独自のファインチューニングを行いたい場合はFLUXに分がある。

GPT Image 2（OpenAI）はChatGPT内で手軽に使えるのが最大の利点だが、テキスト描画のクオリティではNano Banana Proの後塵を拝している。ChatGPTを日常的に使っている人が「ついでに画像も」という文脈では強いが、画像生成を主目的とするならNano Banana Proのほうが満足度は高いだろう。

Recraft V4はデザイン特化で、ベクター出力やブランドキット統合に強い。デザイナーが使い慣れたワークフローに組み込むならRecraft、より汎用的な画像生成ならNano Banana Proという住み分けになる。

使い方

最も手軽なのはGeminiアプリだ。モデル選択で「Thinking」を選び、「画像を作成」を指定してプロンプトを入力する。日本語でプロンプトを書いても、日本語で画像を生成してくれる。

開発者向けにはGoogle AI StudioやVertex AIのAPIで利用可能。API経由なら、自前のアプリやワークフローに画像生成を組み込める。

Google Adsの画像生成エンジンもNano Banana Proに順次置き換わっている。広告運用者にとっては、特に意識しなくても生成品質が上がっていく形だ。

正直な所感

日本語テキストの描画精度については、素直に驚いた。「黒金セール」が崩れずに出てくるのは、AIの画像生成を日本市場で使う人間にとっては長年の悲願だったといっていい。

一方で、画像生成AI全般に言えることだが、「プロンプトだけで思い通りの画像を出す」のは依然として試行錯誤が必要だ。テキストが読めるようになっても、レイアウトの細かい調整はまだ人間の手が入る場面が多い。Canvaのようなデザインツールの中でNano Banana Proが使えるようになれば、「生成→微調整→完成」のサイクルがもう一段速くなる可能性があるが、2026年4月時点ではまだそこまでの統合は進んでいない。

日本語テキストが読めるAI画像生成を探している人には、現時点で最有力の選択肢だと思う。

AIが描いた日本語テキスト、ついに崩れなくなった — Nano Banana Proがポスターもマンガも変える

日本語テキストが「読める」とはどういうことか

スペック面で何が強いか

無印Nano Bananaとの違い

競合とどう比べるか

使い方

正直な所感

関連記事

「ネットを見ながら描く」画像AI — Seedream 5.0がMidjourneyにない武器を持っていた

Geminiが「ブラウザの外」に出てきた — Macアプリの画面共有が変えること

Sundar Pichaiが「来月には」と言ったあのモデル — Gemini 3.5 Proが6月に来る