画像Alibaba
Qwen Image 2
Qwen Image 2 — テキストから画像生成と編集を1つに統合した Alibaba のモデル。優れた画像内テキスト描画を、OpenAI 互換の単一エンドポイントで。
最大1000文字 · 必須
1:1 / 4:3 / 3:4 / 16:9 / 9:16 · デフォルト 1:1
プレイグラウンドではオン、APIで設定可能(APIのデフォルトはオフ)。
Try one of these prompts
このモデルで構築して本番に出せる、実際のワークフローとユースケースをご紹介します。

ほとんどの画像モデルはキャプションを意味不明な文字に変えてしまいます。Z-Imageは読める英語・中国語の文字を描くので、OOTDコラージュやプロモ用グラフィック、SNSカードも、指定どおりの位置に正しいスペルで文字が収まって戻ってきます。プロンプトにコピーを書き、アスペクト比を設定すれば、アートと文字を1回の高速・低コスト生成でまとめて構成します。
プレイグラウンドを開く
洗練されたライティングときれいな肌の質感で、リアルなポートレートやコーディネートを生成します。ルックブックやEC、ストリートスタイルの撮影にも十分通用するクオリティです。コンパクトな6B規模ながら高速で安価なので、1枚のメインビジュアルに予算を使い果たすことなく、ポーズやスタイリング、シーンを何度も試せます。

写真と同じくらいタイポグラフィが重要な画像のために作られています。くっきりした英語・中国語の見出しとバランスのとれた構図で、雑誌の表紙やバナー、ポスターを生成できます。文字がシャープでレイアウトどおりに収まるため、デザインツールでの二度手間なしに、出力をそのまま使えます。
クレジット制 — 1クレジット = 0.001 USD。完了した生成のみお支払いいただきます。
| カテゴリ | 単位 | 料金 |
|---|---|---|
| z-image | ||
| 1枚あたり | 1 image | $0.005 5 credits |
チームがZ-Imageを選ぶ理由は、画像内の文字です。汎用モデルが文字をにじませてしまう小さなフォントや複雑なレイアウトでも、正確な英語・中国語を描き出します。出力が言葉を担う必要があるなら、同じ /api/v1/images/generations へのリクエストで、それを読める状態に保ちます。
Z-Image-Turboは最小限のサンプリングステップで動くので、生成がすばやく戻ってきます。1 credit equals $0.001 USD で、プラットフォームでも有数の1枚あたり低単価です。1枚ごとのフラット料金なので、コスト計算は掛け算1つで済み、大量のSNS・EC案件に最適です。
Z-Imageのタスクを送信すると task_id が返り、完了するまでポーリングします。JSONはOpenAIのimage-generations契約に準拠しているため、導入はモデルIDの変更だけで、新規の統合は不要です。失敗・拒否されたリクエストは自動で返金されます。
どちらも1つのAPIで画像を生成します。Z-Imageは読めるバイリンガル文字、フォトリアリズム、そして非常に低い1枚あたりのフラット料金に強みがあります。公開されている仕様に基づいて、両者を比較します。
比較は執筆時点で公開されている仕様を反映しています。モデルの挙動や料金は変わる場合があります。最新の値は上の料金カードとAPIドキュメントをご確認ください。
このモデルに関するよくある質問。
同じカテゴリの他のモデルもチェック。
画像Alibaba
Qwen Image 2 — テキストから画像生成と編集を1つに統合した Alibaba のモデル。優れた画像内テキスト描画を、OpenAI 互換の単一エンドポイントで。
画像Alibaba
Wan 2.7 Image — Alibaba Wan の生成と編集、複数画像参照、最大 4K を、ひとつの OpenAI 互換エンドポイントで。
画像Nano banana — 高速な Gemini 画像生成と編集、1K で最大 14 枚の参照画像に対応。
画像ByteDance
Seedream 5.0 Lite — 2K / 3K の Doubao 画像生成、image-to-image とバッチ出力に対応。