Googleは2月12日から、Google Labsにてた画像生成の試験運用機能 Whisk を日本を含む 100 以上の国と地域で順次提供開始しました。Google Labsとは、Gemini、Imagen、Veoなどの最新の生成 AI モデルを活用できる試験開発エリアのことで、今回新たにWhiskが追加された形です。
この「Whisk」は、テキストを用いたプロンプトではなくモデル、シーン、スタイルの3枠に好きな画像を当てはめることで、ユーザーが想像している、それらを組み合わせた画像を生成することができます。
例えば、下画像のようにモデルに犬、シーンに雪国、スタイルに恐竜のぬいぐるみを当てはめると、それらを組み合わせた全く新しい画像に!なぜアイスクリームを食べているのかは分かりませんが、このようなオリジナルな画像を生成できます。

次はこちら。モデルに猫、シーンに浜辺、スタイルにはガチャガチャのカプセルに入った恐竜の画像を当てはめると、何ともかわいらしい浜辺をバックにしたカプセルに入る猫の画像が生成されています。

このように3つの画像からオリジナルの画像を生成する「Whisk」の仕組みとしては、まずGemini が画像の詳細なキャプションを自動的に作成します。次にその作成した説明を Google の最新の画像生成モデルである Imagen 3 に入力することで上の画像が生成されるというわけです。Googleによると、このプロセスは、入力したモデルを正確に複製するのではなく、被写体の本質を捉えるため、モデル、シーン、スタイルを新しい方法で簡単に組み合わせることができるとのこと。
ただし注意点として、Whisk は画像からいくつかの重要な特徴のみを抽出するため、ユーザーが予期するものとは異なる画像が生成される場合があります。たとえば、生成されるモデルの身長、体重、髪型、肌の色が異なるなどです。
Googleは、そうして問題に対して、いつでも基となるプロンプトを表示および編集できるようしているようです。また、GoogleはWhiskを最大限に活用していただくために、英語でのプロンプトのご使用を推奨しています。一応日本語の注力もできるかもしれませんが、英語の方が良いみたいです。
テキスト入力がなく、自分が生成したい画像を元に直感的に画像を3枚選ぶだけなので初心者にとっては他のモデルよりも使いやすいかもしれませんね。日本ではすでにこのサイトで提供されるようなので、気になった方はぜひ試してみてください!
毎月2980円(税抜)でデータ使い放題+国内通話し放題のコスパ最強プラン(PR)

モバイル通信なら楽天モバイルがオススメ!全てのユーザーに合うシンプルプランなので、ギガ数に悩まず簡単に乗り換え可能です。また、料金の安さも魅力的!
- 0~3GBだと980円/月(税込1078円)
- 3~20GBだと1980円/月(税込2178円)
- 20GB以上(無制限!)だと2980円/月(税込3278円)
専用アプリ「Rakuten Link」を通して通話すれば、なんと国内通話がかけ放題です。追加オプションを設定しなければ、これ以上料金がかかることがありません。
筆者は月に15GBほど使うので、毎月の料金はたった2千円ほど!auやソフトバンク、ドコモなど料金が高くなりやすいMNO回線ですが、楽天モバイルなら格安で利用できます。
本プランは、通信データに応じて料金が変化するので、あまりデータを使わない人やある程度使う人、ゲームや動画で何十GBも使う人まで全てのユーザーに対応できるのが楽天モバイルの魅力!
回線の新規申込や切り替えもオンラインで完結するので、わざわざ店舗に出向く必要もありません。(SIMカードは郵送で、eSIMなら手続き完了後、すぐにダウンロード可能!)
自分に合うプランが分からない、他社回線を使っているけど毎月の請求額に悩んでいるという方は、ぜひ試してみてください!
\ Webで “サクッ'' と申し込み! /
(Rakuten最強プラン(データタイプ)」は対象外です)( 0570などから始まる他社接続サービス、一部特番(188)への通話については、無料通話の対象外となります)(アプリ未使用時30秒22円)