最新の画像生成AI対決!Midjourney vs ideogram 2.0 vs FLUX.1

最新の画像生成AI対決!Midjourney vs ideogram 2.0 vs FLUX.1
  • URLをコピーしました!

こんにちは、スクーティー代表のかけやと申します。

弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご依頼を数多く頂いています。

今、画像生成AIが熱い!

つい先日、高性能なオープンソースの生成AIである「FLUX.1」が発表され、記事を書いたばかりなのですが、その直後である2024/08/21に、Ideogram AI社より、最新バージョンの「Ideogram 2.0」が発表されました。

Ideogram 2.0」はベンチマークでMidjourneyを超えたスコアを出していると言われており、その実力は確かなもののようです。

そこで、王者Midjourneyと、新興勢力のIdeogram 2.0、FLUX.1で実際に画像出力をして、比較をしてみました!そして、驚きの結果が!

FLUX.1に関してはこちらの記事に詳しくまとめました。ぜひ御覧ください!

関連記事:「Midjourneyキラー!?話題の画像生成AI「FLUX.1」を試す」を読む

目次

対決のルール

本画像生成AI対決は、公正を期すために、以下のルールとしました。

  • 全く同じプロンプトを使用する。
  • 各サービス固有のパラメータは使用しない。ただし、全サービス最新のバージョンに揃えるため、Midjourneyのみ、「–v 6.1」のパラメータを指定する。
  • ネガティブプロンプトは使用しない。
  • 複数一度に画像が出力されるサービス(Midjourneyとideogram)は、1枚目の画像を採用する。
  • 勝敗は私の完全なる主観で決める。

では、公正な(?)ルールが決まったところで、早速対決を始めましょう!

​リアルな人間の表情や目の表現

こちらのプロンプトを使用しました。

​A photo of face of a Japanese man at the agen of 30 looking at this way, zoom up, black background

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

これは難しい!MidjourneyとIdeogram 2.0の顔のリアルさがすごいです。ほとんど写真ですね。FLUX.1は写実的には遠いです。

​ということで、MidjourneyとIdeogram 2.0の引き分けとしたいと思います!

​リアルな人間の手の表現(箸を持っているとき)

こちらのプロンプトを使用しました。

​A photo of Vietnamese young woman at the age of 20 with Ao Dai that is traditional Vietnamese costume, eating Pho that is Vietnamese ordinary rice noodle with chopsticks, zoom up, at the outdoor table in the local restaurant

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

あれ?どうしたMidjourney!?急に写実性が失われました。箸を持っている手の描画も微妙です。

これはIdeogram 2.0の圧勝です!

リアルな犬

私の経験上、人間の顔は写実的に描かれても、動物がいまいち写実的ではないことが多かったので、このテーマを選びました。こちらのプロンプトを使用しました。

​A photo of an adorable and fluffy red Shiba inu puppy running on the ground with smiling under the sunny blue sky

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

これも難しいですが、Midjourneyの勝利としたいと思います。

写実性では、Ideogram 2.0がやや上のようにも思いますが、「走っている」感がなく、柴犬をプロンプトで指定していますが、どっちかというと秋田犬のような・・・?

​3Dのパステルカラー画像

こちらのプロンプトを使用しました。

​Illustration style, 3D, pastel colors, flat design, society of human working with robots, drawn, future

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

これはMidjourneyの圧勝だと思います!

人とロボットが共生する未来の社会をフラットデザインで描いてもらいましたが、Ideogramの画像はなんかダサく、FLUX.1は人がいません(あと、ロボットの首が浮いてる汗)。

商品バナー画像風文字付き

​A bottle of Japanese whisky with the label saying “玄界灘” in Kanji, on the white table, outdoor, in the forest, bright, under the sunny blue sky, small river behind the table

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

これも難しい。。。MidjourneyとIdeogram 2.0の引き分けとしたいと思います。FLUX.1も結構がんばっていると思います。

テキストの描画をうたっているIdeogram 2.0もさすがに漢字の描画は難しかったみたいです。プロンプトではウィスキーのボトルを指定しましたが、どれもウィスキーというよりもみりんの瓶みたいですね。

写実的な風景に文字をいれる

こちらのプロンプトを使用しました。

Broadway And The Theater District in New York city, at night, a lot of neon signs saying “WICKED”, “PHANTOM”, and “JERSEY BOYS” as movie titles, angle looking up from below at the corner

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

うーん、どれも微妙なので、引き分けとしたいと思います。

ニューヨークの雰囲気が一番出ていそうなのは、なんならFLUX.1かと思いましたが、一番見たかった文字の描写はどれもあまり正しくありません。

​アニメ風画像に文字をいれる

こちらのプロンプトを使用しました。鳥山明風のイラストに文字を載せて描画してくれることを期待します!

An ultra detailed illustration like Toriyama Akira style, long-haired man on a 750cc motorcycle with the label of “Vol.8” and “PENGUIN”, wearing a leather jacket, retro style, traffic sign with “STOP”

Midjourneyの出力
Midjourneyの出力
Ideogramの出力
Ideogramの出力
FLUX.1の出力
FLUX.1の出力

うーん、Midjourneyの勝ちかな・・・?

​どれも鳥山明風のイラストにはなりませんでしたが、Midjourneyが一番かっこいいと思います。描画すべき場所は誤っていますが、表示すべきテキストを全て表示できています。

まとめ

ということで、今回の対決では、Midjourneyの勝ち、時点がIdeogram 2.0となりました!

ただ、写実的な表現はIdeogram 2.0のほうがやや上のように感じました。Midjourneyはイラスト風画像の出力もバランスよくこなすことができ、文字の描画は期待したよりもIdeogram 2.0が力を発揮できなかったことで、Midjourneyの勝利につながったと思います。

今回の対決では力を発揮できなかったFLUX.1ですが、オープンソースであることと、APIを公開していることは非常に大きい利点(Beta版ではあるものの、IdeogramもAPIはあります)ですので、用途に応じて適切なサービスを選ぶことが重要と感じました!

本記事をご覧いただいた方にはこちらの資料がおすすめです!

人材業界向け生成AI活用ホワイトペーパーのカバー画像

人材業界ですぐに使える!
ChatGPTや生成AIの業務活用術

  • ChatGPTの概要と活用構成
  • 人材業界ですぐに使えるプロンプト例
  • 人材業界における生成AIの活用
  • 人材業界におけるサービス活用への課題

といった、特に人材業界向けの構成になっており、ChatGPTの基礎から、業務上の実務的な使用方法までをお伝えする資料です。

このような方にオススメ

  • 人材業界でChatGPTの基本が知りたい方
  • 人材業界でChatGPT導入を検討している方
  • 人材業界でChatGPTを業務やビジネスに活かす方法を知りたい方
最新の画像生成AI対決!Midjourney vs ideogram 2.0 vs FLUX.1

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次