DALL-E は最初のリリース以来大幅な進歩を遂げてきましたが、完璧には程遠いです。アート作成ツールには対処する必要のある問題が多数あり、その多くは定期的に使用することでより明らかになります。
DALL-E は最初のリリース以来大幅な進歩を遂げてきましたが、完璧には程遠いです。アート作成ツールには対処する必要のある問題が多数あり、その多くは定期的に使用することでより明らかになります。不一致や不適切なサイズ設定はほんの一例です。
1. まだ文章を正しく書けない
AI は画像内にテキストを書き込むのが得意ではありませんが、数十の AI アート ジェネレーターを試した結果、DALL-E はこの点で最悪の選択肢の 1 つです。通常、単純なリクエストでは成功しますが、以下に示すように、ソフトウェアは「Café」という単語のアクセント記号を綴るのにまだ苦労しています。
DALL-E の 9 つの最大の問題 写真 1
また、DALL-E は道路標識や類似のオブジェクトに対して判読可能なテキストを生成しないことにも気づくでしょう。
2. 要求されたときに画像のサイズを変更しないでください
DALL-E はイメージを作成する必要性を十分に理解していますが、要求されたときにサイズを変更できません。たとえば、この記事の著者は、さまざまなブログ用に画像のサイズを変更するようソフトウェアに何度も要求しました。しかしそのたびに、DALL-E は画像を再作成するだけでした。
幸いなことに、画像のトリミングとサイズ変更は非常に簡単です。 Canva など、それを可能にする無料ツールがたくさんあります。ただし、サードパーティのソフトウェアに依存せずにそれを実行できれば便利です。
3. リアルな画像を作成できない
DALL-E は被写界深度に関してはそれほど問題はありませんが、リアルな画像を生成するのはかなり苦手です。たとえば、著者はまず AI に、下の山にいるゴールデンレトリバーの画像を作成するように依頼しました (どのような種類の画像であるかは指定しませんでした)。
DALL-E の 9 つの最大の問題 写真 2
美しいながらも、この写真が AI を使用して作成されたものであることは明らかでした。そこで作者は、DALL-E に写真をより写実的にするよう依頼しました。しかし、結果はさらに偽物に見えました(少し不気味でさえありました)。
DALL-E の 9 つの最大の問題 写真 3
フォトリアリスティックなカスタム GPT を使用すると便利ですが、それにアクセスするにはプレミアム サブスクリプションが必要です。それ以外の場合は、Adobe Firefly など、フォトリアリスティックな結果を生み出す多くの AI アート作成ツールに頼ることもできます。
4. ソフトウェアは、何かをするなと指示しても聞き入れません
Midjourney、ChatGPT、その他の AI ツールでより適切なプロンプトを作成する 1 つの方法は、ソフトウェアに実行してほしくないことを指定することです。多くの場合、そうすることでより良い結果が得られます。ただし、DALL-E は例外です。
多くの場合、作者は DALL-E に対し、画像に特定の要素を含めないよう求めました。ただし、ツールはとにかくそれらを追加しました。イメージを再作成すると機能する場合もありますが、これは行わない方がよいでしょう。
逆に、Adobe Firefly を使用している場合、この問題が発生することはほとんどありません。
5. 一部の領域での不一致
AI アート作成ツールの多くには弱点があります。たとえば、Photo AI をテストしたとき、手を生成するのが特に苦手でした。 DALL-E にも欠点があり、多くの点で矛盾がありました。
DALL-E は一般に画像の生成には優れていますが、物体を持っている人々の画像の生成には必ずしも適しているわけではありません。コンピュータ画面の生成も苦手です。多くの場合、ランダムな形状が得られます。ソフトウェアにコンピュータ画面をオフにするように依頼すると、解決する場合があります。
6. 一貫性のない画像スタイル
DALL-E は、さまざまな種類のイメージを作成できます。絵画のような AI アートを作成したり、より 3D に見える画像を作成したりすることもできます。ただし、画像作成におけるこの多様性により、スタイルが一貫性のないものになる場合があります。
DALL-E にイメージの生成を依頼する場合は、何を希望するかを具体的に指定する必要があります。そうしないと、ランダムな何かが得られる可能性があります。アプリをテストするだけの場合は問題ありませんが、一貫したスタイルが必要な場合は問題になります。
7. アーティファクトのサイズ
写真の精度を重視する場合、写真内のオブジェクトを現実のものと比例して見せることが重要です。残念ながら、DALL-E では期待どおりに表示されないことがあります。たとえば、携帯電話を手に持っている人の画像を作成するようにソフトウェアに依頼すると、携帯電話が大きすぎる場合があります。
ソフトウェアに画像を広くするように依頼すると効果はありますが、実際には問題がさらに悪化し、最終的な画像が偽物のように見えます。さまざまな DALL-E 修正リクエストを試すと解決する可能性がありますが、全体としては、この問題に対する解決策はありません。
DALL-E の 9 つの最大の問題 写真 4
8. DALL-E は外部マテリアルの作成に困難を抱えています
一見すると、DALL-E は個人のカレンダー、誕生日カード、携帯電話の壁紙などを作成するのに最適な方法のように思えます。しかし、この分野ではこのソフトウェアがうまく機能しないことがすぐにわかります。
たとえば、DALL-E を使用して誕生日カードのカバーを作成しようとしたとき、作成者はアプリ内で画像を作成し、それを Moonpig のようなサービスにアップロードしたいと考えました。残念ながら、画像内にバースデーカードが入ったデザインになってしまいました。
DALL-E の 9 つの最大の問題 写真 5
本当にこのような種類のデザインに DALL-E を使用したい場合は、誕生日カードに使用するとは言わないでください。代わりに、プログラムに実行させたい内容を指定し、後でサイズを調整します。
注記: DALL-E で画像を作成し、別のアプリケーションでテキストを追加するのが最善です。
9. 画像にはオプションの要件がすべて示されているわけではありません
場合によっては、使用したい具体的な AI 設計がわからない場合があります。このような場合、ジェネレーターに頼って、複数の画像バリエーションを生成するように依頼するのが合理的かもしれません。しかし、私の経験では、ユーザーが複数のオプションを要求すると、DALL-E は非常に「怠惰」になる傾向があります。
多くの場合、受け取る写真は非常に似ているため、具体的に指定する必要があります。複数のバリエーションを要求するよりも、次から次へとイメージを作成する方が効果的です。
多くの人は依然として DALL-E を使用することを好みますが、それは完璧ではなく、最終的には問題に遭遇するでしょう。たとえば、カスタム GPT なしではフォトリアリスティックな画像を作成するのは苦手です。さらに、画像内の不要な要素を削除できないこともよくあります。ただし、これらの問題が発生した場合は、DALL-E を試して自分の目で確認する必要があります。
4.5 ★ | 2 票