このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第107回

最強スペックなのに無料 謎の画像生成AI「HiDream-l1」

2025年05月19日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

 4月8日、「HiDream-I1(ハイドリーム・アイワン)」という画像生成AIモデルが公開されました。公開したのは、画像や動画、3Dモデルが使えるAIプラットフォームを展開している香港のAI企業VivagoAI。開発元は北京のHiDream.aiです。性能的には、現在ハイエンド向けに高い人気を保つ独Black Forest Labsの「Flux.1」以上の性能を持つとも言われますが、Flux.1よりも踏み込んだのは、フルスペックモデル「HiDream-I1-Full」をオープンモデルとして公開されている点です。そのモデルの実力を探りました。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

プロンプト追従性が高く、実写画像がそれなりに強い

 HiDream-I1-Fullの特徴は、複雑なプロンプトを理解する能力です。また、実写系の画像はそれなりに強く、アニメ系の画像もそれなりに生成できるようです。

 VRAMが求められるということで、筆者のNVIDA RTX A6000(VRAM 48GB、スペック的にはRTX 3090に相当)のローカルPCで試しました。圧縮率の小さい「hidream_i1_full_fp16」の場合、起動の読み込みのために3分近くかかり、VRAMは45GBとほぼフルで使い切りました。生成には1枚あたり約120秒かかっています。

人物は適切に出力されるが、少しあっさりとした生成結果になる傾向を感じる

プロンプトは日本語でもそのまま設定可能で、この画像は「高速道路を、スーパーカーが走り抜けている。何台ものパトカーとカーチェイスになっており、激しいぶつかりあいになっている。背景は高層ビル街。画像は写真風で、リアリスティック」

アニメ風の画像もそれなりに出る。ただ、魅力的かというと評価が難しく、既存の他社モデルより優れているとまでは感じられなかった。もっとプロンプトを精査していく必要がありそうではあるが

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ