画像生成AIソフト『Stable Diffusion Web UI』をPCにインストールしてみた

2024-11-24 2025-02-28

この記事の目次

はじめに
- 色々聞かれたりするんよ・・・
- 別にAI否定派ではないけど、ダメな方に向かっている気はする
画像生成AIをPCにインストールしてみようと思った理由
- なんとなくAIモデルを使ってみようかなと思った
- AI関連って高いのよ・・・
Stable Diffusion Web UI（Forge版）のインストール
- インストール方法
- インストールしたPCはマウスのDAIV Z6-I7G60SR-A
画像生成AIはキーワード入力パズル
- トライアンドエラーの繰り返し
- ワードを増やすと謎も増える
まとめ：やってみたら楽しいのとローカル版がおススメ

はじめに

自分は基本的にAIを活用していない方の人間です。

デジカメに搭載されたAIのディープラーニングによる恩恵を受けていたり、RAW現像ソフトもAIによる補助機能が使われていたり、日常生活でも知らないうちにAI記述が活用されているので知らないうちにかかわっている部分も多いんだと思いますが、質問型AIなどを自分から率先して利用しようとは思いませんでした。

そんな自分が画像生成AIを使ってみようと思ったのは本当にどうでもいい理由からでした。

色々聞かれたりするんよ・・・

会社のシステム管理なんかをしている人ならあるある話だと思いますが、コンピューターに詳しい＝なんでも知っているみたいな勘違いをする人が多いわけです。

正直、iPhoneユーザーにAndroidの設定とか、コンピューターとは関係のないデジタルガジェットの事や、あまつさえアプリの操作とか聞かれても忙しいときなんかだと「知るかボ〇！」って言いたくなる気持ちを持った人は大勢いるはず。

聞きたい気持ちはわかるけど、そもそも使ったことのないものの事なんて分かりませんて・・・(；´Д｀)

しかも大体が「人に聞けばいいと思っている」ので簡単なことでも自分で調べないし、すぐに忘れて同じことを何回も聞いてきたりするんですよ・・・

いや、もう自分でチャットAIに聞いてくれんか？

別にAI否定派ではないけど、ダメな方に向かっている気はする

自分は別にAI否定派でも肯定派でもありませんが、上で書いたように「聞けばいい」と思っている人がめっちゃ増えているわけですよ。

最初から「わからないから」と決めつけて、聞けばいいからと「覚えようとか理解しようという気がない」人間が増えていってもいいという方向に流れて行っている気がしてしまうんです。

自分で調べてやるよりもAIに聞く方が間違いがないからみたいなことを言っていた教授がいたようですが、それでいいなら大学とかいらなくね？って思うし。

聞いただけで覚えれるならだれも苦労しないし、人に聞いただけよりも聞いてから自分で消化した事柄は忘れにくいですからね。

AI自体は確かに便利なんだけど、使う側の人間も少しずつスキルを上げていかないといけないなぁと思う今日この頃。

80歳でも普通に働かなきゃいけない世の中になってしまっているので、受け身じゃなくて能動的にいかないとね。

画像生成AIをPCにインストールしてみようと思った理由

なんとなくAIモデルを使ってみようかなと思った

自分の趣味は写真撮影なわけですが、モデル撮影会に行くことは皆無ですし、SNSでモデルさんを募集して撮影・・・というのもハードルがかなり高いわけですよ。

ジジイだし、報酬を払えるほど余裕があるわけでもないし。

ということで、写真を撮影したときに微妙に余白ができたりする写真もあったりするわけですよ。

そんな時に画像生成AIを使えばいい感じになる（語彙力）んじゃないかと思ったんですよね・・・

上でいろいろと聞いてくる人のことを書いたけど、理解していないと大体こんな認識なんですよ。

AI関連って高いのよ・・・

今だとチャットAIや画像生成AIも様々なものがありますが、相対的にコストがかなりかかります。

無料だと画像が生成できる回数が制限されていたり、機能的に制限されていることが多かったりします。

チャット系なんかはフル活用するならいいんでしょうが、企業でもなく普通の一般人が毎月￥2,000くらいする有料機能に課金しても、正直「どないせえっちゅうねん」って感じですしね。

アフィリエイトやってんだからブログのPV伸ばすために活用しろって気がしなくもないんですが、伸びる保証もないし。

￥2,000使うなら2～３か月に1回焼肉に行くわ(´・ω・`)

ちなみに画像生成AIの方は完全にバクチ感があるので、いろいろと試しているうちに無料の制限に引っかかることが多いです。

そうじゃないねんって思いながらなんとなくキーワードを掴みかけて来たあたりで「課金しろ」って来るんでね・・・

で、いろいろと調べてみたところ、Stable Diffusion Web UIだったらローカルのPCで使えるものもあるようだったので、それをインストールしてみることにしました。

Stable Diffusion Web UI（Forge版）のインストール

インストール方法

Stable Diffusion Web UIのことを調べていてたどり着いたのがGPUSOROBANさん。

先に記載しておきますが、インストール方法に関してはここでごちゃごちゃ説明するよりもGPUSOROBANさんのサイトが細かく記載されているので、そちらをご覧いただいた方が間違いないです。（Stable Diffusionの使い方）

注意点としては、インストールしたところモデルファイルが全く何もない状態で画像生成ができなかったので、モデルの使い方を見てモデルファイルをダウンロードしておく方がいいかもしれません。

また、同ページに他のおすすめモデルもあるので、参考にするといいと思います。

スマホ用の画像生成AIアプリもあったりするけど、ブラックボックスな部分も多いので、本当に安全かどうかがね・・・

GPUSOROBANさんは画像生成AIや言語生成LLMなどの機械学習やCADなどの用途に必要なGPUインスタンス低価格で行えるGPUクラウドサービスを提供されています。

ただ、特にそういったことが仕事でもない人間が使うにはやはり高価。

なんならこのサイトを現在運用しているCONOHAが提供しているCONOHA AI Canvasというのも展開しているんですが、￥990/1ヶ月のエントリーコースで料金内で利用可能な無料時間が1時間／1ヶ月（超過分は6.6円/分）となっているので、あっという間に無料時間が終わる気がします。

実際にStable Diffusion Web UI（Forge版）をインストールした後はごちょごちょやってたらあっという間に2時間くらいたってました。

インストールしたPCはマウスのDAIV Z6-I7G60SR-A

DAIV Z6-I7G60SR-Aを買ってからぼちぼちと使っていましたが、そこまで処理が必要なものはあまり使ってきませんでした。

: マウスコンピューター DAIV Z6-I7G60SR-Aを買った
少し前から書いていましたが、WindowsのPCを買いました。マウスコンピューターのDAIV Z6-I7G60SR-A ...

基本スペックとしては以下の通り。

OS:Windows 11 Home 64bit
CPU:Intel Core i7-13700H
GPU:GeForce RTX 4060 Laptop GPU 8GB
メモリ:32GB（16GBx2 DDR5）

Stable Diffusion Web UIにはForge版とAUTOMATIC1111版があります。

Forge版の方がGPUのVRAMが少なくても動作するものになるので、6GBメモリのGPUでも動作するようです。

一方のATOMIC1111版も動作するのかもしれませんが、変に負荷がかかりすぎるのも嫌なのでForge版にしました。

画像生成AIはキーワード入力パズル

トライアンドエラーの繰り返し

上で書いたようにStable Diffusion Web UI（Forge版）にモデルファイル：kotajiro/yayoi_mixを使用して画像生成しています。

生成画面は特に必要なさそうな気もするのでカットしますが、ソフトの細かいパラメーターは放置、txt2imgのタブ内にあるボックスにキーワードを入力して［Generate］ボタンを押すと勝手に画像が生成されます。

flower,girlとかそのあたりで生成してみたらこんな感じのが出てきました。

生成するサイズによって負荷が変わります。

PCクーラーを使いながらだったらサイズXLでもいいんでしょうが、何もなしだったらサイズSDでもいいかもしれません。

いかにも生成AIって感じの画像しか出てきませんが、情報をカットして手探りでやってるので仕方ない。

ちなみに同じワードでも生成すると全く別物になったりするので、ある種のガチャ感はあります。

なんか生成するものすべてにブラーみたいな効果がかかっているので、ブラーを消したいなと思ったのに、なぜか間違えてFogと入れてしまったために霧の中を進む少女が出来上がってしまいました。

何枚か生成してみたけど全く違う内容になるのが面白いですね。

ぶっちゃけ、この辺りでもう1時間とか軽く超えてた。

ワードを増やすと謎も増える

人間のように柔軟に考えてくれる感じではないので、どこがどう優先されているのか全く分かりません。

なんとなく癖みたいなのはあるんでしょうが・・・

やっぱり右目がちょっと不自然よなぁ・・・

イラスト調にしたくてワードを入れているのに、イラストになったりならなかったり。

マジでランダム性があるので当たりはずれがあるなぁと思います。

NGワードでいろいろ制限できるようなんですが、そんなの知らないので普通にやってると腕や足が多かったり、腰が異常に長かったりという奇妙な状況が発生します。

一見まともだと思ったら右手が肩ではなく謎なものと繋がっているうえに謎なものから指が出てたり・・・(；´Д｀)

こういったのは別にローカル版だからではなくてWebで試していた他の生成AIでも何度も遭遇しています。

割とガチで自分が求める感じのものを生成しようと思ったら繰り返しが必要になるので、ローカル版の方を入れてよかったと思います。

何度かやってみてイラスト風が出なくなってしまったのでsketchpaintをキーワードに入れて生成したもの。

「バックを花」にするとなぜか服も花柄に・・・

ただ、繰り返しになりますがランダム性があるのでたまに予想外にいい感じの画像を生み出してくれたりもします。

日本のワードを入れると和服を着てきたりと、なかなか思った通りにはいかないんですが、なんかものすごく昔のキーワード入力型のPCゲーム（惑星メフィウス）なんかをやってるような気分になってきます。

ていうか・・・これって自分の癖がモロに分かるから当たり障りのない生成をする方がいいのかもしれないすな・・・(´・ω・`)

まとめ：やってみたら楽しいのとローカル版がおススメ

画像生成AIっていろいろと問題になっていたりするわけですが、別に画像生成AIに限らず現実でも運行に支障を与えるような撮り鉄とかもあったりするわけです。

あくまでも趣味として人に迷惑をかけないとか、マナーやモラルをもって行うのであれば画像生成AIもいいんじゃないかなぁと思いました。

あと、飽きっぽいけど妙にハマりがちになることがある人はマジで時間が溶けるのであまり触らない方がいいかもしれません。

そういったことを踏まえると、手軽に使えてそこまで速度も遅くないStable Diffusion Web UI（Forge版）は自分にとっては丁度よかったかもしれません。

XLでも生成するのに６～７秒くらいだし、そこまでとんでもない高速性を求めるわけでもないですしね。

ノートPCのスペックで十分に使えると思えるくらいなので、デスクトップPCならメモリが32GBくらいとある程度のGPUがあれば十分に楽しめるんじゃないでしょうか。

それ以上にハマってしまって速度とかを求めるのであればガチ組みするか、クラウドサービスを使うかといったところでしょう。

起動には少し時間がかかりますが、手軽に遊べるので家での隙間時間とかにちょいちょい弄っていきたいと思います。

tomo

■兵庫県在住 ■デジタル・フィルム問わず、カメラを持って街中をウロウロして撮影した写真を公開しています。時々カメラ以外の記事も公開中。コメントなどありましたらお気軽にどうぞ。当サイトはアフィリエイト広告で収益を得ています。アフィリエイトやサイトの詳細はプロフィールページでご確認いただけます ◆プライバシーポリシー・免責事項 ◆プライバシーと Cookie の設定 ◆お問い合わせはこちら

-PC関連
-pc

comment コメントをキャンセル

こちらもどうぞ

2026/3/16

職場のPCをWindows11からApple MacBook Neoに乗り替えてみた感想

はじめにブログで度々書いているんですが、Windows11のアップデートテロによって仕様変更という名の環境破壊だけではなく、とうとう業務にかなり差し障りが出るような不具合まで発生したおかげで、Windowsを使うことに対して辟易していたわけです。仕事が停滞したりしてもMSが何かしてくれるわけでもなく、「おま環」みたいな感じになってしまってて、流石にもう業務が止まって自分の首が絞まるのは違うんじゃね？って事で、先週の発表翌日には家電量販店で予約が開始されていたのでテストケースを兼ねる形で自分の業務用PC ...

2026/3/8

UGREENのタブレットスタンドで液タブのサブモニター化が完了した

XPPenのArtist 12 3rdを買った後にTourBox Eliteも購入した事で、お絵描き環境の構築はできました。実際にはお絵描き環境だけじゃなくてQTプレイヤーのショートカットをTourBoxに設定する事で動画をみながらのマウス操作も不要になったりして色々と快適になっています。 https://mossariweb.net/2026/03/39955/ Artist 12 3rdの記事でも書いたんですが、唯一の欠点というか「こうだったらいいな」という部分が残っていて、それはArtist 12 ...

2026/3/6

Amazonのセールで安かったのでTourBox Eliteを買ってしまった

はじめに先週の土曜日にXPPenの液晶タブレット『Artist 12 3rd』を買って、その記事を書いたのが今週の初めの月曜日。 https://mossariweb.net/2026/02/39873/ その時にTourBoxと比べて悩んだ末に液晶ペンタブレットにして、それでも十分だという事を書きました。そもそもTourBoxにしなかったのは価格が高すぎるんじゃね？という単純な部分だったわけです。その点、液タブだと直感的にイラストも描けるしサブモニターにも出来てめっちゃ便利だなぁと思って選んだので ...

2026/3/2

XPPenの液晶ペンタブレット『Artist 12 3rd』を買ってMac Studioに繋いでみた

はじめに動画編集用に左手デバイスがあったら便利かなぁ・・・・なんて事を考えていたんですが。気がついたら左手デバイスではなく液タブを買ってました。意味がわかんないと思われるかもしれませんが、割と自分でも意味がわからなくて頭がとうにかなっちまいそうだったぜ・・・という事で、購入したのはコスパ重視なメーカーでもあるXPPenのArtist 12 3rdというモデル。なんか日本限定パッケージの液タブらしくて、パッケ絵師さんのアイテムが入ってたりするようです。 12型（11.9インチ）のフルHD液晶で、16 ...

2026/2/19

Mac Studioで動画編集をしたら、快適すぎて重いのに耐えていたのは何だったのかと・・・

折角なのでちょっと無茶なことでもしてみようと思ってSONY α1 IIで8K30pの動画を撮ってみようと思って持ち出してみました。一番重いのが8K30pかなぁと思って持ち出したわけですが、流石に普通に写真も撮ってました。 SONY α1 II + FE 24-70mm F2.8 GM II 　早咲きの桜も満開になってきていていい感じに見頃になってます。 SONY α1 II + FE 24-70mm F2.8 GM II M.ZUIKO 50-200mm F2.8辺りを使えば楽しそうだけど、流石にあの ...

2026/2/18

Apple Mac Studio M4 Max(16コアCPU/40コアGPU)を買ってしまった

はじめに 2021年5月20日頃にMacBook Pro 2020 13インチ（M1、16GB、SSD 1TB）を買ってから約5年近く使い続けてきました。 https://mossariweb.net/2021/05/6613/ ProでもMaxでもUltraでもないただのM1 CPUでメモリも16GBですが、ぶっちゃけ大量のRAWデータを自動現像する事もなければ、ゴリゴリに凝った動画を作るとかでなければ今でも全く何の問題もなく使えたりします。（使用するソフトにもよるけど）ただ、どうしてもノートタイプで ...

LUMIX S9で撮る通勤路の朝と夜

そろそろ年末セールが佳境になってきました