はじめに
自分は基本的にAIを活用していない方の人間です。
デジカメに搭載されたAIのディープラーニングによる恩恵を受けていたり、RAW現像ソフトもAIによる補助機能が使われていたり、日常生活でも知らないうちにAI記述が活用されているので知らないうちにかかわっている部分も多いんだと思いますが、質問型AIなどを自分から率先して利用しようとは思いませんでした。
そんな自分が画像生成AIを使ってみようと思ったのは本当にどうでもいい理由からでした。
色々聞かれたりするんよ・・・
会社のシステム管理なんかをしている人ならあるある話だと思いますが、コンピューターに詳しい=なんでも知っているみたいな勘違いをする人が多いわけです。
正直、iPhoneユーザーにAndroidの設定とか、コンピューターとは関係のないデジタルガジェットの事や、あまつさえアプリの操作とか聞かれても忙しいときなんかだと「知るかボ〇!」って言いたくなる気持ちを持った人は大勢いるはず。
聞きたい気持ちはわかるけど、そもそも使ったことのないものの事なんて分かりませんて・・・(;´Д`)
しかも大体が「人に聞けばいいと思っている」ので簡単なことでも自分で調べないし、すぐに忘れて同じことを何回も聞いてきたりするんですよ・・・
いや、もう自分でチャットAIに聞いてくれんか?
別にAI否定派ではないけど、ダメな方に向かっている気はする
自分は別にAI否定派でも肯定派でもありませんが、上で書いたように「聞けばいい」と思っている人がめっちゃ増えているわけですよ。
最初から「わからないから」と決めつけて、聞けばいいからと「覚えようとか理解しようという気がない」人間が増えていってもいいという方向に流れて行っている気がしてしまうんです。
自分で調べてやるよりもAIに聞く方が間違いがないからみたいなことを言っていた教授がいたようですが、それでいいなら大学とかいらなくね?って思うし。
聞いただけで覚えれるならだれも苦労しないし、人に聞いただけよりも聞いてから自分で消化した事柄は忘れにくいですからね。
AI自体は確かに便利なんだけど、使う側の人間も少しずつスキルを上げていかないといけないなぁと思う今日この頃。
80歳でも普通に働かなきゃいけない世の中になってしまっているので、受け身じゃなくて能動的にいかないとね。
画像生成AIをPCにインストールしてみようと思った理由
なんとなくAIモデルを使ってみようかなと思った
自分の趣味は写真撮影なわけですが、モデル撮影会に行くことは皆無ですし、SNSでモデルさんを募集して撮影・・・というのもハードルがかなり高いわけですよ。
ジジイだし、報酬を払えるほど余裕があるわけでもないし。
ということで、写真を撮影したときに微妙に余白ができたりする写真もあったりするわけですよ。
そんな時に画像生成AIを使えばいい感じになる(語彙力)んじゃないかと思ったんですよね・・・
上でいろいろと聞いてくる人のことを書いたけど、理解していないと大体こんな認識なんですよ。
AI関連って高いのよ・・・
今だとチャットAIや画像生成AIも様々なものがありますが、相対的にコストがかなりかかります。
無料だと画像が生成できる回数が制限されていたり、機能的に制限されていることが多かったりします。
チャット系なんかはフル活用するならいいんでしょうが、企業でもなく普通の一般人が毎月¥2,000くらいする有料機能に課金しても、正直「どないせえっちゅうねん」って感じですしね。
アフィリエイトやってんだからブログのPV伸ばすために活用しろって気がしなくもないんですが、伸びる保証もないし。
¥2,000使うなら2~3か月に1回焼肉に行くわ(´・ω・`)
ちなみに画像生成AIの方は完全にバクチ感があるので、いろいろと試しているうちに無料の制限に引っかかることが多いです。
そうじゃないねんって思いながらなんとなくキーワードを掴みかけて来たあたりで「課金しろ」って来るんでね・・・
で、いろいろと調べてみたところ、Stable Diffusion Web UIだったらローカルのPCで使えるものもあるようだったので、それをインストールしてみることにしました。
Stable Diffusion Web UI(Forge版)のインストール
インストール方法
Stable Diffusion Web UIのことを調べていてたどり着いたのがGPUSOROBANさん。
先に記載しておきますが、インストール方法に関してはここでごちゃごちゃ説明するよりもGPUSOROBANさんのサイトが細かく記載されているので、そちらをご覧いただいた方が間違いないです。(Stable Diffusionの使い方)
注意点としては、インストールしたところモデルファイルが全く何もない状態で画像生成ができなかったので、モデルの使い方を見てモデルファイルをダウンロードしておく方がいいかもしれません。
また、同ページに他のおすすめモデルもあるので、参考にするといいと思います。
スマホ用の画像生成AIアプリもあったりするけど、ブラックボックスな部分も多いので、本当に安全かどうかがね・・・
GPUSOROBANさんは画像生成AIや言語生成LLMなどの機械学習やCADなどの用途に必要なGPUインスタンス低価格で行えるGPUクラウドサービスを提供されています。
ただ、特にそういったことが仕事でもない人間が使うにはやはり高価。
なんならこのサイトを現在運用しているCONOHAが提供しているCONOHA AI Canvasというのも展開しているんですが、¥990/1ヶ月のエントリーコースで料金内で利用可能な無料時間が1時間/1ヶ月(超過分は6.6円/分)となっているので、あっという間に無料時間が終わる気がします。
実際にStable Diffusion Web UI(Forge版)をインストールした後はごちょごちょやってたらあっという間に2時間くらいたってました。
インストールしたPCはマウスのDAIV Z6-I7G60SR-A
DAIV Z6-I7G60SR-Aを買ってからぼちぼちと使っていましたが、そこまで処理が必要なものはあまり使ってきませんでした。
基本スペックとしては以下の通り。
OS:Windows 11 Home 64bit
CPU:Intel Core i7-13700H
GPU:GeForce RTX 4060 Laptop GPU 8GB
メモリ:32GB(16GBx2 DDR5)
Stable Diffusion Web UIにはForge版とAUTOMATIC1111版があります。
Forge版の方がGPUのVRAMが少なくても動作するものになるので、6GBメモリのGPUでも動作するようです。
一方のATOMIC1111版も動作するのかもしれませんが、変に負荷がかかりすぎるのも嫌なのでForge版にしました。
画像生成AIはキーワード入力パズル
トライアンドエラーの繰り返し
上で書いたようにStable Diffusion Web UI(Forge版)にモデルファイル:kotajiro/yayoi_mixを使用して画像生成しています。
生成画面は特に必要なさそうな気もするのでカットしますが、ソフトの細かいパラメーターは放置、txt2imgのタブ内にあるボックスにキーワードを入力して[Generate]ボタンを押すと勝手に画像が生成されます。
flower,girlとかそのあたりで生成してみたらこんな感じのが出てきました。
生成するサイズによって負荷が変わります。
PCクーラーを使いながらだったらサイズXLでもいいんでしょうが、何もなしだったらサイズSDでもいいかもしれません。
いかにも生成AIって感じの画像しか出てきませんが、情報をカットして手探りでやってるので仕方ない。
ちなみに同じワードでも生成すると全く別物になったりするので、ある種のガチャ感はあります。
なんか生成するものすべてにブラーみたいな効果がかかっているので、ブラーを消したいなと思ったのに、なぜか間違えてFogと入れてしまったために霧の中を進む少女が出来上がってしまいました。
何枚か生成してみたけど全く違う内容になるのが面白いですね。
ぶっちゃけ、この辺りでもう1時間とか軽く超えてた。
ワードを増やすと謎も増える
人間のように柔軟に考えてくれる感じではないので、どこがどう優先されているのか全く分かりません。
なんとなく癖みたいなのはあるんでしょうが・・・
やっぱり右目がちょっと不自然よなぁ・・・
イラスト調にしたくてワードを入れているのに、イラストになったりならなかったり。
マジでランダム性があるので当たりはずれがあるなぁと思います。
NGワードでいろいろ制限できるようなんですが、そんなの知らないので普通にやってると腕や足が多かったり、腰が異常に長かったりという奇妙な状況が発生します。
一見まともだと思ったら右手が肩ではなく謎なものと繋がっているうえに謎なものから指が出てたり・・・(;´Д`)
こういったのは別にローカル版だからではなくてWebで試していた他の生成AIでも何度も遭遇しています。
割とガチで自分が求める感じのものを生成しようと思ったら繰り返しが必要になるので、ローカル版の方を入れてよかったと思います。
何度かやってみてイラスト風が出なくなってしまったのでsketchpaintをキーワードに入れて生成したもの。
「バックを花」にするとなぜか服も花柄に・・・
ただ、繰り返しになりますがランダム性があるのでたまに予想外にいい感じの画像を生み出してくれたりもします。
日本のワードを入れると和服を着てきたりと、なかなか思った通りにはいかないんですが、なんかものすごく昔のキーワード入力型のPCゲーム(惑星メフィウス)なんかをやってるような気分になってきます。
ていうか・・・これって自分の癖がモロに分かるから当たり障りのない生成をする方がいいのかもしれないすな・・・(´・ω・`)
まとめ:やってみたら楽しいのとローカル版がおススメ
画像生成AIっていろいろと問題になっていたりするわけですが、別に画像生成AIに限らず現実でも運行に支障を与えるような撮り鉄とかもあったりするわけです。
あくまでも趣味として人に迷惑をかけないとか、マナーやモラルをもって行うのであれば画像生成AIもいいんじゃないかなぁと思いました。
あと、飽きっぽいけど妙にハマりがちになることがある人はマジで時間が溶けるのであまり触らない方がいいかもしれません。
そういったことを踏まえると、手軽に使えてそこまで速度も遅くないStable Diffusion Web UI(Forge版)は自分にとっては丁度よかったかもしれません。
XLでも生成するのに6~7秒くらいだし、そこまでとんでもない高速性を求めるわけでもないですしね。
ノートPCのスペックで十分に使えると思えるくらいなので、デスクトップPCならメモリが32GBくらいとある程度のGPUがあれば十分に楽しめるんじゃないでしょうか。
それ以上にハマってしまって速度とかを求めるのであればガチ組みするか、クラウドサービスを使うかといったところでしょう。
起動には少し時間がかかりますが、手軽に遊べるので家での隙間時間とかにちょいちょい弄っていきたいと思います。