2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

Midjourney】AI画像生成技術交換2【StableDiffusion

1 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:38:25.17 ID:Cv/bdJEy.net
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(他のスレがありますのでそちらに移動してください)

前スレ
【Midjourney】 AI画像生成 【DALLE】
https://mevius.5ch.net/test/read.cgi/cg/1659786388/

2 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:39:17.08 ID:Cv/bdJEy.net
■関連リンク
【Midjourney】 https://www.midjourney.com/
【StableDiffusion】https://stability.ai/
【DALL・E2】 https://openai.com/dall-e-2/
【craiyon】(旧DALL・E・mini) https://www.craiyon.com/

英語スキルはあるといいですが、別に今時なくても何とかなります
【Google翻訳】 https://translate.google.co.jp/
【DeepL翻訳】 https://www.deepl.com/translator

3 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:40:16.65 ID:Cv/bdJEy.net
StableDiffusionの人の他社製品比較

https://twitter.com/EMostaque/status/1561349836980584455
・StableDiffusion、DALLE2、midjourneyは全て異なるものだ
・この分野は、去年(2021年1月)にOpenAIがCLIPを公開したことで始まった
 これにより画像生成のガイドが可能になった

●DALLE2
 ・モデルかつサービス。インペインティングは最高の機能だが、ランダムなのでアイデア出しやより企業的な用途に最も適している。
 ・来年にはコストが10分の1以下になりAPIも公開されると思われる
 ・トレーニングデータは著作権のあるイメージなので、オープンソースにはならないと思だろう
●MidJorney
 ・VCの資金提供を受けたベンチャー、ではなく研究所
 ・非常に独特な絵画のようなスタイルを持っている
 ・一貫性に膨大な労力が必要。ランダム性が強いがある程度コントロールは可能
 ・オープンソースとそうでない部分がある。
●StableDiffusion
 ・アートからプロダクトまで、あらゆるタイプのイメージに対応する一般的な基礎モデルでもうすぐリリースされる
 ・まもなくDreamStudioプロシューマーサービスを発表する
 ・今まで皆さんが見ていたものベータ版のモデルテストから得られた生の出力で、前処理も後処理も行っていない
  これらを使うことで格段に良くなり、きめ細かいコントロールに力を入れた
 ・オープンソースのモデルなので、誰でも使うことができる。コードもデータセットもすでに公開されている
  そのため、誰もがこのモデルを改良し、構築することができる
(deleted an unsolicited ad)

4 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:42:45.11 ID:Cv/bdJEy.net
【ツイッター】
https://twitter.com/hashtag/midjourney
https://twitter.com/hashtag/dalle2
https://twitter.com/hashtag/stablediffusion
こんなのができます

【Midjourneyお役立ち情報】
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference
調べてみたら使いやすいPrompt wordはここに全部まとまってたわ
https://docs.google.com/spreadsheets/d/10i9Ip8tVSERAuMWbc6-H6BUFCoUGOQ91YzDvX--c4bk/edit#gid=0
各アーティストのまとめ
(deleted an unsolicited ad)

5 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:48:18.61 ID:Cv/bdJEy.net
テンプレはまぁ黎明期なんで適当で・・流動的に
スレが今後も続くなら勝手に追加or削除してください

6 :名無しさん@お腹いっぱい。:2022/08/22(月) 14:57:27.91 ID:NxWgAhzV.net
SDについて直近でまぁまぁわかりやすくレポしてる人がいた(本人じゃないよ)
https://note.com/yamkaz/n/n9fd522bb012e

7 :名無しさん@お腹いっぱい。:2022/08/22(月) 15:11:30.91 ID:NxWgAhzV.net
>>2
【DreamStudio】 https://beta.dreamstudio.ai/

SDはこっちの方がいいね

8 :名無しさん@お腹いっぱい。:2022/08/22(月) 15:37:10.50 ID:NxWgAhzV.net
DreamStudio垢作って入るとこまで来たけど
パラメーターの意味やコマンドの説明とかどこかにない?
Cfg Scaleはだいたいどのくらい近づけるか
Stepsはなんだろう、そのくらい拡散させるか?で高い方が消費する?

あと、無料の残り回数ってどうやったら見られるんだろう
MJと違って説明してるサイトみたいなのが皆無でわけがわからない

9 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
【悲報】絵師さん、あと数日で全員失職へ 超高性能画像生成AIが無料公開予定 [659885898]
http://greta.5ch.net/test/read.cgi/poverty/1661141460/
https://note.com/fladdict/n/n13c1413c40de

10 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:14:03.48 ID:NxWgAhzV.net
わかった
右上の自分の垢アイコンクリックしてmembershipに「£」って単位である
*** generationsっておおよその残りが表示される、下に購入もある
あと左のaccount settingsからsafe mode(NSFWフィルター)のオフがあったみたいだけど
今の無料verでは現状外されてる?らしく、どこにも見当たらない

cfg scaleはデフォの7(少なくとも5あたり)にしとかないと文字通りのが出てこない、MJの--sの逆みたいな感じ
stepはどれだけ精彩にするかみたいな感じ?MJの--qに近い感じか

steps 50のデフォ設定で無料の2.000が0.02減るので、無料では100回試行可能
クオリティ上げるとそれ以下になる感じ、steps 10の最低だと0.004減った、cfg 7でも凄くいい加減な抽象画みたいに

デフォのA dream of a distant galaxy・・の文字列がいちいち入るのはなんとかならないんだろうか

11 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:17:20.65 ID:w7NMTPr2.net
craiyonで練習してMJ使ってきたが俺はcraiyonの方が好きだったな
MJは俺には絵画的すぎた
craiyonって旧名Dalleminiなんだっけ
じゃあDalle2が後継なのかな?
すごいと噂のSDも次やってみたいけど
使い方ぜんぜん載ってないな

12 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:21:02.28 ID:w7NMTPr2.net
>>10
SD情報まじでありがたいです

13 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:26:35.60 ID:NxWgAhzV.net
> 使い方ぜんぜん載ってないな
ほんとこれ
redditとかでは喧々囂々やってるみたいなんだけど、英語だしね
https://www.reddit.com/r/StableDiffusion/
あれこれ情報を共有していければいいね

https://twitter.com/hashtag/dreamstudio
実質今日からだから、みんな試行錯誤状態だね
MJ見たいにガチャで突発的にとんでもないのは生まれず、ジワジワ寄せていくような印象?
どことなくDALLE2に近いような
(deleted an unsolicited ad)

14 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:37:15.03 ID:w7NMTPr2.net
>>13
そうだね、無事スレが賑わうと良いな

620 名無しさん@お腹いっぱい。 sage 2022/08/21(日) 09:58:08.78 ID:4bnS4Iwr
DALL-E 2 、 Midjourney 、 StableDiffusionの比較
https://twitter.com/fabianstelzer/status/1561019187451011074

Midjourneyはすごい映えるってか、ライティングを派手にしがち
https://twitter.com/5chan_nel (5ch newer account)

俺も前スレのこれ見てDALL-E 2とSDはちょっと近いなと思ってた

SD試してくるわ
(deleted an unsolicited ad)

15 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:40:02.70 ID:NxWgAhzV.net
あとMJで徹底的にやってた
https://twitter.com/8co28
この人が試し始めてるみたいだから注目してる
(deleted an unsolicited ad)

16 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:58:04.52 ID:NxWgAhzV.net
DSは正式にはDreamStudio Liteなのか、無料はliteなのかよくわからん
どのみちSDのDiscord終わったから、他人のテキストがパクれないのが辛い・・
MJはそでれかなり勉強させてもらったんだけど
redditでだいたい書いてる人いるけど、すべては明かしてない感じだし

£100で10K generationsだから、1回0.01ポンド、1.61円か
MJのFastモードの1/4くらいだけど、MJは無料のRelaxで期間中はいつまでも生成できるからなぁ
使い切った後の無料で作った枚数の方がもう多くなったよ、気楽だし

17 :名無しさん@お腹いっぱい。:2022/08/22(月) 17:59:48.31 ID:zTyUniMb.net
その人Midjourneyで生成したこと伏せて投稿し始めたからモヤる

18 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>15,17
メイドインアビスの人物は自分で書いてる気がする。
ナナチっぽいケモノ耳キャラはMidjourneyでmade in abyssとすれば出てくるけど、リコやリグは多分出す方法がないはず

その辺ちゃんと書いてくれると参考になって嬉しいけど、今後はわざわざ書かなくなる人が増えそう

19 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
DSは
https://note.com/abubu_nounanka/n/n20d548c4994b
> 最大品質の「解像度1024*1024ステップ数150」では、一度に28.2の計算コストがかかります

最大一発で28枚分(45円)はちょっとなぁ・・でもいいの出来たら同seedで突っ込んでみたくなっちゃうし
そこら結構、常に金が密接に絡んできてて、ケチな自分には窮屈な印象がある
relaxモードあったら嬉しいんだけど、ないよなぁ

20 :名無しさん@お腹いっぱい。:2022/08/22(月) 18:23:11.24 ID:1FARu7zX.net
DS2枚目で速攻エロワード入れて怒られた

21 :名無しさん@お腹いっぱい。:2022/08/22(月) 18:38:19.35 ID:mJiRi32m.net
4chのSDスレ
https://boards.4channel.org/g/thread/88237460

22 :名無しさん@お腹いっぱい。:2022/08/22(月) 18:51:51.13 ID:NxWgAhzV.net
>>21
こいつらほんとおっぱい好きだな・・
https://i.4cdn.org/g/1661149886739826.png

23 :名無しさん@お腹いっぱい。:2022/08/22(月) 19:12:23.41 ID:mJiRi32m.net
>>22
4chanお祭り騒ぎだね
彼らにはめっちゃ期待してる

24 :名無しさん@お腹いっぱい。:2022/08/22(月) 19:59:39.19 ID:NxWgAhzV.net
https://twitter.com/660_dot
アニメ風に強いのかな
(deleted an unsolicited ad)

25 :名無しさん@お腹いっぱい。:2022/08/22(月) 20:03:46.06 ID:NxWgAhzV.net
>>14
> 俺も前スレのこれ見てDALL-E 2とSDはちょっと近いなと思ってた

https://zenn.dev/tomo_makes/scraps/d44352885a1eec
> CLIP特徴とDiffusion Modelを組み合わせたテキストからの画像生成に、GLIDE、unCLIP (DALL-E 2)がある

難しくて半分も理解できないけど、Diffusion系とDALLE系は同祖ってことみたい

26 :名無しさん@お腹いっぱい。:2022/08/23(火) 00:34:29.11 ID:YfpQWt2D.net
Stable Diffusionはネットに繋がないローカルPCで使えるの?

27 :名無しさん@お腹いっぱい。:2022/08/23(火) 00:39:45.77 ID:wOHCe40x.net
見た感じ無料で何回でもローカルで使えるけど最低でもVRAM10GBは必要かな?
もし3080以上要求されるならちょっとハードル高いよな

28 :名無しさん@お腹いっぱい。:2022/08/23(火) 00:48:18.30 ID:QFPulAhi.net
980ti(VRAM6GB)でやったらCUDAがねぇよって止まった、対応してるGPUなのに
ドライバとかCUDA toolkitとかインストールしてたらPC立ち上がらなくなってセーフモードから復元
・・諦めた

29 :名無しさん@お腹いっぱい。:2022/08/23(火) 00:48:31.20 ID:B9jo2Sb1.net
>>26
インストールはダウンロードがいるのでネット接続いるけど、インストール完了したらネットに繋がなくても使える

バージョンは最新じゃないけどこの手順で動く
https://mevius.5ch.net/test/read.cgi/cg/1659786388/630

昨日正式リリース版0.2.3が公開されて、モデルも最新版が数時間以内に公開されるはず。
https://github.com/huggingface/diffusers/releases/tag/v0.2.3

>>27
公式はそうだけど、省メモリでも動くクローンを誰か作ってくれるはず・・・
そういう場合は無理にローカルで動かさずgoogle colabのほうがいいけど

30 :名無しさん@お腹いっぱい。:2022/08/23(火) 01:07:30.82 ID:YfpQWt2D.net
>>29
なるほどサンクス
dreamstudioはウェブ版って感じなのね

完全にローカルで動くなら、肖像権上等、ロリ、エログロみたいなアウトも出力するAIが遠からず出るんだろうな
そしてそのAIを保有してたらアウトな法律も追って出るだろうし

アダルト特化AIが出るのを待つか‥速攻でDLして金庫に補完するか‥

31 :名無しさん@お腹いっぱい。:2022/08/23(火) 01:38:07.48 ID:r9bKnxJX.net
AI画像生成アンチスレが欲しい

32 :名無しさん@お腹いっぱい。:2022/08/23(火) 01:46:07.99 ID:QFPulAhi.net
>>31
CGの未来スレ
https://mevius.5ch.net/test/read.cgi/cg/1659706163/

33 :名無しさん@お腹いっぱい。:2022/08/23(火) 02:00:06.87 ID:oLC3YB0B.net
SDのモデル公開あと1時間後か
寝る

34 :名無しさん@お腹いっぱい。:2022/08/23(火) 13:08:25.20 ID:K67yyjZy.net
さて公開されたが
どう使うんですか?

35 :名無しさん@お腹いっぱい。:2022/08/23(火) 14:00:19.94 ID:vpSfEaKN.net
会社のPCで早速やってみた
無限に生成できるの草だわ
フィルターもないし当分楽しめそう

36 :名無しさん@お腹いっぱい。:2022/08/23(火) 23:57:45.73 ID:QFPulAhi.net
>>16
自己レス
> MJのFastモードの1/4くらいだけど
DSは512x512で、MJは1024x1024なんだから当たり前の話だった
とりわけMJが高いわけではない

37 :名無しさん@お腹いっぱい。:2022/08/24(水) 09:18:13.63 ID:l/29Ttzd.net
DreamStudioやろうとして、間違えてStableDiffusionのサブスクリプションの登録をしてしまった。登録解除フォームが見当たらなかったから問い合わせからサブスク解除希望送ったけどこれで大丈夫でしょうかね、、、アホですみせん。

38 :名無しさん@お腹いっぱい。:2022/08/24(水) 12:20:16.80 ID:lSgIFxuv.net
あれは放置したままのあのサイトが悪い
当時一旦切られたDiscordのStableDiffusionの無料βの追加募集フォームだったんだけど、事態が早く動いて尻切れトンボ
もうDiscordのSDそのものが閉鎖されて普通に有料サブスクまであるDreamStudioが動いてるのに

自分も登録したままだけどなんの音沙汰もないけど、
同じメールアドレスの登録で普通にDreamの方使えたし一切気にしなくてOK
無視無視

39 :名無しさん@お腹いっぱい。:2022/08/24(水) 12:47:36.70 ID:qUqKG484.net
GTX1080(VRAM8GB) Windows11 WSLで低VRAM版が動いてる
苦労したのはgit lfsインストール前にcloneした学習データでエラーが出てたことに気が付かなかった事

40 :名無しさん@お腹いっぱい。:2022/08/24(水) 13:32:21.21 ID:AduC0iug.net
>>38
ありがとうちょっと安心した。
メールアドレスだけだからそもそも何も金かからんとは思うけど
サブスク=金かかるって気がするからちょと怖かった。

41 :名無しさん@お腹いっぱい。:2022/08/24(水) 18:50:47.78 ID:MizOilz4.net
設定が分からんグラボの設定とかあるのかな結構時間がかかる
こんなもん?

42 :名無しさん@お腹いっぱい。:2022/08/24(水) 19:04:11.23 ID:MizOilz4.net
this image was not displayed because our detecion model detected unsafe content
こんなん出たんだけど、表示するにはどうすればいいの?

43 :名無しさん@お腹いっぱい。:2022/08/24(水) 19:34:39.39 ID:or+gwnRD.net
●StableDiffusion 2022/8/24時点(model 1.4)のリソース等
・Google Colab https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
・Google Colab(フィルタ解除版) https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17
・ローカル環境等(フィルタ解除版) https://rentry.org/kretard
・Discord https://discord.gg/stablediffusion
・中の人のtwitter https://twitter.com/EMostaque
・海外情報reddit https://www.reddit.com/r/StableDiffusion/

・今後
 ・モデル v1.5の公式ツイートあり(時期不明)
 ・アニメ用モデルの公式ツイートあり(”すぐ")
 ・来月は”audio"モデル、その後3D、ビデオ予定(時期不明)

●アーティストごとの傾向等
DDのアーティストごとの傾向
https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies/
https://docs.google.com/spreadsheets/d/14xTqtuV3BuKDNhLotB_d1aFlBGnDJOY0BRXJ8-86GpA/

SDのアーティストごとの傾向
https://proximacentaurib.notion.site/e2537cbf42c34b7e9a9a4126f81dfd0d?v=7b4a3c03fb654045be324eb71acc57e6

このリンク集も参考になる
https://pharmapsychotic.com/tools.html

https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/
(deleted an unsolicited ad)

44 :名無しさん@お腹いっぱい。:2022/08/24(水) 20:48:37.04 ID:jWF3QC6K.net
>>43
有益な情報ありがとう

45 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:01:36.49 ID:wKycywnC.net
>>43
まだモデル出るのか
すごいな

46 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:31:17.12 ID:aJBVxFrq.net
今はGoogleでStable Diffusion試みてるんですけれどパイプラインの準備ってところでエラーでて進みません。
このでコマンドの書き換えとかあるのでしょうか?

47 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:38:50.65 ID:or+gwnRD.net
>>46
どこかの実行を飛ばしてしまってるか、Hugging faceのアクセ設定ができてないかじゃないかという気がするけど
 (1)使ってるノートのURL
 (2)実行した各項目のスクショ
 (3)エラー内容のスクショ
があればなにか分かるかも

48 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:43:23.21 ID:MizOilz4.net
使いたいけどプログラミングとか全然分からない
img2imgとかもどうするんだStable Diffusionをローカルに取り込んだらエロも描かせれるのかな

49 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:50:20.65 ID:P5OYiUxU.net
検索すりゃやり方書いてあるのに……

50 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:51:48.27 ID:h+X3gobT.net
img2img は txt2imgよりメモリ食ってる気がする
うちは8GRAMだから高速版は448x448が限界で7.8〜7.9G消費
そのサイズでimg2imgだと落ちるから少し小さいのじゃないと回らなかったよ

51 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:52:06.10 ID:or+gwnRD.net
>>42
多分フィルタが掛かってるので、>>43のフィルタ解除版を使えばいいと思います。

>>48
img2imgはColabなら>>43の一番上のURL、ローカルならhttps://rentry.org/kretard で動きます。
前者はフィルタあるかも?(試してません)

52 :名無しさん@お腹いっぱい。:2022/08/24(水) 21:58:49.83 ID:aJBVxFrq.net
>>0047
GIgazineってサイト
https://gigazine.net/news/20220824-stable-diffusion-google-colaboratory/
で取り上げられていたのでそれを参考に進めて、アクセストークンに書き換えるまではコードを実行できていました。
アクセストークンも作成出来ています…。

53 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:10:15.32 ID:gCykF9CA.net
>>52
> (2)実行した各項目のスクショ
> (3)エラー内容のスクショ

名に書いてあるかコピペでも手書きでもいいし
みんなエスパーじゃないんだから・・

54 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:13:56.87 ID:gCykF9CA.net
失礼、名に→何
実行結果がズラズラ出てるところにまさかカタカナで「エラー」とだけ出てるわけじゃないでしょ?
> パイプラインの準備ってところでエラーでて進みません

55 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:20:56.41 ID:or+gwnRD.net
>>52
今やってみましたけど問題なく動きますね。なんだろう?トークンのコピペミス、コードのコピペミスぐらいしかないような
---------------------------------------------------
!pip install diffusers==0.2.4 transformers scipy ftfy
YOUR_TOKEN="<ここだけアクセストークンに書き換える>"
from diffusers import StableDiffusionPipeline

# StableDiffusionパイプラインの準備
pipe = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4", use_auth_token=YOUR_TOKEN)
pipe.to("cuda")

prompt = "japanese cat skipping"
image = pipe(prompt)["sample"][0]
image.save(f"japanese_cat_skipping.png")
---------------------------------------------------

また、ガイドはシンプルなので基本の勉強のため良いと思いますが、実際に使うなら>>43のリンクのノートの方が便利だと思います。

56 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:25:06.09 ID:rmrm3VrA.net
Gigazineの試したけど俺もhuggingfaceのapiアクセスで403エラーになった

57 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:25:51.58 ID:aJBVxFrq.net
>>0053
>>0054
お騒がせしてすみません!自己解決できました!
どうやらアクセストークンの入力時が原因でした。
トークン入力時にサンプルの余計な文字を残したまま実行をしていたみたいで…。
そのコードのとこだけだと実行して間違っていても緑チェックはついてしまうのですね。
結果その次のパイプラインのコードでエラーをはいても、トークンにはチェックがついてて原因はパイプラインの方にある……と思い込んでしまいました。
本当にお騒がせしました…

58 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:33:08.96 ID:TiDffnf9.net
あーあ
もうロリエロ作られてんじゃん
終わったな

59 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:35:17.30 ID:694xotOP.net
Midjourneyのブラウザから見られるコミュニティページの自分の名前を変更する方法はありますか?
気に入ったユーザーをフォローしたいのですが相手に名前を知られたくないので適当な名前にしたいです

60 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:49:08.47 ID:or+gwnRD.net
>>57
解決したなら良かったですw

これやってみてちょっと気になったのが、これ>>43の2番目のノートよりかなり遅いですね。
image = pipe(prompt,height=512, width=512,num_inference_steps=50,guidance_scale=8.0,)["sample"][0]

Gigazineのガイド: 1.80 it/s
>>43の2番目のガイド: 3.8 it/s

#StableDiffusionの実行時間はプロンプトによらず大体ステップ数に比例するので 50ステップで 3.8 it/sなら 50/3.8 = 13.2秒

それぞれ2回やってみましたが結果は同じでした。2回だけなのでたまたまということもあるかもですが

61 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:50:46.24 ID:zML/iJYM.net
>>59
Discord詳しくないけど
https://setup-lab.net/discord-username-icon-change/
> ニックネームを付けてもアイコンをクリックするとユーザー名も表示されます

ユーザー名の変更も可能
何を望んでるのかよくわからないけど、こっそりストーカーだけして自分の絵は見られたくないとかは無理では・・

62 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:51:20.04 ID:aJBVxFrq.net
もしかしてStable Diffusion産のロリエロ流行りだしたらai潰される可能性もあるのかな…?

63 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:51:26.94 ID:MeCe4lEj.net
まずCraiyonで下絵を出してSDのimg2imgで仕上げるといいらしい
自然言語処理能力があっちのほうが上
https://boards.4channel.org/g/thread/88273087#p88274276
https://boards.4channel.org/g/thread/88273087#p88274306

64 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:52:32.21 ID:lXPhbphf.net
>>60
Colabはインスタンス割り当ての時にGPUガチャが発生するから
遅いGPU割り当てられただけじゃねえの

65 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:55:39.27 ID:or+gwnRD.net
ちなみに512x512で、ざっくり性能でこんな感じ

● it/s =1秒で実行できるステップ数
980 0.36 it/s (2.81 s/it)
1070Ti(8GB) 1.60 it/s
1080Ti(11GB) 2.30 it/s
Google Colab(T4) 3.2 it/s ~ 3.8 it/s
2060 4.6 it/s
2080Ti 7.3 it/s ~ 7.73 it/s

1080Tiと2080Tiは https://rentry.org/kretard

Google Colab(T4 15GB)はこれ https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv

プロンプトはこの条件で測定しました。プロンプトは性能に関係ない気がしますが一応
beautiful long haired anime girl, fire dress, portrait, flames everywhere, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by artgerm and greg rutkowski and alphonse mucha
Steps: 50, Sampler: k-diffusion, CFG scale: 15, Seed: 1

66 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:56:25.83 ID:or+gwnRD.net
>>64
かもですね。
いまいちわかってないんですが遅いT4と速いT4ってあるのかな・・・

67 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:58:48.73 ID:zML/iJYM.net
>>64
あんまチェンジしまくると目つけられるらしいね・・デ○ヘルみたい

68 :名無しさん@お腹いっぱい。:2022/08/24(水) 22:58:59.26 ID:OpxdHRin.net
自宅でAIにエロ絵なんていくらでも作らせる時代に規制なんて無駄…
とはならずに普通にアップルやグーグルやMSにPCやスマホの中身まで
リアルタイム監視されて通報されるようになるだけだよな
既にグーグルもアップルもクラウドやメールは監視して自動通報してるし
それが自宅の端末にまで適用されるだけ

69 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:00:31.01 ID:694xotOP.net
>>61
名前がペンネームと同じなので変えたいのです
ディスコサーバーの名前も変更しても、ブラウザ版のコミュニティページには反映されておりませんでした
画像はプライベートモード課金して全部隠しています

70 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:00:48.81 ID:zML/iJYM.net
>>58,68
CGの未来スレ
https://mevius.5ch.net/test/read.cgi/cg/1659706163/

71 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:01:26.08 ID:MeCe4lEj.net
ここで聞くより4chanで聞いたほうが早いこともあると思う

テンプレには使いやすいcolabとローカルで動かすためのチュートリアルが貼ってある
https://boards.4channel.org/g/catalog#s=sdg

導入後の使いやすさを考えたらColabよりもこっちがいい(要Nvidiaグラボ)
https://rentry.org/kretard

72 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:04:03.90 ID:uPPGgz9u.net
完全ローカルでネット遮断で動かせる、ロリ、エログロokなAIがリリースされたらすぐにDLして保存しなければならない
まあそれの単純所持も規制されそうだが

73 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:06:27.76 ID:R028Iasl.net
>>56
多分だけど俺もそこで詰まった
もし俺と同じ理由で出来てないなら
チェックボックスにチェックしてから回したらいけたで
詳しくはこれ翻訳して読んでくれ
https://news.ycombinator.com/item?id=32556641
辛いかもしれんが一つ前の段落?の中にチェックボックスが隠れてたから探してみてくれ
見当違いだったらすまん

簡易版っぽいけど軽いし多分無料でやれるから慣れるまでの最初はなかなかええと思うけどな

74 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:07:53.11 ID:zML/iJYM.net
>>69
検索するとiphoneあたりで変更できないみたいな話は出るけど
あと反映されるまでのラグがあるとかないとか
自分は最初からランダムな名前つけたので気にしたこともなくて

Discord 5サーバー目
https://egg.5ch.net/test/read.cgi/software/1620915467/

聞けるのはここくらいかなぁ、あんま賑わってない

75 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:11:24.62 ID:694xotOP.net
>>74
丁寧にありがとうございます

ブラウザ版というのは、ブラウザ版discordのことではなくて
Midjourney側の「Community Feed」などのページのことです
そこで自分のプロフィールを「View as visitor」モードに切り替えても名前が最初に設定したペンネームのままなんですよね

ブラウザのMidjourneyのページにプロフィールを編集できるような設定箇所が見当たらないので、名前を変える方法が無く困っています

76 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:15:33.09 ID:7skwkahU.net
>>73
サンキューできたわ

77 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:16:07.34 ID:OBjSUvGK.net
DreamStudioで頑張ってみたけどこのありさまです

https://i.imgur.com/Q9GzZyS.jpg
https://i.imgur.com/1z6jJAz.jpg

Midjourneyでやってみてけど気持ち悪い物しかできません
どなたか可愛いアニメの少年少女出す呪文を教えてください

DreamStudioのほうが使いやすいですね
ディスコは疲れる

78 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:22:44.29 ID:lXPhbphf.net
>>77
インターネットホットラインセンターに連絡しておいたのでそっちに聞いてください

79 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:24:07.05 ID:H9bb0hw7.net
お巡りさ~ん

80 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:25:44.36 ID:MeCe4lEj.net
細かい設定はできないけど無料で遊べるサイト
https://huggingface.co/spaces/stabilityai/stable-diffusion
https://dezgo.com/

81 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:33:54.22 ID:JmVG8zqE.net
今更midjourney遂げた凄まじい進化に驚愕してる
こりゃ今年中に来るかもしれんな
AIが実用的なエロ画像を生成出来るようになる時が

82 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:34:57.89 ID:H9bb0hw7.net
https://twitter.com/proto_jp/status/1562444950633324546
こりゃ凄い・・手探りだったんで嬉しい
https://lexica.art/
(deleted an unsolicited ad)

83 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:36:23.93 ID:or+gwnRD.net
>>80
Colabよりめっちゃ速いですねw
Advancedオプションもあるし、text2imgならこれでいいかも

84 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:36:29.11 ID:o+8ULzIq.net
①適当な指示絵で髪の色や顔の形を指示
②img2imgで変換して好みの画像を選ぶ
③破綻した部分を大雑把に直す 謎のオブジェとか余分に生えた腕を消す
④重みを弱くして再変換

画像は出力画像が再入力できるからヤバイよ
②~④を繰り返せばそこそこ好みの絵ができたよ

85 :名無しさん@お腹いっぱい。:2022/08/24(水) 23:54:08.75 ID:TdkLRr5D.net
うわー、つまってしまった

上にある
・Google Colab(フィルタ解除版) https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17
を四苦八苦しながらやっているけど、
PROMPT入力して生成するところで、NameError: name 'pipe' is not definedと出て失敗してしまう。
アクセストークンが間違っているのかな? みてもわからないわ

86 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:03:04.67 ID:ktn3oZWh.net
>>85
なかなかヒントが少ないけどw

--> 116 "You specified use_auth_token=True, but a Hugging Face token was not"
117 " found."

もしこう出てるならトークン未設定か、huggingface_usernameかhuggingface_tokenが間違ってる

87 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:07:05.05 ID:wzypMg/1.net
>>71
kretardで使われているスクリプトは頻繁に更新されるのでその都度ダウンロードし直すように
名前はwebui.pyのままで問題ない
https://github.com/hlky/stable-diffusion-webui

colabはこれが一番使いやすいから貼っておく
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa

88 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
イラストレーター板に立ってた

AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

89 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:16:14.69 ID:qwZZQy9r.net
>>71
kretardってやつ試したけどVRAM4GBだとメモリ不足で動かなかった
basujindalフォークoptimise版ならできたけど

90 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:21:45.50 ID:qfvTN6Mb.net
ゲームやらないしGTX980で十分だわと思ってたけどグラボ買っちゃう勢いの技術だな
ただColabに毎月1000円課金する方が安く済むならそっちが良いけど、
課金しても無限にGPU使えるわけじゃないっぽいから悩むなぁ

91 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:24:31.69 ID:hocSwwFi.net
>>82
わいが入力してた絵師の名前があって同じこと考えてんだなと
絵師の名前入れるの割と重要みたいね

92 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:25:58.70 ID:VYiQzdFX.net
ローカルで動かすのややこしいんだね
DLインストールしてポンとは行かないのか

93 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:26:12.43 ID:F5OuPmFA.net
マイニングだけじゃなくてイラスト作業でもGPUを酷使するのか...
日本でグラボが短期的に高騰しそう

94 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:28:20.70 ID:Je2EIVx2.net
オープン技術の黎明期あるあるだね
ちょっとしたらGPUある人向けにGUI組み込んだフリーソフト作る酔狂者が現れるかもしれない

95 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:29:29.11 ID:TTMJgFKc.net
>>94
redditにgimpのプラグインっぽいスクリーンショットあげてる人いた

96 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:33:16.83 ID:gT+8LwsL.net
>>87
このcolabのFor Gdriveってとこにあるuser_pathとfile_nameってなにをいれたらいいんですか?

97 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:34:55.78 ID:OfpVbaR2.net
呪文教えてくれって言ったのに全く反応がないのは
やっぱ出来が悪いのしか作れていないから?
難しいんだねぇ

自分的には力作で気に入ってるけどUP出来ないのも
けなされるのが怖いから?

98 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:35:06.66 ID:DLv+Kqg8.net
プロンプトの効果ってバージョンアップごとにごっそり変わりそう
っていうか何なら日々の学習で流動的に変わってそう

99 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:35:18.06 ID:bykfx2UB.net
人間に特化した、ちゃんと人間の顔と身体を理解してるAIモデルって作れないのかな?
現状だとちょっと精度低すぎて顔崩壊しすぎる

100 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:35:56.31 ID:Je2EIVx2.net
MJは256角4枚を俯瞰して好きなのを選んでアップスケールで1024角だから作った瞬間映えるんだよな
DreamStudioはいきなり1枚512角が最低ラインなんでゴミに金払わされる
・・あれ?逆かMJこそ無駄に作成させられてる?わからん

101 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:36:45.19 ID:ZxeWx7Jy.net
すいません、stable diffusionのimage to imageのやり方がよく分からないのですが、どこかやり方が載ってるところってあります?

102 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:37:39.69 ID:TpN+ACPg.net
>>87
> colabはこれが一番使いやすいから貼っておく
> https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa

いろんな選択肢があってどれを実行する必要があるのか分かってる人はわかるけど、ややこしすぎな気がする

103 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:39:24.20 ID:M/HLpgpi.net
>>101
Colabなら>>43の一番上
ローカルなら3番目

104 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:41:33.75 ID:Je2EIVx2.net
>>97
前スレでずっと無視されてた人か

単にせっかくコツコツ試行錯誤して編み出した呪文をなんの見返りもなく教えたくないからだろう
ツイッターとかでも公表してる人あんまいないよ、しょーもない実験風のは書かれてるけど
852話とか言う人もかなり前だがキャラ設定画みたいなののレシピをさんざん上げてから公開してたし

だから>>82はありがたい
MJはDiscordでのぞき見できるから捗ったんだけど
Discordβ終わったSD(DS)はβやれなかった自分には手探り過ぎて放置してた

105 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:42:02.98 ID:VYiQzdFX.net
地味に、自分が吐き出した画像って愛着あるよね?ゴミでもなんか捨てづらい
これから動画も増えるだろうし、GPUもだがHDDも需要が増えるな

106 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:42:18.43 ID:TpN+ACPg.net
>>101
https://rentry.org/kretard
ローカルでこれ使ってるなら、img2imgタブに移って初期画像を設定するだけ
https://i.imgur.com/GEuGYkD.jpg

※Chromeの日本語翻訳がONになっていると使えないので注意

107 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:45:40.88 ID:F5OuPmFA.net
いいpromptを教えろって言ってもどの言葉がどの程度作用してるのかさっぱりわからないんだよな 
4kとかunreal engine5みたいなキーワードはあっても結局運だし
俺もポーズごとやアングルの定石が分かれば嬉しいと思ってるけど、現状を見るにそういうのはなさそう

108 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:46:57.10 ID:Je2EIVx2.net
今って選択肢が多すぎてワケワカ状態だな、SD系はもうなにがなんやらi2iまで言い出したら
ちょっと置いた方がいいかもしれん

自分はbetaで活気ついたMJいじりながらボロPC買い替えにでも動くか

109 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:47:30.07 ID:zyWvVtGI.net
>>99
リアル人間のなら2桁くらい公開されてるんじゃね
最近はファッションモデル用のAI素体を提供してる所もある

110 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:48:49.95 ID:bykfx2UB.net
>>82
わお、これは素晴らしすぎる
どこからデータ拾ってるんだ

111 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:50:36.02 ID:Je2EIVx2.net
>>107
オカルトみたいな呪文も結構乱発されてんだよね
効いてるかは入れる場合と入れない場合の同seedでしっかり確認してから使うべき
MJはseed指定が一般的じゃなかったのでもうほんとオカルトで3行とかなってる人がザラにいた

112 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:52:38.41 ID:F5OuPmFA.net
今は自動イラスト生成黎明期で、本格的になるのは一部修正機能がとかより細かい絵柄の指定が実現できる学習済みモデルが配布されてからかな
今後は学習済みモデルでひと悶着ありそうだ

113 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:53:59.10 ID:VYiQzdFX.net
詠唱だのプログラムだので必死になる人達は良くも悪くも凄いな
どうせ来月にはもっと簡単お手軽になってるでしょ
俺はパソコン大先生じゃないから今は見て楽しむだけだな

114 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:55:04.82 ID:M/HLpgpi.net
あんまり長く書き連ねると途中で強制カットされるはずだぞ
トークンっていう言葉の固まりに上限数がある
最後の隠し味にと最後に書いた一文が丸々効いてないなんてことも

115 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:56:15.84 ID:TpN+ACPg.net
>>107
https://rentry.org/kretard このUI限定かもしれないけど、
create prompt matrixにチェックして、プロンプトのキーワードを | でつなぐとそのキーワード有り無しが出ますね

例えば
girl | on the beach | oil painting
とすると、以下の4枚の画像が生成されます。
- girl
- girl on the beach
- girl oil painting
- girl on the beach oil painting

1ワードずつ効果を探ってられないですが、高解像度のキーワードのあり・なし、効果を見るみたいな使い方なら便利かも

116 :名無しさん@お腹いっぱい。:2022/08/25(木) 00:58:40.17 ID:bgMQ/0YX.net
>>82
うまいのいっぱいあっていいね
イラストレーターの名前入れるのかなり影響あるから
いい雰囲気のプロンプトはチェックしとこ

117 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:01:06.93 ID:Je2EIVx2.net
>>110
個人が公開してるわけないから、たぶんDiscord時代のログみたいなのから生成してるのかなぁ
日付がそんな感じの古さ

118 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:04:48.07 ID:TpN+ACPg.net
こういうプロンプトビルダーは進化していきそう。 ただモデルの進化が早くてすぐ使えなくなりそうな気もするw
https://promptomania.com/stable-diffusion-prompt-builder/

119 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:11:54.92 ID:gT+8LwsL.net
>>96
これわかる人いたら教えください……

120 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:13:36.34 ID:TpN+ACPg.net
Emad (Discord)
Q Dalleのようなプロンプトでのインペインティングか、自動インペインティングかどっちかサポートする予定ないの?
A 両方でいいじゃん

121 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:15:31.78 ID:wNS4aEcK.net
SDにimg2txtみたいなものって無い?
イメージに近い画像1枚渡すからどういう単語を求めてるのかのヒントが欲しくて
別のRecognize系API使うしかないのかな

122 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:16:14.78 ID:TpN+ACPg.net
>>119
それはGdriveに既にmodelを保存している場合に実行するもので、その上の
!gdown ・・・



%cd stable-diffusion/ ・・・

かどっちかを実行していれば不要だと思います。

このノートは初心者には難しい

123 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:18:22.66 ID:Je2EIVx2.net
>>82で好きな絵探して呪文メモするのにはまってる
みんないろんなアーティスト知ってるな、というかDiscord時代に皆で試行錯誤した集合知なんだろうけど

124 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:20:13.62 ID:TpN+ACPg.net
>>119
ついでにその下のHuggingfaceもいらないと思います。
後、Optimized SDの下のSetup、Settingなどもいるのか要らないのか私には分かりません。よく読めば分かるんだろうけど

125 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:24:00.66 ID:gT+8LwsL.net
>>122
ありがとうございます
必要ないんですね
てっきりここでエラーがでるので、pathを入力してないせいだと思っていました
ちなみに、このエラーもわかったりしますか

本当に難しいです
初心者なのでわからないことばかりです

https://imgur.com/a/Y8K8y0u

126 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:26:07.90 ID:UAUhAh8a.net
>>103
>>106
ありがとう、既出だったね。試してみる。

127 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:39:26.95 ID:qfvTN6Mb.net
Colabでの出力だとシード数という概念はない感じ?
一回出た画像を再度出力とかは無理で保存するしかない感じ?

128 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:54:24.11 ID:TpN+ACPg.net
>>127
こっちのColabはSEEDで設定された値をmanual_seed()しているので、同じシードなら同じになります。
実際にやってみても再現できます。(ローカルで実行したものと同じSEEDならColabでも同じ画像ができる)
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv

他のColabは使ってないので分かりません・・

このURLのノート、シンプルでいいんですがimg2imgに対応してないんですよね。悩ましい

129 :名無しさん@お腹いっぱい。:2022/08/25(木) 01:55:21.52 ID:OfpVbaR2.net
>>104
そうじゃないと思うよ
教えたとしても同じものは作れないんだろ?
やっぱけなされるのが怖いんじゃね?

130 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:00:47.98 ID:OfpVbaR2.net
>>104
lexicaおしえてくれてありがと

DreamStudioと同じアイコンなのね

131 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:03:31.19 ID:qfvTN6Mb.net
>>128
ありがとう
自分で調べて構築しなくてもめっちゃ便利な定型システムが用意されてたんだね…
そっちに移ります…

132 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:06:30.11 ID:zaA0cpZ4.net
佐藤航陽 著書「世界2.0 メタバースの歩き方と創り方」 @ka2aki86 (2022/08/25 02:02:11) [返信:フォロー/@のみ]
物理世界における視界は、AIにレコメンドされたYouTubeやTikTokのタイムラインのようなものだな。帰り道の解体跡地にどんなビルがあったかは覚えてないけど、自分が好きなアーティストの看板があればすぐ認識できる。物理世界も仮想空間も自分が気になってるもの以外は表示されないし認識もできない。
https://ohayua.cyou/tweet/1562485434235879424/ka2aki86

133 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:11:11.52 ID:TpN+ACPg.net
>>125
多分Settingの前に上の Set upを実行していないのではないかと思います。

134 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:14:58.16 ID:YWrt340D.net
852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28

135 :名無しさん@お腹いっぱい。:2022/08/25(木) 02:59:50.50 ID:gT+8LwsL.net
>>43
これのローカル環境ってやつがんばって試してみたけど
セットアップ完了していざ試したら

Traceback (most recent call last):
File "scripts/webgui.py", line 5, in <module>
import gradio as gr
ModuleNotFoundError: No module named 'gradio'

って文字がでてダメだった……
なにかを間違えたんだろうけどさっぱりわからん
難しいなぁ

136 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:12:25.97 ID:39A5KPuE.net
>>135
gradioはこの手順でダウンロードされるのでどちらか抜けているのでは
ステップ 5:新しいenvironment.yaml をダウンロードして waifu-diffusion-main に配置し、古いものを置き換えます (すべてのファイルとして保存します)
ステップ 10: 次のコマンドを実行します: 「conda env create -f environment.yaml」を実行

137 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:13:44.39 ID:39A5KPuE.net
後、これをやってない可能性もあるかも
ステップ 12: 次のコマンドを実行します: "conda activate ldx"

138 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:23:33.13 ID:gT+8LwsL.net
>>136
ありがとうございます。
思い返せば、このステップ5をよく理解せず、やった覚えがあって、

ステップ5で自分のやった手順を詳細に書き起こしてみます
https://pastebin.com/6gpWFLa4
↑のURLにログインする
ログインしたページの右上にあるdownloadを選択
environment.yaml.txtを取得
名前を変更して.txtを削除
それからwaifu-diffusion-main に配置

って手順でやりました……
素人なんでほぼフィーリングでやりました
このやり方が間違っていたんですね……

139 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:28:51.27 ID:gT+8LwsL.net
同時並行して、わかりやすいと教えて貰った
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv
もやっているけど、どうしてもここでつまってしまう

ユーザーネーム、アクセストークンが間違っているかもというアドバイスをうけて
何度も見返しているけど、間違っている場所が見当たらない……

https://imgur.com/a/8zUsvm3

140 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:28:54.02 ID:39A5KPuE.net
>>138
その手順はあってる気がします (ログインは不要、元々あったenvironment.yamlは削除したと思いますが)

141 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:32:47.67 ID:gT+8LwsL.net
>>140
本当ですか……
ミラーとか元テキストとか意味がわからず無視したんですけど
これらって結局必要ないんですかね……?

142 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:36:22.17 ID:39A5KPuE.net
>>141
あれ?勘違いしてたかな

>>138の手順をやってenvironment.yamlを配置したんですよね。それでOKですという意味でした。
必要な手順です

mirrorやraw textはこちらからもダウンロードできます、ということなので、3つやる必要はありません。

143 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:40:33.27 ID:gT+8LwsL.net
https://imgur.com/a/yJHAbsl
画像あったほうがわかりやすいかと思って用意しました
これ見て間違っているところとかわかりますでしょうか?

144 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:41:11.12 ID:gT+8LwsL.net
>>142
mirrorやraw tex必要ないんですね
ありがとうございます

145 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:46:27.50 ID:39A5KPuE.net
>>143
srcに既存フォルダが有るとそうなると思います。

ステップ 9: /src に既存のフォルダーがある場合は、次のステップの前にそれらを削除します。

これが抜けてるのかな

146 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:48:29.30 ID:39A5KPuE.net
>>145 は間違いです。すみません

147 :名無しさん@お腹いっぱい。:2022/08/25(木) 03:52:37.89 ID:39A5KPuE.net
conda env create -f environment.yaml を2回実行した(多分、初期のファイルで実行した後、ダウンロードしたもので再実行?)と思われます。
一旦、

conda env remove -n ldx

で削除してから、再度conda env create -f environment.yaml をやればいいと思います。

148 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:11:47.45 ID:gT+8LwsL.net
>>147
できました!
ありがとうございます

またどこかでつまるかもしれないけど、これで前に進めます!

149 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:13:58.72 ID:F5OuPmFA.net
https://i.imgur.com/nNAWK1g.png

https://i.imgur.com/5p6kUmH.jpg

https://i.imgur.com/OnCEtP2.jpg

スレ違だったらごめん
img2imgで微修正と生成繰り返したら好みの絵柄も作れた

生成過程はnoteの捨て垢にまとめた
https://note.com/tansaku667/n/nd364d42ee21c
いろんなところでおもちゃみたいな扱いされてるけど割とやばいと思うこれ

150 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:17:29.41 ID:gT+8LwsL.net
うわぁああああ、また新しいエラーがでたぁああ
いつになったら、好きなエロい画像を作れるんだ……

151 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:25:29.94 ID:39A5KPuE.net
>>149
いい出来ですね!
各パラメータそんな小さい数字で調整して行くんですね。参考になります。
この絵からこのワードを足すとこれ、みたいに画像ををツリー状で操作できるようなUIとかあると便利そう。
誰か作って欲しい

152 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:34:00.08 ID:ckiBhtAH.net
Hirokazu Yokohara @Yokohara_h (2022/08/24 19:52:22)
将来的にはデジタル絵の主流の作り方はコレに似たものになると予想。意図通りにしたい部分を適切に都度指示していく感じ。3DCGなんかは元々そういう制作方法だよね
https://ohayua.cyou/tweet/1562392367784636419/Yokohara_h

[引用元] 852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28

153 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:45:21.93 ID:OfpVbaR2.net
>>149
--strength 0.3 --n_iter 2 --n_samples 5 --H 576 --W 768

-- ← このハイフンみたいなの2個は付けないとエラーになるの?

こういう約束事みたいなのが全然わかんないw

154 :名無しさん@お腹いっぱい。:2022/08/25(木) 04:58:28.79 ID:gT+8LwsL.net
https://imgur.com/a/Nsp7fod

ローカル版やっと導入できたと思ったら、画像が緑だけになってしまいます
原因わかる方いますか?

155 :名無しさん@お腹いっぱい。:2022/08/25(木) 05:24:44.37 ID:zyWvVtGI.net
>>154
If your output is solid green, the half precision optimization may not be working for you:
GREEN SCREEN FIX:
delete ".half()" in webgui.py
(Note: this will raise vram usage drastically)

キミ成人してる?
フィルター解禁版は誰が見ても一発アウトな児ポも画像ファイルとして出てくるから適当に使わんほうがいいぞ

156 :名無しさん@お腹いっぱい。:2022/08/25(木) 05:37:07.73 ID:gT+8LwsL.net
>>155
成人してます
ポルノ利用するつもりはないですけど、なんとかして使いたいです

157 :名無しさん@お腹いっぱい。:2022/08/25(木) 05:46:31.36 ID:gT+8LwsL.net
.half()ってのを削除しました
成功できるか試してみます

158 :名無しさん@お腹いっぱい。:2022/08/25(木) 05:53:26.27 ID:OfpVbaR2.net
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ

159 :名無しさん@お腹いっぱい。:2022/08/25(木) 05:54:51.60 ID:L+T2AQMI.net
普通に使っててもフィルタかかるから解除版でいいよ

>>154
グリーンはフィルタとは関係なく、GPUが16xxとかだと出るみたいですね。
>>155さんの言うようにwebgui.pyの中にある156行目の.half()を削除してみてはどうでしょうか
(元)model = (model if opt.no_half else model.half()).to(device)
(修正後) model = (model if opt.no_half else model).to(device)

#行頭スペースなど変更せず、.half()だけ削除するよう注意

160 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:35:32.03 ID:gT+8LwsL.net
>>159
ありがとうございます。
今試しています
また別のエラーがでて四苦八苦してます……

161 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:40:13.22 ID:gT+8LwsL.net
やっと生成できると思ってやっても下記のエラーがでます
わかるかたいませんか?
ローカル版で試してます

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB (GPU 0; 6.00 GiB total capacity; 5.06 GiB already allocated; 0 bytes free; 5.18 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

162 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:47:36.41 ID:MfvfcZ2+.net
>>161
本家はVRAM10GB要るから軽量版に変える

163 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:55:23.26 ID:gT+8LwsL.net
>>162
ありがとうございます
やっぱりその問題かー

164 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:57:25.60 ID:69ljxOjZ.net
6GBでも動くはずなんだけど
https://rentry.org/kretard
Lighter on Vram: 512x512 img2img & txt2img tested working on 6gb

16xxはhalf()を止める必要があるから無理ってことぽい。
グリーンスクリーンが16xx限定か知らないけど

後、グリーンスクリーンは、起動時に以下のオプションで解消できると書いてますね。ソースコードいじらなくていいぽいけど
VRAM使用量が上がるから、解像度を低くする必要が有ると書いてる。
"python scripts/webgui.py --precision full --no-half"

165 :名無しさん@お腹いっぱい。:2022/08/25(木) 06:59:58.58 ID:OfpVbaR2.net
ゲームとかしないのに化け物みたいなグラボがないと
ダメなのか

つまんないな

166 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:02:07.95 ID:69ljxOjZ.net
多分だけど、2xxxじゃないとGoogle Colabの方が速いぽい >>65

まあ>>163さんはコラボ版のimg2imgも苦戦してるんだけおd

167 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:08:18.59 ID:uM91UxfF.net
プロンプトって単語数の上限や優先順位ってあったりする?
最初の方に置いたら強く影響するとか、数十個以上入れると後半は無視されるとか
単語を詰めまくったら、どうも影響を一切反映しなくなった気がする単語とかあって
単語1個と50個でも生成時間が同じなのも不思議で
単語入れまくったら探査深度というか、画像検索は先っぽで終わる感じなのかな?
例えば1個だと50枚調べるけど50個だと各1枚で終了とか

168 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:14:26.06 ID:jzBSMp93.net
試行回数少ないからはっきりとは言えないが、構図や描写のクオリティは画像サイズにも依存してるっぽいな
256x256の出力結果は全く使い物にならなかったけど512x512に変えたらハイクオリティになった
単純にサイズに合わせて出力結果を変形させてるわけではないのかも

169 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:15:01.03 ID:gT+8LwsL.net
>>166
どうしてもimg2imgを使いたくて苦戦してますw

今は軽量版をどこで手に入れるのかわからずネットの海を彷徨ってます

170 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:20:07.81 ID:jzBSMp93.net
>>169
俺は雑魚GPU使ってるけどこの記事参考にしたらimg2imgできたよ
https://zenn.dev/koyoarai_/articles/02f3ed864c6127bb2049

171 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:22:33.74 ID:69ljxOjZ.net
>>167
トークンの数は75 (77?)で、それ以上は無視されるらしい

https://rentry.org/kretard
・トークンは75以下、大文字/小文字は関係ない、トークンは約30,000
・同じプロンプト、シード、修飾子は同じ結果になる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
「Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。」とあるから
単純にワード=トークンじゃないっぽくて、トークンの定義が分かってないけど

後生成時間はstep数以外何も影響してない気がする

172 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:29:23.64 ID:V9wOObE6.net
>>154
緑一色しか出力されない件に遭遇しましたが、--precision fullで回避できる模様です。

173 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:32:01.96 ID:uM91UxfF.net
>>171
ありがとうございます
やっぱ上限あるんですね…
自分もトークンがなんなのか良くわかってないけど…

174 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:52:45.26 ID:hfFQOXA7.net
>>158
HなStableDifusion増田の返信のなかに、1行も変更せず動かせるのがあるよ

175 :名無しさん@お腹いっぱい。:2022/08/25(木) 07:56:54.48 ID:69ljxOjZ.net
複数環境共存できましたということで不親切なメモですが一応。 basjindalは昨日GUIが実装されたようでそこが変わっています。
●basjindalのインストール (waifuの共存)

【前提】 minicondaインストール済
https://github.com/basujindal/stable-diffusion から、code>download zip
miniconda で解凍した場所にcd

environment.yamlの冒頭をname: ldm-basに変更する(waifuと競合するから)
conda env create -f environment.yaml
モデルをコピーしてリネーム stable-diffusion-v1\model.ckpt
conda activate ldm-bas
pip install gradio

これでインストール完了。
python optimizedSD/txt2img_gradio.pyを起動すると、しばらくして
(img2imgなら python optimizedSD/img2img_gradio.py)

Running on local URL: http://127.0.0.1:7860/
でるので、ブラウザでアクセスすれば使えます。

次回からは、以下の2コマンドで利用可能
conda activate ldm-bas
python optimizedSD/txt2img_gradio.py

なお、basujindal、省メモリですがwaifuよりめっちゃ遅いです。basujindal 1.4 it/s、waifu 7.5 it/sぐらいで5倍ぐらい遅い

176 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:22:57.95 ID:Dtg22sej.net
なんか「SDでエロ作るのは危ない!」って騒いでる人いるけど言うほど引っかかりそうな法律とか規約あるか?
「Stable Diffusion Terms of Service」は紛らわしいけど中身読むとAI自体じゃなくてDiscordでやってたbetaの話なんだよな

177 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:23:36.28 ID:1uZk9t3I.net
ローカル環境で考えてるやつは電気代に注意しろよ~
寝る前にコマンド入れて一晩中生成とかやったら大変なことになるぞ☺

178 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
ローカル版画像サイズ小さくすればできた

>>169
この軽量版はやってみたけど、うまくいかなかった……

179 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
顔をアニメ風に寄せるのはこれが限界かなぁ
https://i.imgur.com/4UZz4s8.png

180 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>179
可愛いね
これを脱がしてください

181 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:44:16.43 ID:hocSwwFi.net
手がもう崩壊してるから脱いだら悲惨なことになる
アニメ顔で実用に耐えるR18とかは一晩かかって出せるかどうか
絵描きだったら自分で描いたほうが早いw
個人的にそういう方向を追求するのは不毛に思うけどな

182 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:46:45.85 ID:OfpVbaR2.net
>>181
えー

そういう方向こそロマンですやん

183 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:47:54.74 ID:odqqeXCg.net
言われてみれば、>>179めっちゃ可愛く出来てるけど、よく見りゃ左腕豪快に骨折してるね

AI画像生成、人体その他構造を考慮できるようになるのかな・・・

184 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:50:26.50 ID:6FMN8AvS.net
>>175
basujindal版は省メモリに全振りでピーク使用メモリ量が最小になるように
・モデルの分割投入
・混合精度
の2つを積極的に実装してる
モデルの分割投入はメモリの出し入れが激しいので単純に速度が落ちるし
混合精度も使ってるGPUの演算器構成によっては一部極端に演算速度が落ちる型があってネックになることがある

空いたメモリ分で同時生成したり出力解像度を上げることで実質的に多少低下分を取り戻せる

185 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:51:16.15 ID:jn2PTIMS.net
>>176
普段使いしているクラウド上にうっかりアップされていたら...とか、Colabで動かしてる時に生成されてGoogleアカウントごとBANとか
児ポまがいの画像が生成されて、何かの拍子に家宅捜索されたときに別件逮捕なんてこともあり得ない話ではない

186 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:53:57.19 ID:1uZk9t3I.net
アニメキャラが骨折してるなんて当たり前のことだからなあ
「三次元的に破綻していないドラえもんのイラスト」なんて物理的に存在しえないんだからAIが描こうが人間が描こうが関係ない

187 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:54:42.83 ID:6FMN8AvS.net
ID:OfpVbaR2 がまさに前スレで児ポ生成をやろうとしてたキチガイなんで
一緒に捕まりたくなきゃ触れないことをお勧めする

188 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:55:43.39 ID:hocSwwFi.net
それ今のAIだと、このキャラでいいから今度は脱がせて!みたいなことが現状できない
まあ一部で研究してるみたいだけどw顔はそのまま、みたいな指定やってるんでしょ

189 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:55:45.51 ID:DqzH7U06.net
StableDiffusionで素朴な疑問なのですが、conda版とローカル版の明確な違いってなんなのでしょうか?どなたか教えてください…。

一応認識としては、pcスペック関係無しにネット環境必須でGoogle負担のGPUで使用可能なのがconda版。GPUガチャ。
高スペックpc推薦でローカル環境さえ整えればネット環境有り(でGoogle介さず)にpcの内部GPUだけで使用可能になるのがローカル版。ローカルなのでGPUガチャ無し。

Twitterとかでちょこちょこ目にしたのですが、ローカル版ならオフラインで使用することも可能なのですか?

190 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:56:30.64 ID:nE2NtOo1.net
違和感無く加筆修正出来たら凄い時短になるな

191 :名無しさん@お腹いっぱい。:2022/08/25(木) 08:57:15.35 ID:XvWHCER6.net
>>82
AIの学習速度怖い…

192 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:00:06.02 ID:6FMN8AvS.net
>>189
ColabはGoogleのGPUクラウドサーバーの余りをブラウザ経由で使わせてもらってる
業務用GPUで走るんでそこそこ速いしメモリもある
けれどもGoogleの機嫌一つで使わせてもらえなくなるかもしれない

ローカル版は文字通りローカルで自分が組んだ環境以上のことはできないが好きに使える
モデルデータも落としてくる場合であればインターネットが無くても使える

193 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:00:13.66 ID:DZNxogwv.net
RTX4070でいいかーと思ってたけど勢いで90買うまであるかもしれん

194 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:01:45.90 ID:QfU042L4.net
>>186
> アニメキャラが骨折してるなんて当たり前

昔はともかく最近はイラストもアニメも骨折してるようなのはあんまりないと思うw
表現のための3次元的な嘘はあるけど、流石に骨折はぼんやりみてても違和感があるからねえ

195 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:04:03.25 ID:Dtg22sej.net
>>185
別件逮捕ってそれもうSD関係なくないか…
そんなんで特定のサービスに対して「逮捕される可能性が~」とか言われるとそれこそ大丈夫なのかって思っちゃう

196 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:04:07.30 ID:69YAqvqT.net
顔だけアニメ風が出来ないんだよな
アーティスト名とかアズレン/グラブルみたいな作品名を入れると体にも影響して全体が崩れる
それにヌードとか入れるとやっぱりポルノサイトとかヌーディスト系の画像学習してるらしく
そっちの低品質なデータに引っ張られて顔も残念になりやすい

197 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:09:22.36 ID:DqzH7U06.net
>>192ありがとうございます。
え、本当にネット環境無しで使えるんですか…うわぁ…

一応ローカル版する為に必要なスペックのpcが最低で20万くらいの額と以前おそわったのですが、img2imgも同様のパソコンで使えるのでしょうか?

198 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:10:30.48 ID:QfU042L4.net
>>189
conda → Google Colab?

#condaというとローカルPCでPython環境を使うときのcondaとごっちゃになってるのか、Google Colabのそういう呼び方があるのか・・・

起動時間:  PC=比較的速い、 Colab=数分以上はかかる
性能: 30x0 , 20x0 > Colab T4 > 1xxxx >>65
VRAM: Colab(15GB)は大抵のコンシューマGPUより多い
ネット: PC=利用時不要、 Colab=必須
使用可能時間: PC=無制限、 Colab=制限あり しばらく使ってないと勝手に切れてまた起動数分待ちがダルい
複数環境お試し: PC=手順面倒かも?、 Colab=簡単

まあローカルGPUが20x0あるならローカル環境を使う、それ以下ならColabを使う

性能はColabを何回か使ってるけど、経験的には特に速くなったり遅くなったりはしてない。
遅いT4、速いT4なんてあるの?って気もする

199 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:17:43.99 ID:OfpVbaR2.net
>>187
そういう事を言うやつに限ってガチペド変態野郎
だったりするんだよなぁw

200 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:21:23.33 ID:K1IGqCp0.net
もう少し用途に特化したAIが複数あるといいのかな?
人間+背景のみという前提で人間を部位ごとに丁寧にカスタマイズするというのは技術的にはできそうで精度も上がると思うんだけど

201 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:29:36.79 ID:QfU042L4.net
>>197
text2imgとimg2imgはいくつかやった感じ生成速度は変わらない

3060(12GB)なら15万円~
https://kakaku.com/pc/gaming-pc/itemlist.aspx?pdf_Spec115=200&pdf_Spec317=11-&pdf_so=p1
ここに乗ってるやつよりHDD容量とかは増やしたほうがいいと思うけど

多分だけど、3060(12GB)はちょうどGoogle Colab(T4 15GB)と同じ程度の速度っぽい(512x512で 3.5 it/s程度)

そういう意味じゃ性能が変わらずメモリが多いものが無料であるのに買うの?って気がしなくもない
まあAI画像生成以外にもゲームとか3Dソフトのblenderとか色々できるから、そういうものにも興味があればいいと思う

202 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:32:51.10 ID:+h3QnAhq.net
M1最適化されたらMacBook Air辺り買うのがコスパはいいんじゃない

203 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:34:30.17 ID:DqzH7U06.net
>>0198ありがとうございます、こちらも分かりやすいです。
Colabは、Google Colaboratoryのことです。紛らわしくなってしまったみたいで申し訳ないです。
Googleの機嫌で使えなくなるのは痛いので近いうちにローカル版使いたい…

204 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:41:57.02 ID:69YAqvqT.net
省メモリ版もGUI化で使い易くなったな
お約束のように最初は動かすの面倒くさかったけど

205 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:42:10.81 ID:RpLtQRvH.net
>>202
M1は遅い3060よりも更に3~4倍ぐらい遅いような
まあ消費電力は少ないんだろうし、StableDiffudionとかでまた違ってくるだろうけど

https://i0.wp.com/take6shin-tech-diary.com/wp-content/uploads/2022/04/MachineLearning_BenchMark.png?resize=1024%2C445&ssl=1

206 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:45:55.95 ID:XvWHCER6.net
4070を買う理由がまた一つ増えてしまったという事か…

207 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:46:20.50 ID:zyWvVtGI.net
>>196
https://twitter.com/cut_pow/status/1561151751373348866
数日前のだがdisco diffusionの方でマスキングが結構進んでたな
プロンプトを途中で分割できる機能でも頑張れば可能だと思われる
まぁ1つのツールで全部対応するのは得手不得手あるから用途によって使い分けるのが現実的じゃね
(deleted an unsolicited ad)

208 :名無しさん@お腹いっぱい。:2022/08/25(木) 09:52:35.54 ID:jy8fd1JG.net
これでまたGPU不足になりそうかね
創作用途だからマイニングと違ってヘイト対象にはならないかもしれないが

209 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:08:05.20 ID:8+FfZIrW.net
省メモリのGUI版に更新したけど表示されたWebページに飛んでも真っ白のまま変わらない
ブラウザ変えてみても同じだった
3.1.7の最新版gradioもインストールしてるんだけどなぁ

210 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:09:59.93 ID:WgxQgIco.net
>>208
金がもらえるわけじゃないから新作の人気ゲームが出た程度の影響でしょ

211 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:10:06.17 ID:LY2UcQV2.net
Chromeで日本語翻訳がONになってるとかない?

省メモリ版はしらんけど、waifu版は、日本語翻訳ONだとimg2imgが真っ白になるし、txt2imgもパラメータ変更不可能になる

212 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:36:03.63 ID:NZeLqYXb.net
>>206 >>208
google colabで無料でできること知れ渡れば
にわかがいちいち何万もするグラボ買うなんてしないだろうし
デスクトップすら持ってない人にはもっと大きな出費になるし杞憂なのでは?
マイニングバブルでのファームが買っていた量って数十万数百万個レベルだぞ

213 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:36:25.19 ID:69YAqvqT.net
こっちではGUI版ちゃんと動いてはいるけどブラウザを開いてると
GPUリソースが大量に消費される謎バグがあって普段使いとは別ブラウザで起動して
すぐにタスクバーにしまわないと駄目だな

214 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:44:06.12 ID:6FMN8AvS.net
>>213
4chanだと、Gradioの動作中アニメーションとプログレスバーのせいでブラウザの表示動作が常時GPUを食うようになって生成速度が落ちると言われてて
対策としてK-lms最新版のwebguiではアニメーション切られた

民間療法としてはその通り最小化するか別のタブに切り替えてアニメーション動作を止めるか
ブラウザのGPUアクセラレーションを切るか
別のマシンから遠隔操作するかだとさ

215 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:48:56.18 ID:PcxrIwK4.net
>>211
ブラウザのプライベートモードで実行してもダメだった
原因はわからんけどブラウザからgradioのスクリプトを読み込む時にエラーが起こってたみたい
gradioのissueを参考にして少し修正加えたら一応は動くようにはできた

optimizedSD/txt2img_gradio.py の最後にある
demo.launch() を
demo.launch(share=True) に変更

216 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:49:24.90 ID:69YAqvqT.net
>>214
あのアニメーション怪しいなとは思っていたけど
何であんなのでリソース食うのか意味不明なバグだなw

217 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:51:31.94 ID:6FMN8AvS.net
>>215
share=Trueはまずくないか?
そのオプションはxxxxxx(ランダム数字).gradio.appっていうURLで誰でも外からアクセスできるようにするヤツだぞ

218 :名無しさん@お腹いっぱい。:2022/08/25(木) 10:58:04.44 ID:PcxrIwK4.net
>>217
確かにそのリスクはあるね
URLもシンプルだから総当たりすれば余裕で悪用できるし別の方法探したほうがよさげだね

219 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:05:44.87 ID:GsZbGmTm.net
すごい周回遅れの質問でごめんなんだけど

ローカル版って公式の設定ファイルいじれば制限解除できるわけじゃなくて
有志のカスタマイズ版をインストールしなきゃいけないって認識でok?

解説とか見ながら普通にローカル環境作っちゃったからローカル版の制限解除にどうしたら移行できるのかわからん

220 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:08:56.14 ID:69YAqvqT.net
情報量の多い背景の場合は人間の絵師を完全に超えているな
これで人間やアニメ絵がちゃんと描けるようになったら一部の有名人以外は
マジで終わりだね、さっさとそうなって欲しいわ

221 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:17:00.69 ID:uyW1ADrr.net
>>220
CGの未来スレ
https://mevius.5ch.net/test/read.cgi/cg/1659706163/
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

222 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:17:16.65 ID:bgMQ/0YX.net
>>219
自分のやり方合ってるか分からんけどSafecheck回避するだけだから
txt2img.py 1行変えるだけでいけるよ

223 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:26:13.39 ID:PcxrIwK4.net
>>215
この方法でグローバルへの公開なしでUIが表示されない問題修正できた
レジストリいじる若干リスキーな方法ではあるから参考にする人は自己責任で
https://github.com/gradio-app/gradio/issues/700#issuecomment-1158836815

224 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:27:14.43 ID:wTZV2nUk.net
promptに絵描きの名前を入れると破綻が少なくイメージが近い絵が出るんだけど
これは果たして本当にAIオリジナルと言えるのか

225 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:31:26.39 ID:GsZbGmTm.net
>>222
txt2img.pyってファイルがローカル環境内のどこかにあるってこと?

226 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:50:24.78 ID:bgMQ/0YX.net
>>225
その環境が分からないけど、どこかにはあるのでは。
一応stable-diffusion-mainのscriptsの中にあるよ

227 :名無しさん@お腹いっぱい。:2022/08/25(木) 11:59:15.36 ID:b8sl+t7g.net
環境構築とプロンプトでスレ分けたほうが良い

228 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:03:31.97 ID:ASukCAWM.net
自治厨だらけ

229 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:07:06.14 ID:b8sl+t7g.net
>>224
作家名や作品名を入れるのが著作権違反になるだろうね

230 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:11:19.23 ID:69YAqvqT.net
何だかんだでみんな上手くいったプロンプトは隠すから例のサイトもあんま上手くいかないって言う

231 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:17:06.53 ID:WNMkYTVx.net
>>227
環境構築は公開直後の今だけ難しいだけで
そのうちアホでも馬鹿でも使えるようになると思う

232 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:20:04.17 ID:ZFbHQUra.net
バズってる整った画像見るとフォトショのゆがみツールとかで直してるんじゃね?とか思ってしまう

233 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:23:44.27 ID:HZ4Sddxb.net
>>232
同じ呪文で大量に生成していいやつ選んどるだけやろ

234 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:32:25.44 ID:TlvKzERq.net
今の段階だとそのまま使うんじゃなくて手直しするほうが効率いいだろうね
イメージ通りの服や道具みたいな構造物を破綻なく生成が難しいから

作品作りに実用するとしたら線画で細部を書いてそれを補助線として活用して
AI塗りを乗っけるみたいな方向だろう

235 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:35:48.83 ID:XvWHCER6.net
作品と呼んでいいのか

236 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:39:26.37 ID:M/HLpgpi.net
>>229,235
>>221

237 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:40:48.68 ID:bgMQ/0YX.net
細部の調整は加筆して誘導すればimg2imgでなんとかなりそうではある
ただ、うまくいかない原因がワードにあることも。
illustrationとか入れると全身画の時に顔潰れやすいとか
ワードの組み合わせで解消できるかもしれんけど

238 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:41:36.36 ID:hocSwwFi.net
人物はだいたいガチャみたいな感じ。たまに元の絵そのものみたいのが出るし
https://i.imgur.com/stfDukr.png
こういうのはアイディアに使えそうだけど
ツィでみたのはもうちょっとデッサンよかった気がするんだが、、難しいな

239 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:54:27.00 ID:uCLwesYu.net
>>199
この話題に限らずお前みたいに痛いところを突かれたからって相手はこういう奴に違いない!みたいな無理矢理な返しをする奴はキモイよ
頭の悪さが露呈してるよ

240 :名無しさん@お腹いっぱい。:2022/08/25(木) 12:57:27.28 ID:F5OuPmFA.net
しばらくの間は画像生成+手直し+img2imgでクオリティの高い絵が量産されると思う

241 :名無しさん@お腹いっぱい。:2022/08/25(木) 13:41:14.40 ID:NlWt3JDX.net
エロ微妙じゃね
単に綺麗な高画質裸見せられても抜けないしな
自分の性癖にマッチした絵柄作れんと..

242 :名無しさん@お腹いっぱい。:2022/08/25(木) 13:47:40.18 ID:OfpVbaR2.net
>>239
ペド野郎は黙ってろw

243 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:34:45.84 ID:27UNS4S+.net
このツイートにあるサイト気になってるんだけど知ってる人いる?

https://twitter.com/c_b_industry/status/1562067463965413376
(deleted an unsolicited ad)

244 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:39:18.43 ID:4J094gOD.net
>>243
ここでワーワーやってる人たちはみんな知ってるというか、まさにその話をしてるスレだぞ

245 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:41:34.59 ID:M/HLpgpi.net
>>243
CLIP InterrogatorっていうColabのnotebookでしょ
StableDiffusionで使われてるCLIPだけ抜き出して画像から認識されたトークンの固まりを見せてくれる

246 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:42:09.69 ID:c37Glsrf.net
>>243
自分は別所で知ったけど多分ここ
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb#scrollTo=rbDEMDGJrJEo
StableDiffusionなら途中のCLIPmodelsはViTL14を選択
だそうで

247 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:43:46.01 ID:27UNS4S+.net
ありがとう!

248 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:50:39.39 ID:WCWmOzW9.net
>>43の上から三番目の奴を進めていって最後までガイド通りに勧めたつもりです
IPアドレスみたいなのからブラウザでインターフェースを開けたまでは良かったんですが
仮出力でtext2imgでcatだけ打ち込んでも下の画像のエラーが吐き出されて困ってます。
誰か助けてください。

もしかしてGPUが貧弱だってエラーが出てるんでしょうか? 私のPCのグラボはRTX2060
あとgoogle colaboの時に入力したトークンを このやり方だと入力してないのでそこも怪しいと思ってます。

”ERROR” ?ee; 4.07GiB reserved in total by pyTorch) if reserved memory is >> allocated memory

https://imgur.com/a/Ii4R0jq

249 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:51:36.43 ID:RAP75DmM.net
こういうので二次創作したり作家名入れて生成してるやつ盗作やってるのに近いな
自分で楽しむだけならいいが公開したら盗作と認定して問題ない

250 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:52:34.34 ID:6YPP1xAX.net
>>134
これのやり方全然わからん
pythonなんたら入れるだけいうから、コピペで入れたがエラー
input.jpgをcontentフォルダにstable~フォルダ作ってもダメ

251 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:53:26.91 ID:bW+JTxuc.net
>>249
>>221

252 :名無しさん@お腹いっぱい。:2022/08/25(木) 14:53:37.83 ID:6YPP1xAX.net
syntax errorだから何が悪いかも手がかりないわ

253 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:00:08.91 ID:bW+JTxuc.net
syntax errorって書き間違いとかだから一番簡単では・・
自分で書き換えた部分がおかしいしかありえない

254 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:00:13.52 ID:WCWmOzW9.net
>>252
もしかして私に言ってますか?手がかりがないなら最初からやり直しかなあ

255 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:06:40.97 ID:6YPP1xAX.net
>>253
ワードにaaaaとかhappy new yearとか入れただけ

>>254
自分はcolab環境で試してるので

256 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:07:33.06 ID:6YPP1xAX.net
colabでのやり方見つけたと(やり方書いてないが)かいうのはググると出てくるからそもそもできないんのかな

257 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:10:28.65 ID:bW+JTxuc.net
>>255
エラーの場所まで<-------みたいなので出るでしょ?

258 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:12:05.46 ID:6YPP1xAX.net
>>257
それが出なくてどこでダメか足がかりもない状態

259 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:17:00.10 ID:vxd1o7Th.net
Pythonというかプログラミングが何もわからないまま書いてある通りにcolabで始めて適当に書いてあるコード繋げ合わせて10枚出力できるようになったんだけど、毎回11枚分動いてて最初の1枚は見れない…

260 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:26:41.40 ID:bW+JTxuc.net
>>258
間違った
「^」で直接の場所が出てるはず、例えば

prompt = "A fantasy landscape, trending on artstation"
      ^
SyntaxError: invalid character in identifier

Pゴシックだからズレてるだろうけど、これは
prompt(半角スペース)=(全角スペース)"A fantasy ...
になってる、(""内はokでも、構文中で全角なんて認められない)

261 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:31:09.28 ID:69YAqvqT.net
何言ってるのか分からない人いるなとずっと思ってたけど
事前に用意してあるnote bookじゃなくてcolabに手動でインストールしてる人がいるのね
まあWindowPCに入れるよりは大分楽だろうけど手動セットアップは多少は苦労するわな

262 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:34:36.34 ID:Ha2zzk9Y.net
img2imgも結局は呪文次第なんか。なかなか難しい。

263 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:36:27.76 ID:M/HLpgpi.net
>>248
そうだそうだTips忘れてたわ
GFPGANの300MBぐらいのpthファイルをダウンロードしてきたと思うんだが
これを指定された場所に入れると顔の補正処理が有効になって余計にVRAM食って512x512の画像はVRAM6GBでは出力が無理になるんだわ
削除して立ち上げ直すと通ると思うよ

それでも足りないと言われるならHeightとWidthを512から減らすしかない

264 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:39:05.22 ID:k+pssYjE.net
>>260
どうも入力したワードでなくoptimized_img2img.pyを実行させる構文の表記自体が受け付けられてない
できたできた言っているしよくわからないなこれ

265 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:43:41.96 ID:bW+JTxuc.net
もしかして既存のnotebookとかじゃなく自分でcolab上に一から環境作ってるの?
それはさすがにわかんないわ、自分よりはるかに高等

266 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:47:10.53 ID:69YAqvqT.net
予想しない凄い画像出てくるときと全然駄目なときの落差が激しいな
youngって1単語追加するだけで絵がガタガタになったりしおる

267 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:49:11.75 ID:F5OuPmFA.net
一般的なワードは雑多すぎてだめっぽい
高品質な絵と紐付けられてるワードは安定してる

268 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:52:15.57 ID:M/HLpgpi.net
>>266
若いって一言に言われても色々ある
それこそこれこそが自分が思う若さだ!っていう画像をCLIP Interrogatorに入れてその結果からキーワードを拾うといいのでは

269 :名無しさん@お腹いっぱい。:2022/08/25(木) 15:52:26.80 ID:k+pssYjE.net
>>265
そっちのほうが楽かなあでやってみたけど難しいわこれw

270 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:00:07.90 ID:hocSwwFi.net
広い意味がある単語だと安定しないぽいね
Hayao Miyazaki new movie poster とかいれたら
ボブネミミッミみたいのが出て笑ったわ

271 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:01:08.01 ID:69YAqvqT.net
初心者→colabにセットアップ済のnote bookを使用
マニア→colabに手動でセットアップ
PG経験者→自宅PCに環境構築

出来なくはないけど完全初心者が自宅PCに構築するのは面倒だから
まずはnote bookを使おう、リソース制限されても月額1000円でpro使えるし

272 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:02:42.42 ID:WCWmOzW9.net
>>263
ありがとうございます!削除してサイズを256まで落としたらなんとか出力しました。

273 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:09:17.70 ID:bW+JTxuc.net
PCまぁまぁ詳しいけど、絵は練習したが人にお出しできるレベルは描けずタブレットが埃かぶってる
・・・というあるある層が殺到してる気がする、まぁ俺なんだが
CG板とは思えない賑わい

274 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:11:28.24 ID:M/HLpgpi.net
>>272
256はサイズが小さ過ぎて出力が破綻しやすくなると思う
タスクマネージャのGPUのVRAM使用量とにらめっこして、他にVRAM使ってるソフトがあれば終了させた方がいい
0.2GBぐらいがデスクトップだけの状態の標準

275 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:21:19.28 ID:k9nPgg7F.net
Stable Diffusion GRisk GUI 0.1
https://grisk.itch.io/stable-diffusion-gui
https://img.itch.zone/aW1hZ2UvMTY3NTU5Ny85ODY5NTEyLnBuZw==/original/cZ7Yvl.png
https://img.itch.zone/aW1hZ2UvMTY3NTU5Ny85ODY5NDc5LnBuZw==/original/ESUFPg.png
https://img.itch.zone/aW1hZ2UvMTY3NTU5Ny85ODY5NDk5LnBuZw==/original/Znqprz.png

276 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:31:39.14 ID:k+pssYjE.net
公式のreadmeの説明通りにまんまやれば出来た…
騒がせちゃってごめん

277 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:32:25.06 ID:xC5n/wz5.net
>>149 を参考にStable Diffusionを使ってみたけど、「うんまぁこんなもんかな」と言うのが第一印象
https://i.imgur.com/yfsUNsj.jpg
https://i.imgur.com/KpRlayq.png
作画補助とかモブとか背景には使えるかも知れないけど、引き続き絵の練習はしようと思った

278 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:37:24.57 ID:wzypMg/1.net
>>275
patreonって書いてあるけど有料?

279 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:41:18.77 ID:Kv3mpmre.net
目を引くアニメ塗り+エフェクトみたいなことはできなそうだね
どれも厚塗りっぽくなる

280 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:41:22.81 ID:YuPTVAPk.net
>>275
昭和の火星人くらいはAIの中にいるって感じだなw

281 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:45:24.80 ID:isNyMC5f.net
めちゃくちゃ楽しいな。無限にやっちゃう
絵描けないけど自分だけの作品作れるの最高
ところで解像度もっと高くできないの?生成された画像が小さすぎる

282 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:50:16.04 ID:hocSwwFi.net
>>281
みんなどういう環境でやってるか知らないけど私はここで指定してるね
image = pipe(prompt, height=512, width=512)["sample"][0]

283 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:53:53.73 ID:k9nPgg7F.net
>>278
そのうち正式版はpatreonでパトロンに対してのみ配布すると思う

284 :名無しさん@お腹いっぱい。:2022/08/25(木) 16:56:56.59 ID:hfFQOXA7.net
colabだとサイズ大きくするとメモリ足りなくてエラーにならない?

285 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:06:34.15 ID:wzypMg/1.net
どこでもそう

286 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:31:13.18 ID:Kv3mpmre.net
背景として使いたいんだけど吐き出してくるもの全てが情報量多過ぎてこまる。

287 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:52:34.76 ID:o0loqUTt.net
不細工な顔のついた肉塊ばっかしかできない
ぐぐるたびたび切れるけど何でだろというか今朝作った垢のパスがわかんなくなってログインできなくなったw

288 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:54:17.95 ID:y9jnFobJ.net
>>286
そこらは単語でいくらでも制御できるでしょ
例えばMJだとflat designとか入れたら紙みたいな背景になるよ、SDも似たのあるはず
そこらの単語を調べて順次細かさを上げて行けばいい

・・って言うのは建前で、現状のAIって単純明快な線はめっちゃ下手糞なんだよねぇ
みんなimg2imgで修正してまで回してるのがその証拠
ごちゃごちゃ色つけて装飾するから粗が目立たないって誤魔化しが今の精いっぱい

289 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:54:28.22 ID:69YAqvqT.net
矛盾の無いように出来るだけ詳細に説明する必要があるな
girlだけだと滅茶苦茶になる
髪の色、年齢、表情、姿勢、背景、動作、服装を整合性の取れるように付けないといけない
それでもイラスト系の単語は体を壊すけど

290 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:58:11.13 ID:9SQbFuqt.net
某氏すげー勢いでフォロワー増えてんな
気持ち良くてやめらんないだろうな

291 :名無しさん@お腹いっぱい。:2022/08/25(木) 17:59:19.69 ID:hocSwwFi.net
https://i.imgur.com/LKSMf7u.png 

得手不得手はあると思う。こういうデザインは精細で結構カッコイイ
アニメ風になると一気にへぼくなる

292 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:00:24.92 ID:Pq8tiNh5.net
>>290
それな
もう「自分の絵」上げられなくなりそう

293 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:00:32.85 ID:Kv3mpmre.net
なんか粘土ペタペタ貼ってるような作画だし、手直しするにしても線画からやらないと辻褄あわないんが難しい。
カラーラフくらいにはなるけど、色は自分で決めたくなっちゃう。
絵描きの雑感。

294 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:01:00.38 ID:27UNS4S+.net
>>286
MJなら「--no (非表示させたいもの)」で出したくない要素を制御できるよ

295 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:01:08.92 ID:y9jnFobJ.net
表面質感はほんと凄いよね
ゲームから学習しまくった結果なんだろうけど
特にアメリカ人はリアル系ゴテゴテ大好きだし

296 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:02:31.26 ID:y9jnFobJ.net
MJの--noは優秀
デフォだと、すぐピンクとか青蛍光とか入れてくるので、いろいろぶっこんでるわ
ちな複数は
--no pink,blue,fire
みたいな指定じゃないと動かない

297 :名無しさん@お腹いっぱい。:2022/08/25(木) 18:21:34.14 ID:yLypCkp0.net
>>275
試したけど真黒い画像しか作れなかった

298 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>297
コメント欄にもあるけど、一部グラフィックカードだと黒い画像しか出ないバグがあるみたい
(Stable Diffusion自体の問題で、本来は実行コマンドを調整して直すところがGUI側にその機能がない)

299 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:06:38.22 ID:LY2UcQV2.net
>>275
試してみました。 お手軽!だけどイマイチなので今後に期待
Stable Diffusion GRisk GUI 0.1 https://grisk.itch.io/stable-diffusion-gui

・rarファイルをダウンロードして、展開、Stable Diffusion GRisk GUI.exeを実行するだけで動く
・他のローカル環境と競合しない
・出力は画面上ではなく、フォルダ出力で自動的にプレビューできないので(今のところ)使い勝手はかなりいまいち
・HPに書いているようにSEEDは機能しない。Save In Gridもチェックできない、など開発中
・デフォルトが64x64になっているのでとりあえず動く人は多そう。普通は512x512で使うと思うけど
・私の環境(2080Ti)では、若干遅い。
https://rentry.org/kretard 7.3 it/s
GRisk 5.0 it/s
 basujindal 1.4 it/s

300 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:10:11.10 ID:LY2UcQV2.net
>>297,298
黒い画像というか、(デフォルトでは)resultsフォルダにPNGが出力されて、そもそも画面に画像プレビュー欄がないような

後txt2imgのみでimg2imgもいまのところない

301 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:22:35.73 ID:M/HLpgpi.net
GRiskって人はGitHubに転がってるキーボードポチポチしないと動かない便利そうなソフトを
GUIつけてWindowsで動くようにしたものをPatreonで配って稼いでる人
基本機能装備できたら配布版は更新止まって後はPatreon版に全部乗るようになるからそのつもりで使った方がいい

302 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:31:07.71 ID:wzypMg/1.net
SDはドラレコに弱すぎる
版権にも弱い
Craiyonだと簡単に出せるものがSDで出せなかったりする
進化の余地があることはわかるんだけどね

303 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:31:39.74 ID:RxPy6RIE.net
既出だけど、https://rentry.org/kretard のプロンプトマトリックスいいね
https://github.com/hlky/stable-diffusion-webui

キーワードを | でつなぐと、そのキーワードのあり・なしの組み合わせを一気に作ってくれる
(最初のワードは全てに入る)

girl | artstation | makoto shinkai | detailed face | highly detailed

だとこうなる。 https://i.imgur.com/mUcR4CN.jpg

304 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:37:15.82 ID:d0yfrXSy.net
>>298
>>300
297だけど1650SUPERで黒画像しか出なくてダメだったわ
このクラスじゃへっぽこなのかレゾ512にしたら止まって動かなかった

305 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:37:40.82 ID:F5OuPmFA.net
https://note.com/tansaku667/n/na9fd1b35831d
前回は顔だけでしたが今回は頭から股まで見える3Dモデルを徐々に変換してみました。

https://i.imgur.com/GphudxE.jpg
https://i.imgur.com/IilftaT.jpg

テキストから画像生成するのも楽しいですが、もっといろいろな用途がありそうです

306 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:42:54.31 ID:hocSwwFi.net
これは全部AI出力なの?
なんか疑り深くなっていかんな

307 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:47:00.27 ID:y9jnFobJ.net
980tiのCUDA駄目だった人間だけど、微妙~にNVIDIAのドライバver上げたら動いたよ
5日遅れでやっと追いついた

ローカルSDやったけどやっぱ遅いね、さすがVRAMが6GB
512x512のstep50が、1枚で3分半かかる、4枚で7分、5枚で8分

ローカルimg2imgはnonetypeエラーで止まったけど、--Wと--Hしてなかったのが原因だった
デフォでインプットの512x512のままにしてくれるみたいな親切な設計ではなかった
ツイッターの人のコマンド参考にすると文字制限で端折ってるので駄目ね・・

308 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:47:51.76 ID:F5OuPmFA.net
本文に書いてあるけど修正と変換を繰り返してる
修正って言ってもキメラ的な合成に近い

309 :名無しさん@お腹いっぱい。:2022/08/25(木) 19:53:09.32 ID:2wkhi8A7.net
>>305
面白いですね
1点ものイラストならポーズ指定で結構できそう

310 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:06:44.19 ID:d0yfrXSy.net
https://rentry.org/kretard
これwebgui.py実行するとメモリどうとかランタイムエラーでてVRAM4Gじゃ動かないのか…

311 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:07:24.28 ID:F5OuPmFA.net
手でちょこちょこ修正して感じたけど、人物の絵の歪みが定量化されたら簡単にクオリティの高い人物イラストが生成される
生成された絵のうち「歪んだ絵」と「正しい絵」の数値化をすればいいだけだし、時間の問題かも

312 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:10:28.76 ID:tLC8w+Jc.net
4000番代でグラボ買い替えようかなとは思ってたけど欲求がさらに高まってきた
メモリ12GB以上のものにせねばならぬ

313 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:13:35.86 ID:4BGNwpMk.net
3090でローカル環境構築してぶん回してるけどだいたい1回の生成が15秒くらいですとりとり

314 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:15:44.67 ID:69YAqvqT.net
>>311
そのタイプのAIは何年も前からあってあんまり話題にならなかった
今回の拡散モデルは絵のクオリティが全然違うから盛り上がってる

315 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:16:40.67 ID:NlGf4jm2.net
「AIがこれ描いたの!?」系の話題は最初だけだろうし変にこだわらずにガンガン手を入れちゃって良い気もしてきた
AIのべりすともそうだけどだんだんAIに書かせてるのか書かされてるのか分からなくなってくる感じが逆に楽しい

316 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:19:35.77 ID:69YAqvqT.net
拡散モデルは原理的に実写や細かいディテールのある画像に強くて平坦なアニメ絵に弱いから
それがアニメ用の学習モデルでどれくらい改善するのか気になる
個人的にはもう一段のブレークスルーが必要だと予想してるんだけど

317 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:19:44.16 ID:F5OuPmFA.net
AIの存在はクリエーターの活動に溶けて何がAIで何がAIじゃないのか分からなくなると同時に、既視感のあるデザインやイラストが増えるんじゃないかな
イラストの数が少なくかつ学習の難しい特徴を持つ絵柄だけが個性として生き残っていきそう

318 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:25:02.58 ID:69YAqvqT.net
凄く単純に言えばノイズを加えた画像から元画像を復元するよう学習させたのがMJやSDの拡散モデル
実写画像はノイズ加えても元の情報が残っているからこの学習が上手くいくけど
殆どが平坦で同じピクセルが並んでるアニメ絵にノイズを加えるとそこにはただのノイズしかなくて情報を持っていない
4chanでの下手な絵を学習してるのが原因では?という説は誤りでアニメ絵を学習出来ないのは原理的な限界
そこを改善できるのか?が注目だよね

319 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:33:26.54 ID:DqzH7U06.net
>>283
一日2日前くらいに配布されたStableDiffusionが正式版じゃないんですか?

320 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:35:51.32 ID:d0yfrXSy.net
陰影も一種の塗りのパターン化だからそこを詰めてパターン認識の蓄積で行けるんじゃないかなあ
すでにイラストに陰影込みで彩色するのあるけどそのまま転用は無理にしても
拡散モデルと切り離してそれ用に作る方が良さそう

321 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:37:30.91 ID:y9jnFobJ.net
img2img、あんなツイッターやらの説明だとみんな一発で出てると思ってるよね・・
これが実際なのに
https://www.reddit.com/r/StableDiffusion/comments/wvasna/iterative_img2img_results/

322 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:38:28.32 ID:EJyQ1pV0.net
Emadさんのツイート。「生成」じゃなくて、「生成的検索」というのが面白いね。
「分散型&動的な次世代プロトコル」ってのがある程度具体的な話になってるのか、ただのビジョンなのか

@EMostaque
The intelligent internet.
Personalised generative search models for everyone that compress knowledge.
Image, audio, text & more.Distributed & dynamic - a protocol for the next generation.

This is how we build the foundation to activate human potential @StabilityAI
---
知的なインターネット。
知識を圧縮する、すべての人のためのパーソナライズされた生成的検索モデル。
画像、音声、テキスト、その他。分散型&動的な次世代プロトコル。

人間の潜在能力を活性化させる基盤はこうして作られる @StabilityAI

323 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:40:32.30 ID:EJyQ1pV0.net
>>319
「Stable Diffusion GRisk GUI 0.1」の正式版ってことですね
ベース(ソースコード、モデル)は公式の正式版そのものだけど、
GUIを付けて簡単に実行できるようにしたGRiskの正式版、ってことね

324 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:42:58.56 ID:EJyQ1pV0.net
>>318
なるほど、だからアニメ用モデルを別にリリースしますみたいな話になるのね
勉強になる

それはそれとしてデッサンが崩れてるヘタクソな絵が出てくると元データのせいでは?って思いたくなるw

325 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:49:02.20 ID:F5OuPmFA.net
写実的なイラストを描いてるタイプのイラストレーターをpromptに入れると絵柄が安定するけど、平面的な絵のイラストレーターだと不安定なのはそのせいか

326 :名無しさん@お腹いっぱい。:2022/08/25(木) 20:52:17.83 ID:wzypMg/1.net
公式のcolab来たね
https://colab.research.google.com/github/stability-ai/stability-sdk/blob/main/nbs/demo_colab.ipynb

327 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:03:20.53 ID:EJyQ1pV0.net
>>326
公式のcolab前からあったような?と思ったらこれ、新しいAPIのデモですね。
DreamStudioのメンバーシップないとAPI KEYがなくて使えない

328 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:07:40.79 ID:zyWvVtGI.net
アニメ用モデルならwaifulabやmakegirlsの例があるし頑張れば出来るんじゃないか

329 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:13:08.32 ID:zyWvVtGI.net
Crypkoが商用利用可能になってたわ
https://www.preferred.jp/ja/news/pr20220825/

330 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:17:40.84 ID:WCWmOzW9.net
頑張ってSDをローカルに入れたけど500×250ぐらいの出力が限界で全然綺麗じゃないわ
うーん流石にPC買い替えしたくなる

331 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:20:46.30 ID:gT+8LwsL.net
>>330
自分も同じ
軽量版でないかとずっと待っている

332 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
waifulabやmakegirlsは本物/偽物を見破るAIとこの判定を突破するAIの対決による
相互学習でそれらしい絵を出す学習モデルでアニメ絵には向いてるんだよね

333 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
顔潰れないようにワード詰め込むと、なかなか立ち絵になってくれない
ただ、有名人入れなくてもキレイな顔出るようになってきた
ワード選びのバランスが難しい

334 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
アニメ解説
https://i.4cdn.org/g/1661430174245164.png

335 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
windowsが古くて260文字以上に未対応(レジストリもポリシーも不可)
img2imgで呪文入れまくるとフォルダが作れないという情けない状態
pythonわからないのでどう変更したらいいものか・・

os.makedirs(opt.outdir, exist_ok=True)
outpath = opt.outdir
sample_path = os.path.join(outpath, "_".join(opt.prompt.split())[:255])

このあたりだとは思うんだが、255減らしても駄目だった
つかそんなフォルダ名にするなよ・・

336 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
M1 macにはまだ来てないん?

337 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>334
色ピックアップしながら自分で描いた方が早いような・・(爆弾発言)

338 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>335
sample_path = os.path.join(outpath, "sample")
こんなんでOK

339 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
当たり前だけど自分の好きな女優の画像を元に描かせるのが一番自分の好みに近い

340 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>338
ありがとう!

341 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>336
手順はありますね
https://zenn.dev/bellbind/scraps/ea15aab699dde9

342 :名無しさん@お腹いっぱい。:2022/08/25(木) 21:59:11.64 ID:EJyQ1pV0.net
StableDiffusionでシームレステクスチャ生成
https://twitter.com/fururu3d/status/1562516200122626049?t=ChaF0DvtsGahxuN92t02jg&s=19

これ見ると、padding_mode='circular'の設定してるだけ
https://gitlab.com/-/snippets/2395088

GUIに実装して欲しい
(deleted an unsolicited ad)

343 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:03:13.63 ID:69YAqvqT.net
プロンプトをフォルダ名にするのって後からでもプロンプト分かるから結構便利なんだよな
windowsのフォルダ名制限が厳し過ぎるのがいかんわ
どうせ物理的なアドレスと何も関係ないラベルなのに何で制限あるねんっていう

344 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:05:01.43 ID:AUsdt6Tp.net
imagetoimageをgoogleのcolabで使いたいんだがやり方まとめられた日本語のサイトってある?
翻訳かけながら色々やったけどうまく行かなかった…

345 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:12:46.78 ID:EJyQ1pV0.net
>>43 の最初の方のcolab (img2imgできる方)は今は動かない気がする
なんか特殊な手順とかあるのかもしれないけど

どっかに動くimg2imgのColabないかな

346 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:18:27.66 ID:EdzYCuJ8.net
>>329
遅い上に高い
月千円プランでAIに食わせるのに使われるのがせいぜいだろこんなん

347 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:18:38.41 ID:69YAqvqT.net
Crypkoみたいに没個性過ぎると沢山いる絵描きにAIさんという1人の新人絵師が加わりました
って感じになるだけだから特に何もインパクトはなく数年が経過しちゃったんだよね
MJやSDはあらゆる画風を出せるってのがこれまでになくてこりゃやばいってなった
既に実写系なら特定のアーティストの画風パクれるもんな、、、Wlopとか人気過ぎだろみたいな

348 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:19:55.80 ID:mb1yTHTw.net
エロ絵作りたいんだけど現状だと何をやればいいんでしょうか?

349 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:20:03.16 ID:mb1yTHTw.net
エロ絵作りたいんだけど現状だと何をやればいいんでしょうか?

350 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:21:08.76 ID:wzypMg/1.net
これでimg2imgできるでしょ?
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa

351 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:22:24.19 ID:Ugfsb0rE.net
cloab上限来て試してないんでimg2imgのサポートツール
出来るかわからないけど一応貼っとく
https://www.reddit.com/r/StableDiffusion/comments/wv2msc/stable_diffusion_img2img_google_collab_setup_guide/

352 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:23:15.14 ID:EJyQ1pV0.net
>>350
昨日時点は、だけどpytorch undefinedとかになって動かないはず

353 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:24:36.22 ID:wzypMg/1.net
https://i.4cdn.org/g/1661411406913791.png
https://boards.4channel.org/g/thread/88284357#p88285430

female pope, big tits, highly detailed, intricate, magic the gathering, d&d, award winning, top rated, skinny, fantasy, oil on canvas
以下も入れたかな
dark, gloomy, desaturated, greg rutkowski
https://i.4cdn.org/g/1661412160633735.png
https://boards.4channel.org/g/thread/88284357#p88285554

beautiful handsって入れろよ
https://boards.4channel.org/g/thread/88284357#p88285665

354 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:28:23.74 ID:WCWmOzW9.net
>>331
同士いた~ 風呂入って考えたけど、PC買い替えるよりGOOGLE COLABOの月1000円コース申し込んだ方が
なんかあったとき融通効きそうでこっちを前向きに考えてます。

355 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:31:13.04 ID:uCLwesYu.net
>>242
ID:OfpVbaR2
ちゃんと文章見えてるか?まさに俺が指摘した通りの返しになってんじゃん?
自己紹介して自滅してループして死ぬだけの虚しい人生お疲れ

356 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:41:59.45 ID:y9jnFobJ.net
>>343も一理あるので

def left(text, n):
return text[:n]
・・・
sample_path = left(os.path.join(outpath, "_".join(opt.prompt.split())[:255]),150)

にしたよ、頭から150文字取る
たぶん本来は255の方でなんかするんだろうけど、動いてるからいいや

357 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:45:06.88 ID:OfpVbaR2.net
>>355
ガチペド変態野郎

図星だったねwwww

わかりやすっ

358 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:49:26.55 ID:NJdOqyBE.net
これも他のAI系ソフトみたいにTensorコアが使えるGPUの方が速かったりするんだろうか

359 :名無しさん@お腹いっぱい。:2022/08/25(木) 22:55:52.31 ID:M/HLpgpi.net
>>358
>>65

it/sは1秒間に何回回せるか
50回回すと画像が出てくる

360 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:12:17.38 ID:y9jnFobJ.net
なんだろう、I2IはMJと違って苦痛しかない
MJの--betaで遊びたい・・はよ復活して

361 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:25:04.57 ID:V9wOObE6.net
basujindal版って最初からcheck_safetyが消されてるんだな。
grepして無いなあと思ってたがCompVisのtxt2img.pyとdiff取ったらcheck_safetyの部分がスパッと削除されてたわ。

362 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:27:05.79 ID:gFBahm0pZ
GOOGLE COLABO で実在なら一発BANの裸の幼女画像とか生成されたらと思うと怖くない?

363 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:26:47.90 ID:NJdOqyBE.net
>>359
サンクス
まさか2060が1080Tiの2倍も速いとは

364 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:28:16.70 ID:V9wOObE6.net
GOOGLE COLABO で実在なら一発BANの裸の幼女画像とか生成されたらと思うと怖くない?

365 :名無しさん@お腹いっぱい。:2022/08/25(木) 23:59:27.58 ID:+7jfWPLK.net
一日ごとにエロ絵のクオリティが上がってるのはいいが、正気に戻ったときが辛そうで辛い。

366 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:04:57.41 ID:SjnZS+HX.net
>>65
何気にこのプロンプトかっちょいいな・・
https://i.imgur.com/ZHUmVNT.jpg

367 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:40:35.16 ID:o3NpW9jG.net
kretardガイドは非推奨になりました
新しいGUItardガイドをご覧ください
https://rentry.org/GUItard

368 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:47:42.88 ID:SWDfWijj.net
>>367
これすげえよな
img2imgに完全に残す部分のマスク自由選択機能と
弱いimg2imgを段階的にかけていくフローが搭載されてる
世界最強に近いフロントエンド

369 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:51:18.35 ID:GdsxPSjK.net
>>367
このスピード感よ…乗るしかないこのビッグウェーブに

370 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:55:04.45 ID:UyUIEwKp.net
革命だわ

371 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:56:13.98 ID:YJdMz7aW.net
英語が読めるお前らが羨ましい

372 :名無しさん@お腹いっぱい。:2022/08/26(金) 00:57:27.04 ID:o3NpW9jG.net
現時点でbeautifulとかcuteみたいな形容詞はほとんど無駄かも
https://i.4cdn.org/g/1661442205411192.jpg
https://boards.4channel.org/g/thread/88287881#p88290273
広く使われる言葉はダメかも (かわいいとかの方が有効?)
https://boards.4channel.org/g/thread/88287881#p88290351

綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
ミュシャはおそらくトレーニング不足
https://i.4cdn.org/g/1661442369934289.jpg
https://boards.4channel.org/g/thread/88287881#p88290314
https://i.4cdn.org/g/1661442716455937.jpg
https://boards.4channel.org/g/thread/88287881#p88290385

373 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:14:54.14 ID:BMg1Qp7q.net
>>367
毎日環境が変わっていく……

374 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:17:02.24 ID:o3NpW9jG.net
>>367
もうステップ3は飛ばして大丈夫だわ
レポのほうで対応してる

375 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:19:04.35 ID:SjnZS+HX.net
>>367
インストール中

>>372
> 綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
みんな入れてるよね
検索してもD&Dのドラゴンみたいな画像しか出ないからなんでかなぁって思ってた

376 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:20:46.59 ID:o3NpW9jG.net
5も飛ばして大丈夫だったわ…
てかリドミに導入方法が簡潔に書いてある
https://github.com/hlky/stable-diffusion

377 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:22:23.66 ID:UyUIEwKp.net
これ使ってなんか描いてみるか

378 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:23:39.25 ID:nqlpUObU.net
呪文の単語数や文字数の上限があるらしいのですが具体的な文字数単語数ってわかりますでしょうか

379 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:28:02.00 ID:o3NpW9jG.net
>>374
>>376
やっぱダメだったわ
なんか更新された

380 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:33:08.76 ID:SjnZS+HX.net
>>367
https://localhost:7860/
これが動かない
ブラウザ側は火狐もchromeも「安全な接続ができません」
コマンドプロンプト側はInvalid HTTP request received連打

381 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:34:43.54 ID:o3NpW9jG.net
>>380
証明書とか入れてないしhttpでしょ
あとこのガイド
conda env create -f environment.yaml
を飛ばしちゃってない?

382 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:37:07.62 ID:jBVaAXwh.net
>>371
google で見れば自動で翻訳してくれるからだいたいわかるよ

383 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:39:44.15 ID:jBVaAXwh.net
>>382
Cromeで見ればgoogleが自動翻訳してくれると言ったほうがいいかな

384 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:39:55.94 ID:o3NpW9jG.net
> If your conda installation is somewhere that isn't \Programdata\miniconda3, adjust the path in webui.cmd accordingly
おま環だった

385 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:43:01.31 ID:UyUIEwKp.net
技術文章とか硬い文章はdeeplをつかうのじゃ

386 :名無しさん@お腹いっぱい。:2022/08/26(金) 01:43:52.48 ID:SjnZS+HX.net
>>381
ありがとう、httpだった・・キター!

> あとこのガイド
> conda env create -f environment.yaml
> を飛ばしちゃってない?
webui.cmdでバッチ化した模様

387 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:12:37.45 ID:2/9t2zeE.net
>>372
no ketuago

388 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:14:24.07 ID:o3NpW9jG.net
>>387
initはそうでもないんだけどね
https://cdn.fishki.net/upload/post/2017/07/09/2332585/isabelle-adjani-in-the-1970s--18.jpg

389 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:17:23.03 ID:eTDo/t/0.net
>>372
素晴らしい

390 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:20:26.92 ID:2/9t2zeE.net
しかしやりたいのは向こうにとってはペドの日本人的若い女の子のえろだけどメモリ2GBではどうしようもないから数年後かなあ
というか基本の部分蓄積できてからのほうがよさそうだ

391 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:36:32.03 ID:h91oFyDt.net
数十年後

「AI国際連盟はAI創作の発展に図らずも寄与したとして
Greg Rutkowski氏に貢献賞とゲーミングPC「ガレリア」(提供ドスパラ)を贈呈しました」

Greg Rutkowski氏「びっくりです。勝手に名前を使われ創作という名のパクリに利用されていたら賞を貰えました」

392 :名無しさん@お腹いっぱい。:2022/08/26(金) 02:52:18.78 ID:YJdMz7aW.net
自分で作り上げたロリショタデータでハードコアポルノ動画とか
作れるようになったらAI 規制法とか出来るんだろうなぁ

393 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:07:12.73 ID:o3NpW9jG.net
これ見ると名前を何回も詠唱することによって絵がうまくなる可能性ある
2回くらいやってもいいのかも
https://i.4cdn.org/g/1661450637738668.jpg
https://boards.4channel.org/g/thread/88287881#p88292177

394 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:10:45.10 ID:o3NpW9jG.net
いややっぱbyだけでいいかって思ってたら

[[[[greg rutkowski]]]] みたいに[]で何度も囲むのもいけるよって
https://boards.4channel.org/g/thread/88287881#p88292250

395 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:11:46.52 ID:SWDfWijj.net
Greg RutkowskiのGreg RutkowskiによるGreg Rutkowskiのための絵

396 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:19:50.01 ID:dE3nz1Ed.net
[]でワード強くできるのか
他のワードでも強調できるといいことあるかも

397 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:22:39.12 ID:o3NpW9jG.net
括弧でも
[こっちだと強くなって] (こっちだと弱くなる) らしい
https://boards.4channel.org/g/thread/88287881#p88292384

398 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:26:26.37 ID:31QdF/+f.net
>>393
https://i.imgur.com/EUhshla.png

さっき俺も試してたんだけど全然別のイラストが出てくることもあるから
記号いれるなり繰り返すなりでPromptが変わる=出力結果が変わる中で
たまたま好みのが出てきただけでしかないと思う

399 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:28:11.81 ID:31QdF/+f.net
>>398
prompt
actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski | by Greg Rutkowski | by Greg Rutkowski, by Greg Rutkowski
Steps: 250, Sampler: k_lms, CFG scale: 4.5, Seed: 1540371425, Prompt Matrix Mode.

デフォ:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski
V1:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski
V2:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski
V3:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski

400 :名無しさん@お腹いっぱい。:2022/08/26(金) 03:59:31.10 ID:o3NpW9jG.net
あれ[]意味なくね.jpg
https://i.4cdn.org/g/1661453251416386.jpg
https://boards.4channel.org/g/thread/88287881#p88292699

401 :名無しさん@お腹いっぱい。:2022/08/26(金) 04:42:55.08 ID:Ar08D0Fk.net
街歩いてたら看板の字がバグってて異世界に行ってしまった系の都市伝説みたいな写真描けるので楽しい。

402 :名無しさん@お腹いっぱい。:2022/08/26(金) 04:48:32.39 ID:J5H4Y39B.net
>>400
このwikiのEmphasisの項にも[]は現状機能してないっぽいとあるね
https://wiki.installgentoo.com/wiki/Stable_Diffusion

あと同じ強調呪文の繰り返しも効果あるって書いてるので
ID:o3NpW9jGさんの検証結果とも一致する

403 :名無しさん@お腹いっぱい。:2022/08/26(金) 04:51:18.61 ID:JIdTrYQS.net
>>367
GUItardの新機能抜粋 https://rentry.org/GUItard
・設定が手順が楽になった

★マスクペインティング: 画像の変更したい特定の部分のみを再生成するための強力なツール
・ループバック: 最後に生成されたサンプルを自動的にimg2imgにフィードバックする。
・Prompt Weighting (NEW):プロンプトの重み付け。プロンプト内の異なる用語の強さを調整

・サンプラーが増えた
 ・k_euler_aとk_dpm_2_aサンプラーは、同じシードとプロンプトから、非常に異なる、より複雑な結果をもたらします
 ・他のサンプラーとは異なり、k_euler_aは低いステップから高品質の結果を生成できます。50 ではなく 10 で試してみてください
---

マスクペインティングのやり方分かる人いますか?
アルファ消去するとそこ補完してくれるのかな?とか思ったけどうまくいかない(消した部分がそのまま黒くなる)

404 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:08:55.62 ID:JIdTrYQS.net
>>403
自己解決。単純に元画像の上にマスクを書き込むことが出来ました。

元画像の表示サイズが小さくて塗りにくい。もうちょっと改善して欲しい。
生成もちょっと試した感じでは自然にならなかった。

後多分バグで、「マスク部分を再作成」で複数生成すると、1枚目はそうなるけど、2枚目は逆にマクス部分以外を再生成になってる気がする。

ついでに、インペインティング可能なノート
https://colab.research.google.com/drive/1whhIiXxjQjbBuiq4lqwh-AlLIjh3l1OB

405 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:49:19.38 ID:Ar08D0Fk.net
https://i.imgur.com/qx5eyOT.jpg

beautiful short bob haired anime girl, water dress, portrait, water splash everywhere,
highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by Shunya Yamashita.

406 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:54:17.20 ID:Ar08D0Fk.net
>>65のプロンプト

https://i.imgur.com/11FAWhj.jpg

407 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:55:40.48 ID:S/rJEOX+.net
beautifulが効果ないってなんとなく思ってたよ
kawaiiを入れると露骨に目が大きくなるね

408 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:57:00.57 ID:2VbkagvJ.net
美しいポートレートはちょいちょい生成できるようになってきたが
シチュエーションころうと思い始めると途端に難しくなるな

409 :名無しさん@お腹いっぱい。:2022/08/26(金) 05:59:36.78 ID:Ar08D0Fk.net
プロンプトのサーチエンジン
https://lexica.art/

みんな上手。

410 :名無しさん@お腹いっぱい。:2022/08/26(金) 06:03:44.08 ID:Ar08D0Fk.net
>>407
beautifulが当たり前だからか

411 :名無しさん@お腹いっぱい。:2022/08/26(金) 06:05:48.55 ID:S/rJEOX+.net
海外ではおばさんとかにもbeautiful ladyとか普通に言うから
もうただの挨拶みたいになってるんだよな

412 :名無しさん@お腹いっぱい。:2022/08/26(金) 06:06:15.28 ID:JIdTrYQS.net
512x512生成のざっくり性能。少し更新

it/s = 1秒で何ステップ実行できるか。(例) 50 stepで1080Tiの場合、50step / 2.3 it/s = 21.7秒かかる

16xx(6GB) ---  512x512では動作しない ※
980ti(6GB) 0.36 it/s (2.81 s/it)
1070Ti(8GB) 1.60 it/s
1080Ti(11GB) 2.30 it/s
Google Colab(T4) 3.2 it/s ~ 3.8 it/s
3060 3.5 it/s
2060 4.6 it/s
3070 6.3 it/s
2080Ti 7.3 it/s ~ 7.73 it/s
3090 10.8 it/s

注 16xxは6GBメモリだが、出力がグリーンスクリーンになる問題があり、full精度にしないと動かない。
   そのためVRAM消費量が増え、512x512では動作しない。解像度を下げる必要あり。

413 :名無しさん@お腹いっぱい。:2022/08/26(金) 07:00:50.88 ID:o3NpW9jG.net
こんなリスト見せられてもどれを使えばいいのかわからんよな
https://www.reddit.com/r/StableDiffusion/comments/wqaizj/list_of_stable_diffusion_systems/

414 :名無しさん@お腹いっぱい。:2022/08/26(金) 07:20:05.74 ID:31QdF/+f.net
>>413
Colabは選定が大変そうだがWebサービスのまとめはちょっと試したい人用に便利そうだな

415 :名無しさん@お腹いっぱい。:2022/08/26(金) 08:46:38.94 ID:UDqjZjWY.net
もうすぐこれらの3D生成版が出来るってマジ?!
objやFBXを一瞬で作ってくれるの?!

416 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:09:39.54 ID:ggEkXtQg.net
greg rutkowski凄すぎワロタw

イメージボードこれでいいと思えちゃうくらいスゲーな

417 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:24:52.48 ID:YzJhqtmk.net
>>415
3D用のA学習Iモデルをリリースする予定ってツイートがあったのは確かだけど、
 (1) 画像・テキストペアデータは50億のデータデータセット(LAION)があったけど、3Dモデルが何十億もころがってるわけない
 (2) CLIP(画像と言語の対応関係をWEB学習)+DDIM(ノイズ付与+復元学習による高精度化)は使えないので全く別のAIになるはず
なので、何がどの程度できるものなのかは全然分からないね

画像よりははるかにハードルが高いのは確かでどうなることやら

418 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:28:01.22 ID:DjD0+uFq.net
stablediffusion のFigmaプラグインが準備中
パスとプロンプトやキーワードを入力後それに合わせた画像を生成

https://video.twimg.com/ext_tw_video/1562318372825509888/pu/vid/656x360/E0apcwRdxl9TUfZi.mp4

進化してるね

419 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:29:26.11 ID:APMDMYvk.net
音声の生成がすごい気になる
声優の声学習させてリアルタイムで変換できたりするんかな

420 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:31:07.84 ID:SsqIEZdF.net
スクリーントーンが最初出てきた時も「人間のかけ網と比べたら月とスッポン」って言われたけど結局普及したよね
AIもそうなるよ

421 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:36:18.84 ID:E2Vlw8ZM.net
>>417
めっちゃ素人考えだけど、今のMidjourneyもStableDiffusionも、学習時点で
「これは笑ってこちらを見ているエマ・ワトソン(美人)(緑の服)のイメージ」と画像をテキスト情報に判別してから学習している
(ファイル名とか画像についてるタグだけ見てるわけじゃない)

ならポーズ判別して学習してもいいはずで、ポーズが確定するならそこから3Dモデル+テクスチャにすることもできそう?
いや服はかなり難しいか・・・。ポーズだけじゃなく服の形状理解しないといけないからそれは流石に無理っぽい

まあ妄想の域を出ないから今の技術の使い方を考えつつ待つしか無い

ちょっと調べた感じ、MidjourneyやStableDiffusionの技術は最新ではないのでもっとスゲーのがMicrosoftあたりから出そうな気もする

>>419
来月リリースされる"audio"モデルってなんだろうね
雨、衝撃音、みたいなサウンド、音楽、人の声とか色々あるけど

422 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:37:45.50 ID:S/rJEOX+.net
動画作ってると効果音がすごく困る。フリーサイトでは全然思ったものがないし
そういうことが減るといいけどなぁ

423 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:40:37.37 ID:UDqjZjWY.net
>>417
フリーデータ収集タイプだと時間かかりそうだなぁ…
著作権的にもクリアなAIが一から生成するタイプになってくれたらありがたい…
ある物体の各方向の画像から3Dデータを作って、それを原本的に使うとか…
よくわからんけど…

424 :名無しさん@お腹いっぱい。:2022/08/26(金) 09:52:23.64 ID:31QdF/+f.net
https://github.com/hlky/stable-diffusion-webui/blob/master/webui.py

webuiが更新されてる
バグ修正とi2iの機能追加かな

425 :名無しさん@お腹いっぱい。:2022/08/26(金) 10:01:31.97 ID:IKhnqUWq.net
AIが学習の為にASMR音声を収集し始めるのか…出来上がりが楽しみだな!

426 :名無しさん@お腹いっぱい。:2022/08/26(金) 10:04:37.59 ID:ggEkXtQg.net
基本的な事を聞くようで申し訳ないけどAIの画像生成ってプロシージャルとは違うの?
自分の手元に出てきた画像が既存の絵や他人の画像生成と同じになる可能性はほぼゼロ?

427 :名無しさん@お腹いっぱい。:2022/08/26(金) 10:06:39.83 ID:S/rJEOX+.net
グレッグさんおなしゃしやす、って感じでぶん回してるが
なかなかぐっとくるのは出にくい
https://i.imgur.com/OirmSFt.png
でも本人に描いてもらってる感じに近いな

428 :名無しさん@お腹いっぱい。:2022/08/26(金) 10:17:48.42 ID:9bRVI9C4.net
>>426
言葉の定義の問題かもしれないけど、普通使う意味のプロシージャルとは違うね
他と同じになる可能性は当然ある

テキストエンコーダ+イメージジェネレータの組み合わせで

1.画像を「こっちを見てる猫」「ロボットのような半面を持つサルバドール・ダリの鮮やかな肖像画」・・・みたいに分析して画像と関連付ける
https://i.imgur.com/rNl4e0Y.jpg
https://i.imgur.com/RZr0oGw.jpg

2.(拡散確率モデルの場合)のノイズを加えて元に戻す方法を学習をして画像生成を行う
https://i.imgur.com/vStOKue.jpg

各社色んなモデルがある
https://i.imgur.com/3vUZLoy.jpg

元のスライド見たほうがいいと思うけど一応抜粋。 https://www.slideshare.net/cvpaperchallenge/foundation-models

429 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:11:58.16 ID:lsjqrsdd.net
>>427
めっちゃ完成度高くていいな
greg rutkowski でググるともっと激しいタッチの絵がいっぱいでこの絵とは似てないけどなんでこうなるんだろうw

430 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:18:45.76 ID:/eFFNXFN.net
ヌード作成きた
ただしロリは無理だしイラストも無理だからな

https://gigazine.net/news/20220825-pornpen-ai/

431 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:29:40.70 ID:aaawy5+6.net
>>430
自然言語じゃなくて、決められたタグで生成するのね
使用感としては生成するというより、単に画像検索してるだけな感じであまり面白くはない

いくつか見た感じ、顔も体の構造も壊れたものが少ない
(足が割れてたり、顔半分が潰れてたり、乳首が3つあったりするものが稀にあるけど)
人体が破綻しないようなAIを使ってるのか、人力で画像選別してるのかどうなんだろう

432 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:31:54.78 ID:Wquv7ko0.net
>>426
言葉のイメージとしてプロシージャル生成は、髪型はパターン2、目はパターン4、口元はパターン3で顔を組立てる、みたいな感じがある

433 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:33:24.80 ID:/eFFNXFN.net
君らどうせエロいデータセットたくさんもってるんだからソレ集めてマネタイズしなよ

434 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:39:03.84 ID:S/rJEOX+.net
https://i.imgur.com/zvoAlNg.png

Greg Rutkowski に lolita 入れると結構かわいくなるかも
もろおっぱいなんてヤボですよ

435 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:41:42.17 ID:/eFFNXFN.net
M1ではまだまだという話

https://twitter.com/NJRecalls/status/1562092014610841600
(deleted an unsolicited ad)

436 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:43:43.85 ID:Ar08D0Fk.net
>>427
サムライとかニンジャが活躍するアメコミに出てきそう。可愛い。

437 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:45:45.91 ID:SjnZS+HX.net
手足ぐにゃぐにゃは何時になったら治るんだろう

438 :名無しさん@お腹いっぱい。:2022/08/26(金) 11:48:11.43 ID:MgLgG5kM.net
検索するとセーラー服おじさんもDALLに熱中してるみたい
AIでもなかなかあの姿は生成できないだろうに

439 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:02:51.00 ID:zMzOdunF.net
>>437
自分なりに呪文を覚えていけばグニャらなくなる程度はすぐだよ。

440 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:06:23.71 ID:DjD0+uFq.net
人物の手足グニャグニャは現時点では以下のように
指定画像から画像を生成するのが一番かなーと思う
でも手の指はむずかしい

#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
https://pbs.twimg.com/media/Fa6n5_SagAA0h10.png
https://pbs.twimg.com/media/Fa6oOnIaQAcUSCy.jpg

441 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:12:20.33 ID:SjnZS+HX.net
>>305の人がそこらは詳しくレポしてくれてたんだけど、消されちゃってる
手修正交えてi2iで回してたけど、とにかく上手くいってない感じだった

442 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:26:40.68 ID:4KWrOa+f.net
来月リリースする"audio"ってなんだろうと思ってたけど、githubに作業中の項目書いてるね
1つ目は声を高くしたり低くしたいみたいな音声変換?(よくわからん)
2つ目はtxt2imgに、既存のGLIDEも使えるようにするってこと? >>428の絵を見るとtext encoderがclipからtransformerになる?
3つ目はテキストから音声読み上げ(TTS)、文字から音を生成?

https://github.com/huggingface/diffusers

A few pipeline components are already being worked on, namely:

1. BDDMPipeline for spectrogram-to-sound vocoding
2. GLIDEPipeline to support OpenAI's GLIDE model
3. Grad-TTS for text to audio generation / conditional audio generation

443 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:26:55.23 ID:S/rJEOX+.net
https://i.imgur.com/3jVlucn.png

個人的に結構当たりっぽいやつ
キャラデザインとしては優秀だなぁ

444 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:40:15.22 ID:MJLahhC0.net
Colabに構築したシステムに書き込んでるプロンプト情報や出力情報も、やっぱ本家に収集されてる?…
それならちょっと恥ずかしくなってきた(´-`)……

445 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:43:39.25 ID:Ar08D0Fk.net
>>443
たしかにかわいい

446 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:44:17.98 ID:4KWrOa+f.net
>>444
そんな器用な機能はないから欲望のまま好きなワード書けばいいよw

447 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:50:51.86 ID:MJLahhC0.net
>>446
そうだったの?!!!!
「エロい絵っぽいから黒塗りしとく」って言われたんで完全に監視されてるんだと思って一時間前から一切作るのやめてた!
海の向こうの人間たちに「こいつさっきからキモい絵ばっか作ってんな」「こいつの個人情報全世界に公開してやろうぜ」
って流れになってんじゃないかと思ってビクビクしてた…
収集されてないなら胸を張って作れる(´-`)!

448 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:53:03.14 ID:SWDfWijj.net
>>442
BDDMPipeline スペクトログラム(周波数と時間軸で音の成分を表現した画像)から実際に音を作る仕組み
→前段に「欲しい音のスペクトログラム画像を作るAI」が居れば音が作れるという下ごしらえ

GLIDEPipeline プロンプトへの忠実性としては世界最高峰と言える画像生成手法GLIDEをオープン実装する

Grad-TTS まだGANが主流で前時代的となったText To Speech(文章を読ませる音声合成)にdiffusionを導入する

449 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:57:02.09 ID:DjD0+uFq.net
AI画像コミュニティで #stablediffusionの #Img2Imgに3Dモデルを指示画像使用している人がいたのでクリスタの3Dでポーズ取り、目だけ描き込み→生成
設定補正小(2枚目) 補正中(3枚目) 補正大(4枚目)
指示文に髪・服・装飾などの情報は入れてない
指示絵が描けなくても3D人形使えれば絵になる
https://pbs.twimg.com/media/FbC0GrwaAAIhCTf.jpg
https://pbs.twimg.com/media/FbC0HKpagAA4KIm.png
https://pbs.twimg.com/media/FbC0Yt5aMAM3E4f.png
https://pbs.twimg.com/media/FbC10cCagAIJm5o.png

参考で

450 :名無しさん@お腹いっぱい。:2022/08/26(金) 12:57:40.24 ID:4KWrOa+f.net
>>448
ありがと!
なるほど1番目はエンドユーザーが直接使うものではなさそうですね
来月でる"audio"モデルというのは、BDDMPipelineなのか、Grad-TTSなのか。 後者なら遊べそうなので期待

451 :名無しさん@お腹いっぱい。:2022/08/26(金) 13:11:57.16 ID:IKhnqUWq.net
pixiv kawaii digital artでかわいい絵の命中率上がってた気がしたけど、もっといい呪文あったんだ…感動的

452 :名無しさん@お腹いっぱい。:2022/08/26(金) 13:17:53.64 ID:QGhIHI1C.net
某所ではミュシャと水木しげるを同時召喚することで絵柄の癖を相殺して安定した顔を生み出す呪文が開発されたと聞く
いよいよもって黒魔術あるいは一周回ってサイバーパンクじみてきて面白い

453 :名無しさん@お腹いっぱい。:2022/08/26(金) 13:19:53.31 ID:3lA/3zYt.net
後ろの方にKyoto Animationを入れると少しだけ絵が柔らかくなる
後ろの方にtrending on artstationでさらにイラストっぽくなるがこっちは壊れやすさも増す
anime.pixivは破壊力が強すぎて使っちゃダメ

454 :名無しさん@お腹いっぱい。:2022/08/26(金) 13:32:16.23 ID:o3NpW9jG.net
画風pastebin
https://pastebin.com/i2EJn6z9

455 :名無しさん@お腹いっぱい。:2022/08/26(金) 13:48:07.30 ID:UyUIEwKp.net
>>441
モザイク処理を追加して先程再公開しました

456 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:08:09.29 ID:SsqIEZdF.net
普通に25yo girl in akihabara, sweet lolita fashion とかで可愛い女の子出るよね
変な呪文唱える必要ないよ

457 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:13:29.85 ID:ml9Be2wo.net
人の頭が上下に二つ串団子状態になりがちなのはなんなん

458 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:14:05.03 ID:Ar08D0Fk.net
えっちなかんじするやつ
https://i.imgur.com/Vzc3jvn.jpg
https://i.imgur.com/SWcBB3g.jpg

459 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:17:34.30 ID:Ar08D0Fk.net
今日土曜日だと思ってたわ。

460 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:23:57.06 ID:o3NpW9jG.net
残念テレワ中でした

461 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:24:54.81 ID:/tEbuwMn.net
4チャンではフォークして機能強化したのが人気だね
https://github.com/hlky/stable-diffusion-webui

462 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:26:09.52 ID:4KWrOa+f.net
>>461
このスレでもそうだよw

463 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:40:20.23 ID:o3NpW9jG.net
ここならモデリングの知識なしでポージングできるよ
https://www.heroforge.com/

464 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:40:30.08 ID:H1lmJrf1.net
>>461
ごめんフォークってどういう意味なん?
煽りとかじゃなくてホンマに知らない 気が向いたら教えて

465 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:47:56.57 ID:Ar08D0Fk.net
>>464
派生版作るみたいな。

466 :名無しさん@お腹いっぱい。:2022/08/26(金) 14:52:56.09 ID:EelTTGZK.net
どうせやるなら3090tiとかでぶんまわしたいな

467 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:21:42.62 ID:H1lmJrf1.net
>>465
ありがとう!

468 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:30:07.25 ID:3lA/3zYt.net
学習元のデータセットのLION-5Bの58億5千万枚の画像には世界中から無差別に収集したアウトなのが大量に含まれてるのに
それをネットで公開して世界中にバラ撒いても許されるってのが規制の厳しい日本じゃ考えられんな
法律無視して単純所持で逮捕されるような画像を勝手に大量収集しても許されるグーグルみたいな特権的巨大企業しか
AIって無理じゃね?って想定が一気に崩されて世界が変わった

469 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:36:19.31 ID:zu61kmTt.net
>>468
それは真逆で機械学習のデータについては日本は無法地帯ってレベルで緩いよ

まあアレクサとか盗聴器を家庭に設置するようなことはできてないけど、法律規制の問題じゃない

470 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:39:04.89 ID:yQ31Q/fq.net
こういうのを何か柔らかい雰囲気で作りたいけどなんかいい案ある?
https://i.imgur.com/W2SFHIn.png

471 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:56:58.86 ID:SjnZS+HX.net
>>461
FLCLのハルコから離れていくの好き
https://raw.githubusercontent.com/hlky/stable-diffusion-webui/master/images/loopback.jpg

472 :名無しさん@お腹いっぱい。:2022/08/26(金) 15:59:37.37 ID:o3NpW9jG.net
CPU版出てたのか
https://github.com/bes-dev/stable_diffusion.openvino
モデルは専用のものを使用
https://huggingface.co/bes-dev
https://boards.4channel.org/g/thread/88298895#p88301409

473 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:19:43.86 ID:Yh7v5au2.net
>>435
メモリ少なすぎるだけでは
手元のMacメモリ64GBで1分ちょいだった
とはいえCPUで無理くり動かしてるだけだからMetal最適化待ちだな

474 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:20:01.25 ID:3lA/3zYt.net
およそこの世界のありとあらゆる画像データ公開されちゃったから
AIの技術革新が進めばおよそ何でもできるようになっていくんだろうな
パンドラの箱が開かれた感じ

475 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:30:24.12 ID:dE3nz1Ed.net
元々の仕組みからすればもっと分割してレンダリングするとか
少メモリで高解像度いけるようになるよねぇ
そうなったらもっと遊べると思うんだよなー
解像度上がるだけで細部潰れるのとか解決しそうなんだよね

476 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:37:42.00 ID:SnuzxdR4.net
Stable Diffusionさくっと試したい場合はGoogle Colabで動かせばいい

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE https://gigazine.net/news/20220824-stable-diffusion-google-colaboratory/

477 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:40:36.69 ID:3lA/3zYt.net
img2imgは現状だと落書きをマシにするにはいいけど元データの品質がある程度高いと劣化にしかならないね
クリスタの3D人形レベルならいいけどMMDで出力したキャラですら劣化するから3Dでいいなと
逆に背景は3Dでは処理が重くて厳しい高層ビルから見下ろした風景とかを上手くやれば出せるから有用度高いね

478 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:43:01.41 ID:AfXBNqcc.net
>>367
質問です
これ手順通りにやったんだけど
6GMあるのにグリーンスクリーンになります

それで下記の通り説明されてたんだけど……

グリーンスクリーンの修正:
次のパラメーターを使用して webui.cmd を編集します:
" python "%CD%"\scripts\webui.py --precision full --no-half"
(注: これにより vram の使用率が大幅に上昇します)、解像度を下げる必要がある場合があります。

このパラメーターの使用方法がわかりません……
わかる方教えてください

479 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:44:05.20 ID:EelTTGZK.net
こういうAIでエロ画像作って公開したら、日本だとタイーホ?

480 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:52:49.08 ID:UyUIEwKp.net
現状でもストーリーや文脈のないキレイなだけのイラストはAIガチャだけで生成されるからこれから様々なメディアに大量に投稿されるかも。それも今の数十、数百倍
AIを用いたイラストを使ってるってだけで毛嫌いされる時期が訪れるかもしれん

481 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:53:16.43 ID:3lA/3zYt.net
正直今のレベルならキャラは3Dソフトのほうが全然いいけど権利問題を誤魔化せるって利点があるんだよね
イリュージョンの3Dを下絵にして大ヒットして億単位の売り上げ出した某同人ゲームが著作権で叩かれて
販売停止された事件があったみたいにずっと絵の省力化には著作権問題が付きまとってきた
メーカー側が著作権フリー宣言してるソフトでも今度はユーザー製のMOD使ってるとやっぱり袋叩きでみんな委縮
AIは世間が理解できなくて許される雰囲気あるから一度誰かが先行して商業OKな実績出来たら雪崩を打って使われ出すと思う

482 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:54:21.34 ID:DjD0+uFq.net
薄い本で捕まる人がいたら気をつけて

483 :名無しさん@お腹いっぱい。:2022/08/26(金) 16:57:23.70 ID:UyUIEwKp.net
>>481
一部AIを使ったゲームとかCG集ってハッキリとAIが書いたって証拠なくない?
権利がそもそも主張できない

484 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:04:46.97 ID:WL/0wI51.net
>>478
「scripts」フォルダのなかの「relauncher.py」ってファイルの
os.system("python scripts/webui.py")
って行を
os.system("python scripts/webui.py --precision full --no-half")
にすればいい

485 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:09:32.44 ID:3lA/3zYt.net
>>483
これまでは法律も証拠も関係なく似ているというだけで叩かれてアウトだった
髪型が似ているとか似たような構図が特定の作品との間で多いというだけで差し替えや販売停止
それに比べてAIだと多分画風丸パクリでも許される流れになってきてる

486 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:10:52.58 ID:i9JF/aDL.net
>>485
GO!
https://mevius.5ch.net/test/read.cgi/cg/1659706163/

487 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:11:49.02 ID:loAKIiRJ.net
>>478
書いている通りですが、

webui.cmd というファイルがあると思うので、それを編集して以下の行を書き換えればいいと思います。

python "%CD%"\scripts\webui.py



python "%CD%"\scripts\webui.py --precision full --no-half


多分Geforce 16xxだと思いますが、解像度を下げる必要があり正直実用的じゃない気がします。
Google Colabを使ったほうが良さそう

488 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:12:11.33 ID:K8bYA1rq.net
colabは導入簡単で良いね
ただこれで触ると楽しいからもっと良い環境で使いたくなる

489 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:13:20.19 ID:loAKIiRJ.net
>>487 は無視してください。何も考えず英文のままレスしましたが、多分>>484の方が正しいです。

490 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:15:10.22 ID:loAKIiRJ.net
>>476
ノートをこんな素から書く人いなくないw
勉強したいならいいけど

491 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:16:22.52 ID:AfXBNqcc.net
colabだと
4chにあった
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa#scrollTo=UcSFxhq4P8kl
がいいのかな

なぜか手順通りにやっているはずなのに途中でエラーになるんだけど……

492 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:24:28.77 ID:RtCijTpd.net
>>490
勉強するなら公式のこれがいいね
https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

GIGAZINEさんのは日本語で丁寧に書いてくれてるのでありがたくはあるけど

493 :名無しさん@お腹いっぱい。:2022/08/26(金) 17:59:57.24 ID:3lA/3zYt.net
img2imgに写真食わせて背景作ると初心者が写真トレスしたときにありがちな
間違いとか誤魔化し多発するから絵を描く人にはやっぱり一発で分かるね
描かない人はそこまで気にならないだろうけど有名絵師の写真トレスとかも
同業者は叩かないだけで全然バレバレだからね

494 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:03:34.87 ID:SWDfWijj.net
>>493
>>221

495 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:04:17.44 ID:R4nFTPpG.net
>>493
GO!!!!
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

496 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:07:52.41 ID:UyUIEwKp.net
叩く叩かないとかイラレ業界のキモい常識押し付けてくんなよ...

497 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:26:04.94 ID:3lA/3zYt.net
GUI版で重くなるのあのアニメーションが原因じゃないな
別ブラウザでもとにかくjavascriptでアニメするようなページ開いてると同じことになるわ

498 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:26:49.10 ID:180gjllU.net
前スレから沸いてるペドガイジ↓一応自分が馬鹿という自覚はあるらしいね

158名無しさん@お腹いっぱい。2022/08/25(木) 05:53:26.27ID:OfpVbaR2
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ

499 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:34:45.78 ID:31QdF/+f.net
>>497
GPUカツカツ + ハードウェアアクセラレーションが有効になっててグラボが対応できないとか

500 :名無しさん@お腹いっぱい。:2022/08/26(金) 18:57:32.19 ID:AfXBNqcc.net
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa#scrollTo=UcSFxhq4P8kl

これ使っているんですけど、ここのuser_pathってなんのことかわかりますか?
ここがうまくいってないせいでエラーが起きる気がする

https://imgur.com/a/Xjn8Ydc

501 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:00:38.81 ID:o3NpW9jG.net
機械翻訳駆使して4chanの本スレで聞いて来いよ
作者に聞くのが一番だろ
https://boards.4channel.org/g/sdg

502 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:01:04.36 ID:3lA/3zYt.net
いったんアニメ絵は忘れてまず基準になるようなフォトリアルな
現実そのものの服装出せるプロンプトってどんなんなんだろ
例えば学生服とかで

503 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:01:37.96 ID:AfXBNqcc.net
>>489
>>484
お礼言うの忘れてたんでありがとうございます。

できはしたんですけど
重たすぎてすぐ固まってしまい
自分の環境じゃ厳しかったです

504 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:02:34.16 ID:AfXBNqcc.net
>>501
最終手段はそうします……
すでに昨日別件で4chで聞きました……

505 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:15:12.31 ID:3lA/3zYt.net
>>500
そこはインストール先決めてるだけだから
マウントされた/content/drive以下の好きなフォルダを指定するだけだよ
あとこの設定だとグーグルドライブに出力した画像が保存されるから
アウト画像生成すると通報されるぞ

506 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:18:31.80 ID:UyUIEwKp.net
https://mobile.twitter.com/akanekongo/status/1562805508473786369
prompt別まとめ

もう貼ってあったらゴメン
(deleted an unsolicited ad)

507 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:43:46.35 ID:lq+hA2bb.net
元画像の人物に髪を消してとか服を脱がせてとか出来たらエロが捗るんだがな

508 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:51:46.42 ID:+7yKirg9.net
>>500
これはモデルを既に自分のGDriveに保存している場合、それを使うという設定で、他の方法でダウンロードしているなら実行不要です。

上にある以下の2つのどちらかを実行すればOK。その下のHuggingfaceも不要です。
!gdown
%cd stable-diffusion

509 :名無しさん@お腹いっぱい。:2022/08/26(金) 19:56:16.36 ID:o3NpW9jG.net
>>507
マスク機能つきだけど
https://rentry.org/GUItard

510 :名無しさん@お腹いっぱい。:2022/08/26(金) 20:02:17.54 ID:FPuQB70l.net
誰か作るだろと思ってたけど、docker版StableDiffusion公開された

https://github.com/pieroit/stable-diffusion-jupyterlab-docker/

Docker/Docker compose/Nvidia-dockerが入ってる前提だけど

git clone https://github.com/pieroit/stable-diffusion-jupyterlab-docker.git
cd stable-diffusion-jupyterlab-docker
docker-compose up

この3行で動く・・・らしい

511 :名無しさん@お腹いっぱい。:2022/08/26(金) 20:23:34.06 ID:AfXBNqcc.net
>>505
>>508
ありがとうございます。

重ねての質問で申し訳ないですが、
Load modelでもエラーが起きます
これもわかったりしませんか?

https://imgur.com/JfsHVj4

512 :名無しさん@お腹いっぱい。:2022/08/26(金) 20:31:50.87 ID:MJhko+at.net
>>511
モデルがないってエラーだから>>508のモデルをダウンロードしてないか、ノートのバグかどっちかでは
ただモデルダウンロードしても、俺はそのノートブックが動かせたこと無い(他のノートは問題なく動く)ので詳しいことは動かせた人に聞くしか・・・

後動かしてるのがOptimizedSDだけど、それめっちゃ遅いから止めた方がいい
みたいなこともあってそのノート俺は嫌い

513 :名無しさん@お腹いっぱい。:2022/08/26(金) 20:41:00.53 ID:AfXBNqcc.net
>>512
そうなんですね……
なんとか自分のPCでもImage 2 Imageを動かしたくて調べてます……
ただ素人なんで苦戦してますが……

おすすめのノートあれば教え欲しいです

514 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:10:17.99 ID:o3NpW9jG.net
4chanのcolabでimg2imgできるらしいけど

515 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:22:00.55 ID:AfXBNqcc.net
>>514
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb

4chでそれっぽいのは見つけた?けど、よくわからない

516 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:26:45.33 ID:itcnfXXK.net
3DCGのtエクスチャ用途にバリバリハマってるわ…
これ2048+2048とかできんのか??

512じゃ解像度たらんのよー

517 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:35:02.89 ID:bvKjza8h.net
>>516

>>342
テクスチャといえばこのシームレステクスチャも便利そうね。試してないけど

解像度は3090(24GB)でも896x896が限界らしい
メモリ最適化版なら多分もっと行けると思うけど

518 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:35:24.69 ID:Ar08D0Fk.net
>>516
【超解像】画像拡大ソフト総合スレ10【waifu2x】
https://egg.5ch.net/test/read.cgi/software/1660544058/
使うとか

519 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:39:12.18 ID:itcnfXXK.net
偉い人に期待して待つわw
adobeかどっかが買収しちゃう気もするけどw

520 :名無しさん@お腹いっぱい。:2022/08/26(金) 22:56:51.09 ID:AfXBNqcc.net
このcolab使えばimg2imgできるらしいけど、
いきなり難しいこと書いてあって、よくわからん

誰か代わりにできないか試して欲しい

https://colab.research.google.com/drive/1CJBd4RsmTqPNiRc4pdmbcT8CS9DmoIjE?usp=sharing#scrollTo=MG2bqizGUR66

521 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:03:25.95 ID:H1lmJrf1.net
>>516
https://ytpmv.info/how-to-use-real-esrgan

522 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
動画はどうやって作ってんの?

https://twitter.com/remi_molettee/status/1562440354955395084?s=12
(deleted an unsolicited ad)

523 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
キャラがへなちょこと不気味の谷を超えて可愛くなり、おっぱいも見飽きた今、いったい何をするべきか。

524 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
ひたすら無駄な詠唱を削るためにwebuiのマトリックス機能でテストするといい
その分他の属性にリソースを割くことができる

525 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>513
これはキャラも背景も一定してないから、ベースのアニメをimg2imgでインプットして同じプロンプトで画像生成してるだけな気がする。
一定しないのを演出風に見せてるだけで

526 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
あ、違う。ツイート見たらこれ使ってるみたいですね。
https://twitter.com/deforum_art
https://colab.research.google.com/github/deforum/stable-diffusion/blob/main/Deforum_Stable_Diffusion.ipynb

どういう使い方、機能なんだろう
(deleted an unsolicited ad)

527 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>522
おもろい
実写か手描き?の連番をimg2imgて感じやな
やっぱ道具は使いようってことか

528 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:36:34.63 ID:Ar08D0Fk.net
>>522
似たようなこと昔これでできた

https://ebsynth.com/

https://www.youtube.com/watch?v=eghGQtQhY38

529 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:39:39.69 ID:16ttzI0o.net
生成できた絵で上手くいったやつ上げてほしい
手直しなしの状態で

530 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:43:31.08 ID:SWDfWijj.net
k_euler_aサンプラーすごいな
説明書き通り20stepぐらいで収束する

けどk_lmsと違う絵になるのが玉に瑕
破綻するわけじゃないからプロンプトとの相性次第か

531 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:48:03.82 ID:bvKjza8h.net
サンプラーの違いは、 https://rentry.org/GUItard の一番下に分かり易いのあるけど
k_euler_a、k_dpm_2_aが独自の進化するような感じ

k_euler_aは、サンプル数増やすと正常進化じゃなくて、変異が大きく見える

この例が一般的な傾向になってるか分からないけど

532 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:56:24.78 ID:Ar08D0Fk.net
>>529
オッドアイになった
https://i.imgur.com/jDgO2xj.jpg
>>405
のやりかた

533 :名無しさん@お腹いっぱい。:2022/08/26(金) 23:58:16.37 ID:16ttzI0o.net
>>532
ありがとう
眉毛?に笑ってしまった

534 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:04:43.06 ID:LudICNb0.net
つーかこれが限界

https://i.imgur.com/BVv8pJj.jpg

535 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:07:03.49 ID:rGPZhQgU.net
シード値がなにに値するのかわかる方いますか?

536 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:07:34.72 ID:LudICNb0.net
あのAIアートの人はどうやってるのかね
あんなにアニメ顔安定しないのよ

537 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:08:43.61 ID:rYu623zz.net
>>535
固定すると毎回同じ画像が生成される
値を変えれば新しい画像が生成される

538 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:09:53.10 ID:55tw+Qxr.net
>>534
すげえなこれ
ある程度複雑なポーズとかはi2iじゃないと難しいかな

539 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:12:13.39 ID:rGPZhQgU.net
>>537
この画像のSEEDが聞きたかったんですけど、
これがそうなんですか?
https://imgur.com/wjDP84c

画像見たい方いるみたいなんで貼ります
https://imgur.com/oczCLDx

540 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:15:53.71 ID:yp8wo02v.net
>>536
852なら目は手描きでしょ
かなり前から自分で言ってる、最近はなぜかツイート省いてるが

541 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:16:32.31 ID:XCBspsDQ.net
>>536
ただ数出して当たったやつをだしてるだけだよ
多少安定はするけどあのレベルがいっぱい出てくるのは無理

542 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:17:40.04 ID:x6WjdKCc.net
Colab構築版img2imgはjpg保存の選択とか出来ないのかな
リアル系画像だとデフォルトpngよりデータサイズが数倍大きくなっちゃって大量作成すると一日で合計1GB超えちゃう…

543 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:18:31.60 ID:0Q+OyymB.net
>>539
質問がわかりにくいねw
GUItardならランダムシードの結果のシードがいくつか出る

ファイル名がシード値になってたりするけど、どのツール使ってるかで違うね

544 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:18:34.29 ID:rGPZhQgU.net
>>542
img2imgできるColabぜひ教えてほしいです

545 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:19:18.97 ID:55tw+Qxr.net
>>539
なんちゅうか「そういうAIだから」と言われればそれまでだが
画風の振れ幅がすごいな

>>540
あいつの場合絵師だから、ほぼ全部自分で描いて
「AIが一発で描きました!ヤバイヤバイ!」ってやろうと思えばできるんだよな

546 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:22:19.75 ID:LudICNb0.net
>>540
あれ加筆してるの過去のだけじゃないのか…
ええ、なんじゃそりゃ…詐欺られた気分だ…

547 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:25:39.67 ID:4eKDvHgi.net
AI絵を自分の絵って詐欺、の逆かw
教えてもらったほうが参考になるっちゃなるけど、まあいいんじゃないの

548 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:28:10.57 ID:x6WjdKCc.net
>>544
自分が構築の参考にしたのは多分何度も貼られてるけどここに書かれてるやつ
ただ数日前のだからアップデート版とか存在するなら追いついてないかも


https://www.reddit.com/r/StableDiffusion/comments/wv2msc/stable_diffusion_img2img_google_collab_setup_guide/

549 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:28:55.26 ID:LudICNb0.net
>>538
テキストだとポーズは諦めた方が早いと思う
腕とか足制御してそこから顔が当たるのお祈りするよりportrait paintingで胸から下バッサリ捨てた方がまだ当たりやすい気がする
手を出すと数とか形もぐにゃぐにゃのままだしね

550 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:32:27.94 ID:55tw+Qxr.net
>>549
そこはやっぱりそうなのか
なんかAIの得手不得手が人間のそれとあまりに違いすぎて混乱するな

551 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:39:43.12 ID:cYyPub3G.net
>>540
やっぱりそうだよね
というか目の描き方が本人のイラストと同じだもん

552 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:42:53.66 ID:soUy0mxj.net
img2imgの入力するためにClipStudio買っちゃった
AIに描いてもらうはずだったのにおかしいな

デッサン人形機能だけならDesignDollの無料版でも十分使えそうだった
https://terawell.net/?lang=ja

553 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:47:53.87 ID:yp8wo02v.net
pixivの古い絵辿ればわかるけど
もともと写真加工背景によくある萌えキャラ絵を色合わせして描いてた人なんで水を得た魚状態
AI背景生成とは運命的な出会いだろう

本人にしてみれば、昔からやってたからここまでできるんだ=バズったしもう断り要らなくね?
みたいな、よくわからない増長があるんだろうな

554 :名無しさん@お腹いっぱい。:2022/08/27(土) 00:55:34.99 ID:/2e5i2/v.net
AIを活用しつつ絵を書くのはいい事だ

555 :名無しさん@お腹いっぱい。:2022/08/27(土) 01:01:22.21 ID:pEUIf7uL.net
>>516
背景のテクスチャとか
http://imaginaire.cc/gaugan360/

556 :名無しさん@お腹いっぱい。:2022/08/27(土) 01:16:40.26 ID:OU07VRpA.net
980tiだが、>>367がなぜか512x448以下じゃないと動かない、直打ちのOptimizedSDは問題なかったのに
全然動かないよりはマシだけどモヤモヤする、ほんのちょっとどこかから持ってこれんものか・・

557 :名無しさん@お腹いっぱい。:2022/08/27(土) 01:19:07.06 ID:tXCVIlYH.net
>>556
GFPGANは使う気がないなら入れてはいけない
入れると読み込まれてVRAMを余計に消費する

558 :名無しさん@お腹いっぱい。:2022/08/27(土) 01:23:26.52 ID:OU07VRpA.net
>>557
ありがとう、でもまだ入れてない

あとimg2imgでできた画像が微妙に拡大されてるのが嫌だ、なぜ100%で表示しないのか
くわえてCopy selected image to inputが滅茶苦茶時間かかるのが謎
元にコピーするだけなのになぜ「drawing」?生成したのをD&Dしたら一瞬

559 :名無しさん@お腹いっぱい。:2022/08/27(土) 01:47:02.35 ID:mZXdx8Aa.net
これって作成した画像を商用で使う時もMITライセンスの規定通り
Copyright (c)2022〇〇
Released under the MIT license
リンクアドレス

みたいにする必要あるの?
それともソフトウェアを再配布や販売した時だけ?

560 :名無しさん@お腹いっぱい。:2022/08/27(土) 02:02:58.32 ID:rGPZhQgU.net
>>548
これ参考にやってみたけど、
画像みたいにでてできないや……
model.ckpt'はちゃんとマイドライブに入れているんだけどなぁ
ここ数日img2imgのため時間無駄にしてるなー
わかる方教えほしいです

https://imgur.com/a/m3C1COd

561 :名無しさん@お腹いっぱい。:2022/08/27(土) 02:31:06.50 ID:OU07VRpA.net
craiyon元にimg2imgで変なのしか出なくてつまらんと思ってたけど、自分で描いた>>440下みたいな単色付き雑絵元に
新海とかgreg rutkowski とか入った呪文で、strength0.5、step50の5つくらいバッチで回したらいきなり面白くなってきた
これほんと革命だわ・・
craiyon出力のごちゃついた絵じゃなく、ほんと単純な線こそいい

562 :名無しさん@お腹いっぱい。:2022/08/27(土) 05:42:09.17 ID:soUy0mxj.net
Pythonコマンドから実行がなんとなくゴテゴテしてなくて最速だと思ってたけど
WebUI版の方が読み込み済みプロセス流用で1回生成あたりは早くなるのね

本家 35秒
basujindal版(CUI) 64秒
hlky版(GUItard) 13秒

563 :名無しさん@お腹いっぱい。:2022/08/27(土) 06:33:52.08 ID:nfjXgkLu.net
あからさまに誰かのtwitterアカウントの痕跡が出て笑った
https://i.imgur.com/3zL6XsS.png

564 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>560
「マイドライブに入れてる」というかそのエラーのパスにないんでしょ

565 :名無しさん@お腹いっぱい。:2022/08/27(土) 07:43:31.74 ID:cYyPub3G.net
>>563


566 :名無しさん@お腹いっぱい。:2022/08/27(土) 07:59:38.14 ID:OyxVpNnH.net
これ複数GPUに対応してるのかな?対応してるなら2枚差しでやってみたい

567 :名無しさん@お腹いっぱい。:2022/08/27(土) 09:02:25.99 ID:nSJ/aIoh.net
>>559
プログラムだけ
生成物には関係ない

568 :名無しさん@お腹いっぱい。:2022/08/27(土) 10:16:52.76 ID:slFZIVUQ.net
>>563
たまに有料写真らしき斜線も出る時あるよ

569 :名無しさん@お腹いっぱい。:2022/08/27(土) 10:45:08.60 ID:RhrP3rKu.net
朝起きたらhttps://github.com/hlky/stable-diffusionがRealESRGANに対応してた

570 :名無しさん@お腹いっぱい。:2022/08/27(土) 11:47:02.23 ID:RhrP3rKu.net
VRAMが4GBでも動くようになったらしい
https://github.com/hlky/stable-diffusion-webui/issues/97

571 :名無しさん@お腹いっぱい。:2022/08/27(土) 11:47:17.91 ID:fS1mdW6z.net
プロンプトの区切り方に決まりや強調方法はあるのでしょうか?
小文字のカンマ「,」が基本だと思うのですが、ピリオド「.」でも問題なしですか?
[] () のカッコ類でも強調されたり逆に弱くなったりという話がありましたが、結局あれは効果変わらずでしょうか?
他者のプロンプトを見ると!!!A!!!というビックリマークで区切っている人を見かけたのですが、強調効果があったりするのでしょうか?

572 :名無しさん@お腹いっぱい。:2022/08/27(土) 11:47:40.73 ID:fMA4vNNF.net
SDの背景絵見慣れ過ぎて人間の絵描きが描く背景がヘタクソに見えるようになってしまった
キャラもいずれはそうなるんだろうな

573 :名無しさん@お腹いっぱい。:2022/08/27(土) 12:12:57.57 ID:tXCVIlYH.net
>>571
実験した人が居て
「影響はあるがどれが良いかは分からない」というのが結果
カンマとピリオドでは違うし、他の区切りに使うような文字を使っても違う
けれどもどれがベストかは分かってない

他の単語とかと同じくそのまま解析に突っ込まれてニューラルネットに入るので、カンマを入れると特定の動きを毎回するのではなく、ただの文中の1文字でしかない

574 :名無しさん@お腹いっぱい。:2022/08/27(土) 13:02:43.84 ID:fS1mdW6z.net
>>573
影響自体はあるんですね!
プロンプトでの記号使用も奥が深い…
今まで文章の終わりもカンマにしていましたが、プロンプトでもピリオドの方が適切っぽいですね

575 :名無しさん@お腹いっぱい。:2022/08/27(土) 13:05:24.28 ID:RhrP3rKu.net
>>515
それはimg2txt

576 :名無しさん@お腹いっぱい。:2022/08/27(土) 13:32:09.03 ID:OU07VRpA.net
もうイラストレーター名の前にbyも要らんだろってやったら、オッサンになったりして笑う

577 :名無しさん@お腹いっぱい。:2022/08/27(土) 13:48:32.03 ID:PbRMjqpJ.net
メインの詠唱はしっかりした文章の方が理解されやすい気はしてる
セレブ顔混ぜたり、おまじない系は羅列でも割と効果ある感じ。

578 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:03:40.86 ID:fMA4vNNF.net
オープンソースのおかげで世界中で研究されてどんどん進歩していくな

579 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:19:36.12 ID:OU07VRpA.net
>>82で見かけたヤケクソな呪文
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirobako, yuyushiki, k-on!, nichijou, lucky star, a-channel, umaru-chan, nyaruko-san, devilman, claymore, kiseijuu, code geass, guilty crown, umamusume, idolmaster, kancolle, touhou project, nier automata, k-on, yuruyuri, cygames, production i.g, wit studio, p.a.works, ufotable, mappa, toei animation. cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel

580 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:23:04.33 ID:feJDv8ZX.net
ゔぁぁああ服が出ねぇぇぇ
「一枚の服だけ」が欲しいのに出ねぇぇ
一枚の服って指定してるだろうがあぁぁ

581 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:24:29.53 ID:RhrP3rKu.net
4chan.org/g/sdg
見てるんだけどなんかみんなイライラし始めてて笑えなくなった

582 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:28:57.33 ID:IOaKe0eq.net
>>579
無茶苦茶になるんじゃねーのw
と思ったら意外と悪くない出力になるね

583 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:29:28.43 ID:IOaKe0eq.net
>>581
イライラ?なんで?
思ったように作れないとか?

584 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>583
えっちな画像貼るなって一人でわめき散らかしてる奴がいるせいかな

585 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:34:53.04 ID:0kNQUSmH.net
>>526
やりたいけど使い方が全く分からない…

586 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:35:03.56 ID:peOhpSjK.net
平均的にいい部分だけ残るみたいな場合もあるよな
カレー粉みたいにめちゃくちゃになる言葉もあるけど…

587 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:38:02.03 ID:IOaKe0eq.net
>>584
なるほどw
まあ情報共有系、プロンプト・作品発表(R18/一般)は分けたほうがスムーズな気もする

こっちはまだそんな流れ早くないからいいけど

588 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:41:02.66 ID:WOqtrjL/.net
Emma Watsonって混ぜるとどんな状況からだろうと全部エマワトソンになるから笑うわ
人物におけるカレー粉的存在

589 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:44:57.89 ID:55tw+Qxr.net
>>578
萌え絵とかエロ絵っていう低俗な世界だからイナゴ共が大挙して研究して発展するのよね
これが例えば医療用AIだったら、いくらオープンソースにしても誰も見向きもせずに進化しない
仕方ないことではあるが何とも情けない話だな

590 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:45:22.57 ID:nfjXgkLu.net
エマワトソン頼んでもないのに出てくる時あるよな
開発側がファンなのか

591 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:48:03.02 ID:IOaKe0eq.net
エマ・ワトソンはちゃんと美人だからいいわ
海外で美人とされる女ゴリラが出てくるのはちょっと勘弁だな

592 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:54:03.42 ID:WOqtrjL/.net
画像処理の論文で必ずと言っていいほど出てくる例の謎の女性のポートレートも
元をたどると研究者がその辺に置いておいたポルノ雑誌から適当にスキャンしたエロ写真だしなぁ

593 :名無しさん@お腹いっぱい。:2022/08/27(土) 14:56:38.11 ID:fMA4vNNF.net
デジタル化が進んで便利になり3Dも写真加工も使えるようになり
昔は絵を描くのが簡単になってコストが下がると思われていたんだけど
現実には逆にイラストの作画コストはインフレし続けゲームに使われるCG枚数は減少の一途を辿った
最近のゲームのイベントCG枚数は昔に比べて1/10くらいに減ってしまっている
宮崎駿は写真やCG使う風潮に「そんなもん時間かかり過ぎだろ、手で描けよ!」ってキレてた話は一部で有名
せっかくAIが出来てもみんな下絵を自分で描いて〜修正用やリサイズは別AIで〜ループバックで〜って
たった数日で既に工数のインフレが進んでるの超速で歴史の繰り返しをしているの笑ってまうわ

594 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:03:16.63 ID:PbRMjqpJ.net
エマ単体だと大抵そっくりかちょいイケメンになる
自分の場合
Ana de Armas (目でかくなる・鼻細くなる美人
miss universe (ポーズ綺麗・遠くても顔潰れにくい・たまにブス
こういうのも混ぜてみてる
良い感じに似なくて美人になる有名人だれか見つけてー

595 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:04:05.42 ID:OU07VRpA.net
>>593
CGの未来スレ
https://mevius.5ch.net/test/read.cgi/cg/1659706163/
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

596 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:05:43.78 ID:DRKeFd5q.net
very detailedとかは最初のほうの文章に入れたほうが効果ある気がする

597 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:08:23.13 ID:OU07VRpA.net
今見たらアンチスレ結構賑わってるじゃん、古塔抜いてイラ板トップだ・・すごい
是非そっちでやって盛り上げてあげてくださいな

598 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:27:29.50 ID:lzcC8D0a.net
>>589
まさに規模の経済って奴やな
実用性や自分達への見返りを鑑みても100%医療AIへの発展に全力ベットすべきなんだがそこがまた人間故の性

599 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:32:06.76 ID:RhrP3rKu.net
デザイン革命だろこれ
https://i.4cdn.org/g/1661581786893080.png
https://boards.4channel.org/g/thread/88315299#p88316202

600 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:35:10.56 ID:pEUIf7uL.net
幻覚が見える系の統合失調症の人のアウトサイダーアートにも通じる気がする

601 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:37:10.07 ID:TtPvHroS.net
興味が仮にあっても自分で使えない物のOSSに貢献するのは難しい。動作がOKなのかどうか医者にヒアリングしないとわからないしね
医療AIやるならお金もらえるわけで、OSSに市場を破壊されにくい医療AIの方がいい面もあるね

>>599
めっちゃかっこいい
けど革命ってほどではないかな。

602 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:40:37.03 ID:4BvLkvup.net
>>600
自閉系サヴァンの視覚世界に近いんじゃないかな

603 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:41:34.57 ID:RhrP3rKu.net
>>601
思いついたものをポンポン画像化できるのはかなり便利じゃない?

604 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:42:12.10 ID:+j4SXp2h.net
もうアウトサイダーアートだよね

605 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:43:17.12 ID:TtPvHroS.net
>>603
あ、そういう意味ね。
そう思います

用途がどんな感じになるのか想像もできなくて期待と怖さがある

606 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
pixivデイリー1位のイラストに似せるというプロンプトの練習をしてみた
日替わりでお題が出るので楽しいかもしれない

607 :名無しさん@お腹いっぱい。:2022/08/27(土) 15:52:03.30 ID:RhrP3rKu.net
ここで検索して人形かケーキしか出なかったらハズレワードな気がする
https://rom1504.github.io/clip-retrieval

608 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:00:04.69 ID:CYkNwW49.net
https://nejitsu.minus-y.com/up/a/aDBx0Rsi.jpg

609 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:08:14.14 ID:RhrP3rKu.net
思いがけずすごい発見をしてしまった
painting, mucha
painting, by mucha
みたいな短いプロンプトだとえっちな絵が出てくる可能性高
https://i.4cdn.org/g/1661583971029549.jpg
https://boards.4channel.org/g/thread/88316473#p88316499

610 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:13:12.57 ID:cYyPub3G.net
死んだ後に自分そっくりの絵柄で自分の名前を冠してエロ絵生成されまくっとるとか俺なら泣きたいww

611 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:15:38.51 ID:7o8zjxjB.net
無料のStable Diffusionで4つとも全部黒塗り画像が続くと悲しくなる
表現の自由をください

612 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:17:00.08 ID:RhrP3rKu.net
でもミュシャの絵なんてほとんどえっちじゃん

613 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:18:51.86 ID:DRKeFd5q.net
むしろミュシャじゃたたないっていう

614 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:19:35.87 ID:RhrP3rKu.net
女性の絵をたくさん描いてるってのもあるかも

615 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:20:47.05 ID:7o8zjxjB.net
ルノワールも裸婦しか描いてないイメージ

616 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:26:52.25 ID:RhrP3rKu.net
GAN仕上げにすると油絵とかは質感が失われちゃうんだな
https://boards.4channel.org/g/thread/88316473#p88316487
https://i.4cdn.org/g/1661583922592286.jpg
https://boards.4channel.org/g/thread/88316473#p88316596
https://i.4cdn.org/g/1661584763180095.png

617 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:29:58.40 ID:tXCVIlYH.net
>>616
ESRGANの公開モデルとかは写真向けだから緻密な絵画風のを入れるとノイズ扱いされると思う
モデルがチューンされてれば別だけれども

618 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:38:33.07 ID:Wfou7ymM.net
>>609
だからワードは多い方がいいって言われてんだ
ちなみにグレッグ・シコルスキーさんも強いぞ

619 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:43:09.31 ID:fMA4vNNF.net
AIの絵にはエロさは全くないな、学習データの問題もあるっぽい
アウトな画像からも学習してるけど圧倒的に多いのは表の健全な画像だからな
そっちにかなり引きずられてる

620 :名無しさん@お腹いっぱい。:2022/08/27(土) 16:58:30.35 ID:OU07VRpA.net
頬ブラシいれたら大抵エッチになるさ・・

621 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:01:35.16 ID:JbODh9Pl.net
>>600
現代アートって正にそんなのばっかだからw

622 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:02:32.58 ID:JbODh9Pl.net
>>619
まあそもそもサービス提供元がエロとグロを規制してるから仕方ない

623 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:03:19.49 ID:8cZ3F7HA.net
エロ系はlaionのデータ眺めてみると動画サイトのサムネとタイトルみたいのばっかりでそういうのも良くない気がする
キャプションと画像がちゃんと結びついてない

624 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:20:46.49 ID:znTUSCdh.net
虹だけ学習させたhentai AIとか日本人ならやりそう…

そういうのできねーの?

625 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:21:29.34 ID:hXGOBq/P.net
そんなゴミを作るな

626 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:23:50.46 ID:HUbW7oH3.net
>>599
すごい、ナイス発想

627 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:26:53.37 ID:VAz8rZm4.net
danbooruあたりでtransfer learningしてる人いるっしょ。いないわけない頼む

628 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:34:41.98 ID:Wfou7ymM.net
>>624
そこは主に中国人が頑張ってる

629 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:39:01.10 ID:nm8KAVsJ.net
>>624
しようと思えばAI開発者なら出来るけど大きな社会的責任負ってまでやろうとは思わんだろ
エロとかはアングラ系がやってくれるだろうからそれまで待つしか無い

630 :名無しさん@お腹いっぱい。:2022/08/27(土) 17:39:10.10 ID:RhrP3rKu.net
>>624
インド版は作ってるらしい

631 :名無しさん@お腹いっぱい。:2022/08/27(土) 18:42:06.20 ID:OU07VRpA.net
質問
https://github.com/hlky/stable-diffusion-webui/
これって各ファイル手動でそれぞれの位置に自分で全部更新するの?
コツコツ全部やったんだけどブラウザ上のUIが
https://raw.githubusercontent.com/hlky/stable-diffusion-webui/master/images/txt2img.jpg
こういう黒いのにならないし配置も古いままなのはどこか間違ってる?

632 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:00:19.97 ID:RhrP3rKu.net
どういうこと?
git clone https://github.com/hlky/stable-diffusion してgit pullすれば良くないか?

633 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:06:09.54 ID:soUy0mxj.net
>>631
そっちのリポジトリは作業用で常に最新のが反映されてるらしい
ワンテンポ遅れて良いなら >>632 の方法が楽だと思う

黒い画面はURLにこんなパラメータつけたらダークモードになるっぽい
http://127.0.0.1:7860/?__theme=dark

634 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:07:38.24 ID:ct66p5uD.net
画像処理で有名な女の人の写真ってエッチなやつなんだっけ?

635 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:08:40.54 ID:RhrP3rKu.net
LenaはPlayboyの切り抜き

636 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:08:53.94 ID:OU07VRpA.net
>>632,633
ありがとう!githubなんて慣れてないからほんと苦手だ

637 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:29:45.45 ID:OU07VRpA.net
outputsのsamplesにちゃんとプロンプトをテキストで残せるようになったのか、嬉しい
しかしまたフォルダにプロンプト名・・と思って>>579入れたらちゃんと切り捨ててくれてた
やっぱ多すぎるとほとんど無駄なんだな

> Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirob
ここまでしか効いてない、思ったより少なかった
以下切り捨て

> Warning: too many input tokens; some (133) have been truncated:
> ako , yuyushiki , k - on !, nichijou , lucky star , a - channel , umaru - chan , nyaruko - san , devilman , claymore , kiseijuu , code geass , guilty crown , umamusume , idolmaster , kancolle , touhou project , nier automata , k - on , yuruyuri , cygames , production i . g , wit studio , p . a . works , ufotable , mappa , toei animation . cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel
shirobakoのshirobまで認識されてるからノイズになりそう?

638 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:57:55.16 ID:RhrP3rKu.net
え、ファイル名に入ってないと切り捨てられてるって意味なの

639 :名無しさん@お腹いっぱい。:2022/08/27(土) 19:58:38.47 ID:fMA4vNNF.net
アジア系やアニメ、ゲーム系が上手くいかないのは画像認識AI側の問題もあるっぽい
LAIONで日本の著名タレントで検索かけると無関係な日本人女性の写真が大量に混同されてる
アニメやイラストでもこの手の認識ミスが大量にあって画像認識段階でこけてる

640 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:00:26.27 ID:OU07VRpA.net
>>638
いやOSのファイル名の長さは関係ない
上で書いてる人いたけど、トークンに制限がある>>114

ちなパスが255文字意識してるらしく、SDのある場所によってはかなり短くなるので
同シードでプロンプトがあまり長いとケツの方が違ってもパスとファイル名同じになって上書きされちゃう模様
(自分の環境ではフォルダがghibliで終わってる)
stable-diffusion-mainはドライブのルートに置くべきか

なお、>>579のカンマなくしたらそれだけ多く認識されて当然画像も変わった
詰め込みたい場合は区切りなしがいいみたい

>>639
>>595

641 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:04:11.34 ID:hfPVoEGY.net
学習データの内容は流石に画像生成技術で良くないか?

642 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:13:08.53 ID:nzmlNcBC.net
PC弱者、英語弱者すぎていつ使えるようになるやら、、

643 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:20:21.89 ID:OU07VRpA.net
今のAI「一般」の画像収集が難でアニメ顔上手くいかない話とかアンチ賛美スレでワイワイみんなやってるから、そっちでやればいいと思う
つかみんな結構面白そうな会話してて読みこんでしまったw

ここはMJでどうやったらアニメ顔だせるかな?とかの具体的な話するスレでは?
技術評価じゃなく技術交換なんだし

644 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:28:40.53 ID:F+IzUT3x.net
>>642
同じく…

645 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:28:45.60 ID:rGPZhQgU.net
VRAM4GBでimg2img動かせるようになりましたか?

646 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:36:41.00 ID:zNc2PTuQ.net
nsfwチェッカーどうやって外すの

647 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:53:15.14 ID:R2jl8lfR.net
anaconda入れる意味あったかとかcdnnの入れる場所はcudaの場所でよかったのかとかよくわからん右往左往しつつようやっとStableDiffusion動かせたけど1枚2分かかる
うん、>>43のgoogle colabでいいや…

648 :名無しさん@お腹いっぱい。:2022/08/27(土) 20:54:56.88 ID:hfPVoEGY.net
>>643
Stable DiffusionはLAION-5B使ってるって分かってるんだから別に一般でもないだろ
なぜ普通にやったらできないかって話はどうやればできるかにも繋がるだろうし

649 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:00:37.68 ID:tXCVIlYH.net
Nendoroid

StableDiffusionフォーク先の話題から拾ったがやけにうまく学習されてるな
アニメ絵の顔面崩壊具合を見てると奇跡に近い安定性

650 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:01:26.97 ID:RhrP3rKu.net
ESRGANもう用無し

元画像
https://i.4cdn.org/g/1661600316925108.png
https://boards.4channel.org/g/thread/88317632#p88318688
SDでアップスケール
https://i.4cdn.org/g/1661601054256548.png
https://boards.4channel.org/g/thread/88317632#p88318800
RealESRGANでアップスケール
https://i.4cdn.org/g/1661601180735601.png
https://boards.4channel.org/g/thread/88317632#p88318818

651 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:27:50.90 ID:Wfou7ymM.net
>>650
redditのほうでやってる人は見たが、hlkyで対応してくれるのええな
ただESRGANの何が良いって顔修正してくれる所だから、一部だけ適用みたいなの出来れば最高なんだけどな

652 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:31:47.92 ID:Wfou7ymM.net
gigapixel art:0/0 gamma 2x
https://i.imgur.com/UBwbNZl.png

653 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:32:20.69 ID:tXCVIlYH.net
>>651
色々とごっちゃになってない?

GFPGAN 顔を認識して歪み等々を修正してくれる 解像度は上がらない
ESRGAN 画像全体にノイズ除去をかけて超解像してくれる 顔が歪んでてもほぼそのまま

654 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:34:47.66 ID:94PYUTZ7.net
GFPGANとESRGANどっちもかけていけ。なおメモリは死ぬ。

655 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:36:06.59 ID:Wfou7ymM.net
>>653
ごっちゃになってたわ

656 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:36:16.94 ID:7Dof+O/R.net
詠唱が上手い人、特に既存のアーティストのミックス、パロディ、再構築で個性出せるような人は、今後音楽で例えるならDJみたいな価値を持つようになるんかね

657 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:38:45.11 ID:nfjXgkLu.net
スペルマスターw

658 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:39:05.59 ID:+j4SXp2h.net
ミュシャとかゴッホ等々の名だたる巨匠の画風を統合したアートが生まれるのかな

659 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:41:51.39 ID:TtPvHroS.net
詠唱が上手い、と言ってもモデルがアップデートすると変わるんだよね

660 :名無しさん@お腹いっぱい。:2022/08/27(土) 21:42:43.80 ID:hfPVoEGY.net
>>500のnotebook、
・pytorch-lightningのinstallをURLで
・Load modelのckptをフルパスで指定
でやったら(少なくとも自分の環境では)動きましたね
ただLoad modelでなぜかやたらRAMを使ったのでColab Proじゃないと厳しいとかあるかもしれない

661 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:01:00.65 ID:OU07VRpA.net
どうせ駄目だろうって試してなかったGFPGAN
>>653で存在思い出したのでやったら980tiで動いたわ・・こりゃ捗る
512x448が448x448までになっちゃったけど、歪なサイズなんて意味ないし、丁度よかったw

662 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:08:27.38 ID:tXCVIlYH.net
>>661
GFPGANをCPUで動かしてVRAMを節約する起動オプションがあるらしい
使ったことないから詳しくは知らない

663 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:08:51.96 ID:xFdb5090.net
新たな概念を学習させるファインチューニングも面白そうだけどメモリが20GB必要らしく手が出せないな
一応時間かければcolabでもできるらしいが

https://www.reddit.com/r/StableDiffusion/comments/wvzr7s/tutorial_fine_tuning_stable_diffusion_using_only/

664 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:18:16.02 ID:sF4/noKa.net
3DCGメインで普通のゲフォを使ってたけど
この流れで次はちゃんとQuadro買わないとダメなんかなと思い始めてる

665 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:26:32.38 ID:TtPvHroS.net
省メモリ版のbasujindalがアップデートして、--turboでオリジナルと同等のスピードになったらしい。(+1GB消費)
解像度上げる時は省メモリで、普通は--turboとかにすると便利かも

https://github.com/basujindal/stable-diffusion

後キーワードの重みを数字指定できるようになってる
--prompt tabby cat:0.25 white duck:0.75 hybrid

>>664
Quadroって意味ありますかね?

666 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:33:13.36 ID:sF4/noKa.net
>>665
今この瞬間はゲフォで戦えてるけど
もっと高解像度な画像を吐くAIが主流になったら
普通に要求GPUメモリが20~30GBとかになっちゃうんじゃないかと危惧してます

667 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:36:33.67 ID:+j4SXp2h.net
画像AIの普及を妨げるのってグラボの性能と価格かもな

668 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:42:35.80 ID:R2jl8lfR.net
グラボの値段下がったと思ったけど跳ね上がっちゃう?

669 :名無しさん@お腹いっぱい。:2022/08/27(土) 22:50:50.01 ID:EUqBBWer.net
Midjourney Discordの登録者数が95万人(ピーク100万人だったけど無料枚数終わった&StableDiffusionでちょい下がった)
Geforceグラボが四半期で1000万枚(平均単価15万円)
少しだけ人気のゲームが販売された、程度の影響じゃないかな

騒いでるのはクリエーターでまだまだニッチ。一般にブレイクはしてない気がする。今後分からないけど
後企業のAIサービス用GPUとかがめっちゃ売れたりするかも

670 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:12:17.16 ID:4VRmLpiv.net
直に金にできるものじゃないからマイニングほどのパワーはないかと
それこそ必要スペックの高いゲームが流行るかどうかくらい?
しかし使い方が悪いのか、世界変革させられないぜ

671 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:28:20.33 ID:kGYLanZ1.net
>>668 >>670
RTX3080未満のグラボ持ちなら
Colabの方が電気代すらかからない無料でしかも速いからいいと思うんだが

ヤバイ画像作りたいってのなら話は別だが

672 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:36:14.02 ID:OU07VRpA.net
無料colabはストレスが・・ちょっとフォーカス外したらcaptcha出てきたり
離籍して戻ったら途中まで起動したのが全部終わって生成部が動かなくなってたり
あと100枚行かないうちに上限出て12時間だっけ?置かないといけなかったので
ガンガン画像作るとなると実用性が

ローカルPCだと翌日スリープから復帰したらそのままいきなりブラウザ上のgenerateボタンだけで生成が動く上、無制限
コマンドカタカタのはやたら遅かったけど、GUIのやつは最適化されてるのか全然遅くないので驚いてる

673 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:46:18.81 ID:DZyXZAfP.net
絵を描く人もやってると思うが物の名前や画家を調べるのも楽しい
遊ぶにも知識は大切だわ

674 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:51:27.42 ID:RhrP3rKu.net
存命の大物女優でやるとどうしても顔が長くなる
1970sとか1980sとか入れても

675 :名無しさん@お腹いっぱい。:2022/08/27(土) 23:58:05.92 ID:e0o0CQEY.net
>>674
youngとか、若いとか15才の頃とか入れてはどうか

676 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:12:11.83 ID:6X9JQ2/v.net
解像度上げたいならハードウェア面では何をよくすればいいんだろ?

677 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:12:44.55 ID:QuNPQemV.net
>>675
別人になる…

678 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:14:18.87 ID:jvpUgcGf.net
https://lexica.art/prompt/446dcebc-9f9e-46e1-90cb-1b92e93effc7
京アニ系プロンプト

679 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:14:27.24 ID:bWnmVXgB.net
>>676
VRAM more VRAM
もしくはCPUで長時間かけて焼く

680 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:19:22.61 ID:5g5iYiJ4.net
>>676
GPUのVRAMを増やす
でも3090TI(24GB)でも960x640、もしくは896x896が限界、らしい

マルチGPUだと、512x512を2枚同時実行はできるけど、現時点では多分解像度を増やすのは無理な気がする

A6000(48GB) 66万円でも単純計算で1920x1080は無理で1920x640とか? 個人じゃきついね

681 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:24:06.99 ID:el2ovhmc.net
>>679
>>680
やっぱVRAMかあ
2年前の3080の12Gで古いし現行の12Gにして改善するかなと思ったけどダメかあ
24Gでも辛い

682 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:28:09.66 ID:bWnmVXgB.net
StableDiffusionのデモで動かしてた時はA100の80GBを大量に入れたGPUクラスターで動かしてたんだとさ
そりゃ1024x1024の画像がバカスカできる訳だわ

683 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:28:24.91 ID:oC+XzzYP.net
Midjourney、StableDiffusionの前からGoogleのImagenとかがあって同じことが出来た。
しかし計算量・必要メモリ量が膨大でコンシューマGPUでは512x512なんて全然無理だった
Difffusionの何が凄いかというと、必要メモリ量を64分の1に削減してコンシューマ向けGPUでも計算可能にしたこと

内部的には512x512どころか64x64解像度で計算して、計算結果を512x512に戻してる
それでやっと6GBメモリとかなんだよね

684 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:29:16.88 ID:IYnowAka.net
>>677
midjourneyでは"15 years old "を頭につけて女優さんの名前で、顔が短くはならないけど年輪が刻まれていない雰囲気にはなった。
別人かどうかは見立て次第だけれど

685 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:31:01.69 ID:PaLIc/uC.net
プログラム作成者の人達、プロンプトの具体的限度文字数とか教えてくれないのかな
絶対俺無駄に入れまくってるから具体的に「256バイト以内です~」とか言ってくれると大変ありがたいんだけど
プログラム作成者ですら文字数上限を理解してないとかありえるのかな

686 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:42:27.26 ID:oC+XzzYP.net
>>685
トークン数は75
けど俺は”トークン”が何かがよく分かってない。CLIP(テキスト解析)の説明を読めば書いてるはずだけど難しいw

swiming, girl は2トークンだと思うけど、swiming girl は2トークンなのか、1トークンなのかどっちか分からん

687 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:44:49.55 ID:4A8mYVDF.net
https://github.com/huggingface/transformers/blob/v4.21.0/src/transformers/models/clip/configuration_clip.py#L96
77単語じゃないの?

688 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:47:43.83 ID:oC+XzzYP.net
>>687
最初公開された時は75だったはずだけど77になってますね。失礼

”トークン”=”単語”なのかな

689 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:49:00.72 ID:+1zbSHkB.net
でも>>579のカンマスペースハイフン全部なくした
Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoanimakotoshinkaihideakiannomochidukikeystudioghiblimadhousewhitefoxstudiotriggergainaxvioletevergardengranbluefantasyfategrandorderkinmoza!kanamemohanayamatashirobakoyuyushikikon!nichijouluckystarachannelumaruchannyarukosandevilmanclaymorekiseijuucodegeassguiltycrownumamusumeidolmasterkancolletouhouprojectnierautomatakonyuruyuricygamesproductioni.gwitstudiop.a.worksufotablemappatoeianimation.cutegirlsdoingcutethingstrendingonartstationpixivmakotoshinkaismilingsuperdetailedeyeseyebrowlesssymmetryfacevisualnovel
トークン数1?も最後まで警告なくちゃんと読み込んで萌え風になるんだよね・・どうなってんだろ

690 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:50:50.37 ID:PaLIc/uC.net
>>686
そこ謎だよなぁw…
「1単語ごとなら75個までです!」とか優しく言ってくれるとわかりやすいけど、絶対そこまで適用されてないし

>>687
って、本当に77単語までOKなの?…
実感として77単語も入れたら後ろ半分くらい効果を全く感じないんだが、本当に本当なのかな?……
77単語入れず30単語くらいでも明らかに最前と最後で適用されてる感違うし…
う~ん…むらむらする…

691 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:54:02.03 ID:oC+XzzYP.net
日本語だと多くのトークンを消費、とか書いてて謎が深まる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
> 特定のポイント以降のすべて (カウント方法に応じて 75 または 76 の CLIP トークン) は、単純に切り取られます
> Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。

692 :名無しさん@お腹いっぱい。:2022/08/28(日) 00:55:53.49 ID:4A8mYVDF.net
ごめんなさい単語じゃないですね
https://github.com/openai/CLIP-featurevis/blob/97cc12b7dbfddee1aba9bbdd6409d4633a0effa6/tokenizer.py#78
これ区切りが"トークン"…なのかな

693 :名無しさん@お腹いっぱい。:2022/08/28(日) 01:03:22.06 ID:bWnmVXgB.net
トークンっていうのは、AIが言葉に振ってるIDみたいなもの
入れられた言葉をトークン表と照らし合わせながら拾っていく

例えば、helloであればhelloという固まりのトークンがあるのでこれで一つ
hello allだとhelloとスペースとallで3つ
hjfj ftjb(意味のない羅列)だとh j f j スペース f t j bで9つ

翻訳みたいなことをされて実際の処理に投入される
日本語は2バイト文字だからただでさえ2倍のサイズな上に
ほとんどトークン表に登録されていないのでほぼそのまま文字数x2=トークン数でバカスカ食う

トークン表は言語を学習するときに勝手にAIが選ぶので追加とか削除はできない

694 :名無しさん@お腹いっぱい。:2022/08/28(日) 01:12:03.13 ID:60RqM723.net
はえ〜、なるほど
ちょっと目先を変えて日本語試してみてたけど、やはりそういう不利があるのか

695 :名無しさん@お腹いっぱい。:2022/08/28(日) 01:16:43.84 ID:lj5/NLyY.net
トークンオーバーフローしたらワーニング出すように修正しようかな、と思ってソースみたら
既に、GUItardは対応してた。以下のメッセージで何が無視されたかが出るはず

"Warning: too many input tokens; some ({len(overflowing_words)}) have been truncated:\n{overflowing_text}\n"

696 :名無しさん@お腹いっぱい。:2022/08/28(日) 01:17:08.40 ID:PaLIc/uC.net
>>693
勉強になります!

意味のわかる英単語(多くの画像検索結果が出る) 1トークン
スペース 1トークン
意味のわからない英単語(画像検索結果が殆ど出ないetc.?) 1文字につき1トークン

これの合計で75~77トークン以内に収めたら良い感じっぽいですかね?
目安がわかりやすくなった!

スペースとカンマは同じですか? 違うトークンとして認識されるんでしょうか??

「A B, C D」 AスペースBカンマスペースCスペースD =8トークン?
「A B,C D」 AスペースBカンマCスペースD =7トークン?

697 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>695
まさに>>637だね、数えたくないけど

698 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>696
すまん例にスペース使っちゃったけど今調べたらスペースは多分トークンの外だわ
カンマは1トークン

なのでカンマでブチブチ区切るととんでもない勢いでトークン数が消費されていく

699 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
Colabでhlkyのwebuiを起動
https://colab.research.google.com/drive/1KeNq05lji7p-WDS2BL-86Z8Y9SluGng4
https://boards.4channel.org/g/thread/88320701#p88321634

700 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>696
なんか根本的に勘違いしてるような気がする
トークン自体は画像とは関係ないものだし人間にとって意味が分かるかも特に関係ない
別サービスだけど日本語の説明ならこれが分かりやすいと思う
https://wikiwiki.jp/ainove_wiki/%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E4%B8%80%E8%A6%A7

701 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
https://github.com/huggingface/transformers/blob/f394a2a50d8729cd1ca9b368e330ec50664c3292/src/transformers/models/clip/tokenization_clip.py#L175
この正規表現の\pが新しめのPythonだと動かないけど、
"the're a'uuu 0120" のトークンは ["the", "'re", "a", "uuu", "0", "1", "2", "0"] になる?

702 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
エロには厳しいみたいだけど、作った背景とかを
エロゲーやエロ漫画の背景に使うのもダメなのかな?

703 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>702
小学生でもわかることを聞くガイジが居てw

704 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>660
よければ具体的教え欲しいです
自分素人なもんで、よくわからないです
あとColab Proにはしてます

705 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>702
> エロには厳しいみたいだけど
確かにMJとDSは有料サービスなんでうるさいんだけど、
SDはコード丸見えなんで早々に良心回路外されて無法地帯化してる

706 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
dalle用だけどカメラや照明の解説が参考になる
書き込み主がアカ停止されて見れなくなってるから、レスにあるアーカイブのURLから飛んで
https://www.reddit.com/r/AnimeResearch/comments/w0n9cl/dalle_2_anime_image_modifier_list_100/

707 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
そういえばすでにDreamStudioの話誰もしてないね、DSって書いてわかるのか一瞬迷った

708 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>698
実験してたらこうなったのでスペースも関係ありかと思っちゃいましたがそうでもないのですね!

,,,,~,,,,many cats,(カンマ148個+many cats,) 猫が出る 
,,,,~,,,,many cats,(カンマ149個+many cats,) 猫が出ない
,,,,~,,,,cats,(カンマ148個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ149個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ150個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ151個+cats,) 猫が出ない

>>700
「即位する」「即位した」でもトークン使用量が違うんですか!?
奥が深いなぁ……


とりあえず単語1トークン、カンマ1トークンを基本の目安として考えてみます!
その目安で簡易的な「プロンプト適用上限を超えています」とか表示されたら便利だなぁ

709 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:03:36.54 ID:M0HRyyB5.net
>>682
>>683
VRAM80Gをクラスタでwwwww

テクスチャ用途で2048夢見てたが、ムリポだな…
なんとか512か1024をアップスケールして2048にするしかねーわ

710 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:04:31.04 ID:lj5/NLyY.net
例えばこれは12トークンになるっぽい。
aとかtheとか意味があるのかないのか。単語だけ切り出して意味ない気がするけど、文脈を見て関係あるのかな

a girl on the beach, white , swiming

'<|startoftext|>', 'a</w>', 'girl</w>', 'on</w>', 'the</w>', 'beach</w>', ',</w>', 'white</w>', ',</w>', 'swim', 'ing</w>', '<|endoftext|>',

a
girl
on
the
beach
,
white
,
swim
ing



●webui.py
info = model.cond_stage_model.tokenizer([prompt], truncation=True, max_length=max_length, return_overflowing_tokens=True, padding="max_length", return_tensors="pt")
ovf = info['overflowing_tokens'][0]
overflowing_count = ovf.shape[0]
+ iid = info['input_ids'][0]
+ vocab = {v: k for k, v in tokenizer.get_vocab().items()}
+ t = [vocab.get(int(x), "") for x in iid]
+ print(t)

if overflowing_count == 0:
return

711 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:07:02.21 ID:lj5/NLyY.net
即位する 11
'<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'

即位した 11
['<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'

712 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:18:13.04 ID:PaLIc/uC.net
>>710
文章におけるトークン使用量の計算難しそうですね…
「swim」と「ing」を分けて計算されるんですか…
現在進行swiming分解済み単語とカンマだけなら10トークンぽいのに、12トークン…

「hayao miyazaki」等の人物名も2トークン扱いかな…
「hayao-miyazaki」でも2トークンかな…

713 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:24:36.74 ID:zmiqUmaN.net
>>708
なかなか興味深いですね
それ見て思ったのはカンマを二個並べると、トークン=意味としてのカンマと、純粋な区切りとしてのカンマを交互に認識していって
約150個のカンマが、AI的には70数個のトークン(中身はカンマ)として認識されて最後に77個目に猫をねじ込めるかどうかという挙動になってるように思えます。ただの仮説ですが

714 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:26:29.55 ID:1MaKtggW.net
そもそも人間が文章を見て何トークンか数えるのは無理だと思う
ましてUnicodeなんか出てきたら>>711みたいに文字ですらない単位で分けられちゃうし

715 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:28:07.17 ID:sBwVz76V.net
>>712
>「swim」と「ing」を分けて計算

>>700にあるURLの
>例えば「国王が即位する」という文をトークンに分けると、「国王/が/即位/する」という分け方になり、4トークン
>一方「国王が即位した」という文の場合、「即位した」で1トークンであるため、「国王/が/即位した」の3トークン

に近い挙動だね

716 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:31:56.22 ID:lj5/NLyY.net
>>712
swim と ingは、2トークなんだけど、</w>はingにだけついていて、1ワードだという認識はありそう

じゃあ</w>の単位で認識するのか?というと「可愛い巨乳女」は
'<|startoftext|>', 'a?', ' ̄', 'a', '?', '?', 'a??', 'a', '・', '¨', 'a1', '3', 'a\', '3</w>', '<|endoftext|>'

最後だけ</w>がついているけど、ちゃんと可愛い、巨乳、女、が生成される


>>669の冒頭だけ取り出すとこう
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani
['<|startoftext|>', 'watercolor</w>', 'painting</w>', 'in</w>', 'style</w>', 'of</w>', 'k', 'ren', 'z</w>', 'cush', 'art</w>', 'ilya</w>', 'ku', 'v', 'shino', 'v</w>', 'kyo', 'ani</w>', '<|endoftext|>'

Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoani
'<|startoftext|>', 'water', 'color', 'painting', 'inst', 'yle', 'of', 'k', 'ren', 'z', 'cush', 'art', 'ily', 'aku', 'v', 'shino', 'v', 'kyo', 'ani</w>', '<|endoftext|>'

こっちは,paintingが1つ
swimingは現在進行系の形容詞、paintingはく名詞として解釈されているのか1トークンになってる?

717 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:49:20.46 ID:1MaKtggW.net
形容詞とか名詞みたいな人間にとってどうかはトークンには関係ない
まして日本語だったら「可愛い巨乳女」は「可愛い巨乳å\³」みたいな意味不明な文字に見えてるはず
(もっと言うと「a¯aaa·¨a13a\3」でそれがトークンに分けられてる)
人間には分からんとしか言えんから理解するのは無理

718 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:52:51.98 ID:zmiqUmaN.net
何て言うか、厳密に数える方法を探索するというより
無駄にトークン数を浪費してしまう典型的パターンを突き止めて、共有しとく意義はあると思う

719 :名無しさん@お腹いっぱい。:2022/08/28(日) 02:53:53.32 ID:P4svKH72.net
>>717
あなたは理解できてないんでしょうけどCLIPは理解してますね

720 :名無しさん@お腹いっぱい。:2022/08/28(日) 03:00:34.41 ID:1MaKtggW.net
>>719
実際それは割とマジで(正確にはCLIPじゃないけど)AIは「a¯aaa·¨a13a\3」っていう文字列と可愛い巨乳女の画像を結びつけて学習してるから「可愛い巨乳女」って入れたら可愛い巨乳女が出てくる

721 :名無しさん@お腹いっぱい。:2022/08/28(日) 03:03:47.49 ID:P4svKH72.net
可愛い巨乳女、は人間は理解できるし、CLIPも理解している
>>717は全く意味不明

722 :名無しさん@お腹いっぱい。:2022/08/28(日) 03:10:44.03 ID:+1zbSHkB.net
細かいこと言わずに外人のおおらかさを学ぼう>>22

723 :名無しさん@お腹いっぱい。:2022/08/28(日) 03:12:26.51 ID:CkMkrgMz.net
生成における文章の力は強烈だけどトークンの計算が面倒そうだな
単語だけなら37,38個認識してもらえるぽいこと知れて良かった

724 :名無しさん@お腹いっぱい。:2022/08/28(日) 03:23:25.64 ID:zmiqUmaN.net
単語数、トークン数で思うのはさ、よくある強力呪文の例文に
in the skyってよく入ってるけど、AIが冠詞theを有意に活用してるのかはまあまあ疑わしいので(人間がtheを入れることで気持ちよくなってるだけ説)
theと省けば文末の単語を一個余分に認識させられる可能性があるみたいな、そういうハックは解き明かされてほしい
もう寝るので他力本願ですいません

725 :名無しさん@お腹いっぱい。:2022/08/28(日) 04:05:54.47 ID:Pft0DBuS.net
今日の学びはbronde short hairを入れると髪型サンプル画像のせいか構図のほうも首から上だけのパターンに引っ張られやすいということ…

726 :名無しさん@お腹いっぱい。:2022/08/28(日) 04:12:50.68 ID:aku20RdR.net
>>703
わからないので小学生にもわかるように教えて。
生成した画像は作成者自身が権利を持つのでアダルト作品にも使えるってこと?

727 :名無しさん@お腹いっぱい。:2022/08/28(日) 04:26:49.29 ID:1MSCQb34.net
>>726
間違ってるよ

AIが生成した画像に著作権は認められないので
「作成者自身が権利を持つ」のではなく
誰も権利を持たない誰でも使っていいフリー素材になる

もちろんAIの画像をさらに手作業で加工すれば
自分の権利を主張できる

またStable Diffusionのライセンスでは
「人に危害を加えたり、倫理的に問題があったり、
誤った情報を広めたりするために使うことは認められていない」
具体的に何がダメなのかは自己責任で考えてくれ

728 :名無しさん@お腹いっぱい。:2022/08/28(日) 04:30:00.81 ID:QuNPQemV.net
欧米人じゃなくて日本人が欲しいって人は"hanako"とか入れてみて

729 :名無しさん@お腹いっぱい。:2022/08/28(日) 05:02:57.95 ID:YyqL61iy.net
肖像権と著作権勘違いしてるのが講釈してるな
そして最後は自己責任とか。最初から自己責任でいいじゃん草生えるわ

730 :名無しさん@お腹いっぱい。:2022/08/28(日) 05:44:38.26 ID:YyqL61iy.net
↑呪文唱えた人とAIと演算リソースを提供した人が全権利を放棄(明記)した場合はフリーになるけどな

731 :名無しさん@お腹いっぱい。:2022/08/28(日) 06:28:55.83 ID:1MSCQb34.net
>>730
「全権利」って具体的に、何法の何権の話をしているの?
少なくとも著作権は誰も持ってないから著作権以外だよね

まさか法律をよくわかってない人がとりあえず「権利」
という言葉を使ってみただけで
それが何権かは自分にも分からないわけじゃないよね

732 :名無しさん@お腹いっぱい。:2022/08/28(日) 06:52:35.39 ID:ldRK+y0p.net
「お前の言うことは間違ってる、不十分だ」ではなく、端的に「これはこうです」って言う方がいいね
著作権以外にも、意匠権、商標権とか、知的財産権はある

私自身はあまり興味はないので調べる気はしないけど

権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる

733 :名無しさん@お腹いっぱい。:2022/08/28(日) 07:09:41.58 ID:VpEyRdfH.net
背景はフリー素材に近いものだから漫画に使うのは大丈夫でしょ
実在人物のエロ画とかはやめといたほうがいい

734 :名無しさん@お腹いっぱい。:2022/08/28(日) 07:13:29.30 ID:+1zbSHkB.net
>>732
> 権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる
マジ?

735 :名無しさん@お腹いっぱい。:2022/08/28(日) 07:19:16.02 ID:kIetuXjV.net
>>734
公式にちゃんと書いてるね
an invisible watermarking of the outputs, to help viewers identify the images as machine-generated.
機械生成画像であることを識別できる、目に見えない電子透かしが入っています

画像の色調補正とか、上から何かを追加で書き込んだりしても残る
といっても激しく加工すると消えるけど

実際的にこれで何か困るかって言うと多分困らない。自分で描きましたドヤァ、の人の嘘がバレるぐらいかなw

736 :名無しさん@お腹いっぱい。:2022/08/28(日) 07:49:31.35 ID:+1zbSHkB.net
へぇー、どうやって確認するんだろう

737 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:01:23.66 ID:uSo+PJF0.net
Midjourneyくんにもその透かし機能ついてて欲しいなあ

738 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:08:51.92 ID:AS2g1m+b.net
フォトショで使えるプラグイン出てるね。この使い方は正直革命的。この場合、電子透かしはどうなるんだろう。
https://twitter.com/wbuchw/status/1563162131024920576?t=7NfnfZFitVEo2wCrrDMlnA&s=19
(deleted an unsolicited ad)

739 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:27:24.74 ID:VSjN8Npn.net
AI生成の画像に著作権がないは間違い
著作権がない画像が生成されればその画像には著作権はないが著作権がある画像が生成されればユーザーがその著作権を認識した時点で著作権侵害となる
例えば「鬼滅の刃の画像」とプロンプトに入力し鬼滅の刃の著作権がある画像が生成されればその時点で侵害
鬼滅の刃を知らないユーザーが「大ヒット漫画の画像」と入力し鬼滅の刃の著作権のある画像が生成され公開し、権利者から指摘されれば指摘された時点で侵害

740 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:30:09.63 ID:fvXQzTIT.net
AI生成画像が、偶然既存の著作権がある画像と同じものを生成した場合、「著作権侵害にならない」
両方に著作権がある状態になる、と弁護士が言ってた

741 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:32:12.00 ID:VpEyRdfH.net
そんなこと言ってたら漫画のファンアートが一切描けなくなる
類似したキャラで大々的に商品展開しなきゃ問題にはならないと思うよ

742 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:32:58.60 ID:VSjN8Npn.net
「AI画像に著作権がない」というのはAI開発者の著作権はないと言う意味
フォトショップでイラストを描いてもadobe社に著作権が発生しないのと同じ

743 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:33:07.05 ID:+1zbSHkB.net
そろそろこっちでお願い

AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

744 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:38:58.73 ID:VSjN8Npn.net
>>740
画像を学習させたAIで学習元に似た画像が生成された場合は偶然とは言えない
既に完了した行為については違法性はないが権利元が「あなたが使用した画像生成AIはこう言う仕組みで我々の著作権を侵害しています」と告知されれば告知された時点から違法となる
ツイッターなどにあげた画像は閲覧が可能な期間ずっと公衆送信権の対象となるので告知を受けた時点で速やかに削除しなければならない
既に頒布済みの紙の同人誌などは回収しなくてよい

745 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:43:29.58 ID:yjgu2GGB.net
>>744
「偶然の場合」って書いてるじゃん
まあ、>>743で話す話題だね

746 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:50:19.91 ID:IYnowAka.net
>>724
画像とその画像に対しての説明文の対応を学習していると、
説明文によく使われる言い回しが効果的とか噂だけれどもトークンに分解されるなら関係無いのかな

747 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:50:58.49 ID:9sIRYw75.net
法律上の著作権の認定は極めて厳しく意図的な丸コピーの継続反復でもないと殆ど認められないから
実際には民間による私刑が横行してて、米国では基本当事者間の訴訟で解決してくれというスタンスでこれを公認
このため法律ではなくyoutubeなどのプラットフォーマーや消費者のお気持ちで権利侵害かどうかは決まってしまう
現状は企業などの強者が違反を申し立てればプラットフォーマーは無条件に公開停止/発禁処分を取っている。法律は無関係

748 :名無しさん@お腹いっぱい。:2022/08/28(日) 08:52:31.96 ID:VSjN8Npn.net
ただSDはアニメ漫画関係はかなり気を使ってるようなので気にする必要はないだろう
「鬼滅の刃の画像」と入れても中華製のパチモンみたいなのが出てくる
これはこれでなんか問題ありそうな気もするが

749 :名無しさん@お腹いっぱい。:2022/08/28(日) 09:16:01.45 ID:utDyz6F5.net
>>739
やっぱり背景だけに使うのが安全だな

750 :名無しさん@お腹いっぱい。:2022/08/28(日) 09:24:29.13 ID:j/CvemEf.net
>>746
トークンに分解されていても、それぞれのトークンが独立して(重みに応じて)作用しているわけではないですね

例えば、girl having glass と gil wearing glassはこうなる
https://i.imgur.com/aDQBOGE.jpg
https://i.imgur.com/qWXjSac.jpg

また、girl having glass, wearing red dress だとこうなる
https://i.imgur.com/v0iDH2L.png

つまり、単純にhave, wearがあるからそれっぽく配置しているわけではなく、英語の分法に沿ってどこにかかっているトークンかを理解していることになる

真面目に勉強するか・・・

751 :名無しさん@お腹いっぱい。:2022/08/28(日) 10:13:09.98 ID:9sIRYw75.net
AIがどんどん進歩していけば未来ではプロンプトの工夫なんてのもなくなって
プロンプト検索サイトで好みの画像探したらseedをちょっと変えたり
単語ちょっと追加してだけでリリースってなると思う

752 :名無しさん@お腹いっぱい。:2022/08/28(日) 10:16:07.70 ID:A/NVkY1w.net
電子透かしはinvisible-watermarkというライブラリを使ってるみたいだ
hlky版やbasujindal版はこの機能が削除されている

753 :名無しさん@お腹いっぱい。:2022/08/28(日) 10:21:00.61 ID:j/CvemEf.net
basujindal >>665みたいに--turboで速くなってこっちがいいのか、と思ったら
GUItardも4GBで動く--optimizedオプションがついてた

動き速いなあ

754 :名無しさん@お腹いっぱい。:2022/08/28(日) 10:36:59.17 ID:CkMkrgMz.net
4GBでもサクサク動くimg2imgのGUI作ってくれたら助かるが流石にまだ難しいかな

755 :名無しさん@お腹いっぱい。:2022/08/28(日) 10:41:03.86 ID:NJZkMsOM.net
冬のボーナスで安い価格帯24Gのグラボ2枚刺し考えたけどうちの1枚しか刺せなかったわ

756 :名無しさん@お腹いっぱい。:2022/08/28(日) 11:00:44.83 ID:j/CvemEf.net
例えば24GBのGPUが2枚あるとして、512x512の画像生成を2つ同時に走らせるのはできるはずだけど、
合計48GBとして使って1920x1080の画像を生成できると書いてる人はいない気がする

できるのかな?

757 :名無しさん@お腹いっぱい。:2022/08/28(日) 11:31:13.06 ID:T3xBxkwV.net
生成時から高解像度を目指すのではなくて
後から高解像度化するのが主流っぽい気がする

hlky版の最新ではRealESRGANタブができててすれば倍のサイズにできるようになってる
(モデルDL必要 https://github.com/hlky/stable-diffusion#realesrgan

758 :名無しさん@お腹いっぱい。:2022/08/28(日) 11:37:25.97 ID:NJZkMsOM.net
>>756
デモンストレーションのはGPU大量に使ってやっているから出来るんじゃないかなあ
デモ用のチューンで配布版は出来ないかもしれないけど

759 :名無しさん@お腹いっぱい。:2022/08/28(日) 11:47:19.26 ID:GaCie3ZH.net
nvidia GPUで24GBより上ってなると、A6000の48GB 70万円弱になっちゃうから
Google Colab Pro+ の51GBメモリ(月額5243円)はめっちゃお得だね

>>757
なるほど
よく分かってないけど、これ4倍、8倍・・・みたいに繰り返し使えたりするのかな?

760 :名無しさん@お腹いっぱい。:2022/08/28(日) 12:09:11.84 ID:fr/le0b0.net
>>751
つか自動で勝手に作ってくれる世界になると思うよ
今でさえ各個人の蓄積されたデータからパーソナライズ化された広告や様々なサービスのオススメが勝手に自動で出てくるように
メタバースとかだとか将来確実にこのサイトみたいな世界が実現するのは明らかに思える
https://ascii.jp/elem/000/004/102/4102731/

761 :名無しさん@お腹いっぱい。:2022/08/28(日) 12:18:26.61 ID:VpEyRdfH.net
サイズでかいから上げないけど風景などはRealESRGANで結構いい感じになるなぁ
壁紙にしてもいいかな、って感じ 肖像画などはものによるね

762 :名無しさん@お腹いっぱい。:2022/08/28(日) 12:23:51.37 ID:T3xBxkwV.net
>>759
512x512を入れてみたら2048x2048が出てきた(4倍の間違いだった)
再度大きいのを入れても2048止まりなので上限はあるみたい

ちなみに最新は長いプロンプトで生成されない不具合がありそうだったので少し古いバージョンまで落とした
https://github.com/hlky/stable-diffusion/tree/554bd068e6f2f6bc55449a67fe017ddd77090f28

763 :名無しさん@お腹いっぱい。:2022/08/28(日) 12:32:27.33 ID:GaCie3ZH.net
>>762
ありがと
試してみようかな
webuiまたUI結構改善されてんのね

アップグレードどうすりゃいいんだw
conda env remove -n ldo して最初からやってほうがいいかな

764 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:15:53.30 ID:E711bQHo.net
>>704
8/28版は何も変えなくても動いたからもう一回元のURLからドライブにコピーしてやれば普通にできると思う

765 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:31:03.08 ID:xrzp3NUk.net
webuiでimg2img使うとエラーでる
TypeError: process_images() missing 2 required positional arguments: 'gobig_strength' and 'gobig_steps'

同じ人いますか?

766 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:40:25.53 ID:T3xBxkwV.net
>>762自己レス
>長いプロンプトで生成されない不具合
出力時の保存パスがちょっと長くなる修正が入ったようで、そこで自分の環境ではWindowsのパスの長さの限界超えたらしかった
C:\直下に移動して無事最新でも動くようになった

>>765
つい数時間前にそのあたりのコード入れたり消したりしてたからバージョン変えれば大丈夫そう

767 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:41:53.27 ID:Qji7WGLS.net
webuiといってもどのバージョンか分からない
とりあえず、このwebuiでimg2imgだと、サンプリングメソッド=DDIMは動くけどそれ以外はエラーになるね。
https://github.com/hlky/stable-diffusion

エラー内容は違うから別のフォークだと思うけど

File "scripts/webui.py", line 1112, in sample
samples_ddim, _ = K.sampling.__dict__[f'sample_{sampler.get_sampler_name()}'](model_wrap_cfg, xi, sigma_sched, extra_args={'cond': conditioning, 'uncond': unconditional_conditioning, 'cond_scale': cfg_scale}, disable=False)
ValueError: not enough values to unpack (expected 2, got 1)

768 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:48:21.08 ID:Qji7WGLS.net
>>767
自己レス。

最新版で解消しました。 1時間前に修正されたぽい

769 :名無しさん@お腹いっぱい。:2022/08/28(日) 13:59:35.34 ID:bWnmVXgB.net
Nendoroid構文色々試してるけどメチャクチャ強力だなこれ
プロンプトの前半に入れた瞬間にデカ顔2等身写真風になる

770 :名無しさん@お腹いっぱい。:2022/08/28(日) 14:24:57.38 ID:mklj/Fkv.net
colabからのセットアップですらエラーになって
自分の知識の無さにゲンナリする

771 :名無しさん@お腹いっぱい。:2022/08/28(日) 14:27:18.09 ID:mklj/Fkv.net
https://i.imgur.com/ogzfy8n.jpg

引数が足りてないとかそんなんかなあ。分からん

772 :名無しさん@お腹いっぱい。:2022/08/28(日) 15:04:03.44 ID:9sIRYw75.net
既に各種ペイントツールのプラグイン対応が進んでいるし
背景や小物はもうAI使って描いていくのが常識になるんだろうね

773 :名無しさん@お腹いっぱい。:2022/08/28(日) 15:52:32.55 ID:jvpUgcGf.net
プロンプトビルダー
https://promptomania.com/stable-diffusion-prompt-builder/

774 :名無しさん@お腹いっぱい。:2022/08/28(日) 16:54:42.22 ID:+1zbSHkB.net
WebUIの

「sort samples by prompt」は使わないことにした
呪文をいろいろ試してるときにフォルダを分けられると逆に手間が増える
生成時にすぐいいの選別するし、次点みたいなのは後から自分でフォルダ分けた方がわかりやすい

「write sample info files」もexplorerで縮小画像一覧が市松模様になって見にくくなる
cfg値やらはだいたい自分ルールがあるし、呪文は別にテキストで残してあるので
seedは連番ファイル名のうち、一番小さい数字のやつってわかるし

つか生成ファイル名の連番ルール間違ってるね、seedが1234567890の時
-0001-1234567890.png
-0002-1234567890.png
-0003-1234567890.png
にすべきなのに
-0001-1234567890.png
-0001-1234567891.png
-0001-1234567892.png
ってなってる、カウンターに用意した0001が無意味

775 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:07:24.22 ID:It+E3STB.net
これからも色んなAIがでるみたいだし、
今のうちにハイスペPCを買っといたほうがいいのかな……
20万で足りる?

776 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:08:27.05 ID:QuNPQemV.net
そういう文句はここじゃなくてissueまでって書いてあるぞ

777 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:08:43.97 ID:Qji7WGLS.net
シード指定で複数生成した場合、シードを1つずつ増やして生成されるんだから合ってると思う

778 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:10:16.13 ID:+1zbSHkB.net
>>777
いや無指定だし、infoのファイルの中見たら全部同じseedになってたよ
pngファイルだけseedが増えて行ってるへんちくりんな状態だった

779 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:11:38.69 ID:QuNPQemV.net
確かにyamlファイルのseedは間違ってる
でもその文句はここで言っても仕方がない

780 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:12:08.11 ID:Qji7WGLS.net
同じシードなら同じ画像になる
無指定ならランダムなので連番でもない

781 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:12:28.33 ID:+1zbSHkB.net
ああ、逆か
yamlファイルの中の加算を忘れてるのか・・seedは+1ずつされてて

782 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:23:12.93 ID:+1zbSHkB.net
a dogを「無指定」+yaml生成で3つつくると
-0001-3671057218_a_dog.png ---- yaml内seed: 3671057218
-0001-3671057219_a_dog.png ---- yaml内seed: 3671057218
-0001-3671057220_a_dog.png ---- yaml内seed: 3671057218
ファイル名のseedが合ってて、yaml内がおかしい

>>780
無指定はランダム起点の連番、よってランダムではない

783 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:25:28.70 ID:Qji7WGLS.net
どちらにせよ連番画像でシードが同じはずと考えるのはおかしい

784 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:25:55.64 ID:+1zbSHkB.net
うん、まぁそれは俺の勘違いだ

785 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:30:01.28 ID:+1zbSHkB.net
MJの記憶が焼き付いてて
同一seedの--s無指定(2500)での変化が頭から離れなかったのだ(言い訳)

786 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:34:01.37 ID:sBwVz76V.net
SDのSeedはMJで言うSameSeedやね

787 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:38:53.11 ID:X7jvA0kV.net
>>775
VRAM10GB越えのグラボを用意するつもりなら、全く持って足りない

788 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:54:31.93 ID:Zg4EoMEl.net
マイニングが落ち着いて
https://akiba-pc.watch.impress.co.jp/docs/wakiba/find/1434896.html
安くなったんじゃなく、バブル価格が元に戻ったくらいのところなんだっけ
4000番で在庫がさらに値下がりして安価に手に入らないかなぁ

GPUの話題はスレ違いって言われそうだけど
ローカルやるには切実すぎる問題だから、技術交換の範疇でいいよね?

789 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:56:33.37 ID:8FnHIO5z.net
現行のAIってGPUに仕事ぶん投げまくるのが基本だから徐々に需要が高まると思うな
短期的にはわからん

790 :名無しさん@お腹いっぱい。:2022/08/28(日) 17:59:43.96 ID:FPRn3NgC.net
>>775
3060(12GB)のPCなら15万円ちょっとで買える
けど、その場合、無料のGoogle Colabと同じ性能でメモリが半分なんだよね

今すぐ買いたい、何かやりたいなら買えばいいと思うけど
この後、どのぐらいの必要スペックのどんなソフトが出てくるかわからないのがね

個人で普通に買えるもの(人によるけど)としては3090Tiで50万円ぐらいのやつかな
10月〜12月頃発売予定の4090も同じぐらいの価格帯で性能が倍になるらしいからこれも悩ましい

その上ってなるとA6000(48GB)の70万円(GPUのみ)
この上はもう1000万円を超える

現時点では50万円ぐらい出して24GBの3090か、予算内の11GB以上の奴か、って感じかな

791 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:02:40.51 ID:Zg4EoMEl.net
マイニング業者が転向してColabもどきみたいなの始めたら面白そう、月額300円で使い放題みたいな
それでも24時間ぶん回し続ける採掘よりは儲からないか

792 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:03:52.13 ID:8FnHIO5z.net
マイニング企業がAI企業にrentalするってのはあるかも

793 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:06:13.13 ID:ZThPhglJ.net
これベータの生成上限(200枚?)いくと
画面右下にyouなんとかで会員情報確認しろって英語で出てくる?

794 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:13:48.91 ID:X7jvA0kV.net
クアドロじゃなくてGTXで買うなら4000番待ちのほうが賢い気がする


ゲーム目的なら3070くらいがあれば十分だしあとは4000がこなれたころに買い換えっててもあるけど
元々求めているところが一般的には最上位でもまだ足りんって感じだし
拘りがないならGoogleに月6000円払ったほうが安上がりだと思うわ

795 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:23:54.68 ID:Zg4EoMEl.net
3080価格推移
https://i.imgur.com/CcqEg3g.png
バブル崩壊と分かってても衝撃的
NVIDIAは4000番出す前に市場の3000系があまりに下落したら在庫回収しちゃいそう
なお、採掘業者産の中古はヘタってるから、保証期間残っててもやめた方がいいって話も

>>793
DreamStudioの話かな?
無料枚数の4割くらい使ったところで放置してるわ、ちょっと肌増えたらすぐ画像ぼかしてくるし
ここでその状態知ってる人いるのかなぁ、むしろあなたが先駆者になって教えてほしい

>>794
googleさんはエッチ画像作ってないかスーツ着たお兄さんたちが眼鏡を光らせて見てそうだし
拘ってないけど、ドキドキするよね

796 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:28:41.28 ID:FQRqw5xU.net
n_iter 枚出した時に
一枚目以降はstepが変わるとシードも変わってるのかな
1枚目しか収束していかないから良い絵が出ても居なくなって困る

797 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:49:31.08 ID:iwlcp4gq.net
全身の絵が欲しい場合full bodyでいいんだろうか
boobs入れると引っ張られてバストアップばっかになる気がする

798 :名無しさん@お腹いっぱい。:2022/08/28(日) 18:59:09.15 ID:T3xBxkwV.net
>>797
生成を縦長画像にすれば全身絵が出やすいという記事があった
https://jtnoske.hateblo.jp/entry/2022/08/27/143640

799 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:06:58.21 ID:iwlcp4gq.net
>>798
いろいろ試してる人が居るんだなあ
試してみます ありがとう

800 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:07:32.68 ID:Zg4EoMEl.net
MJはfull bodyに加えて9:16とかにしつつ
knee socksとか入れたら描かなきゃってなるのか全身になりやすかった
long legsとか入れたらどうかな

SDは正方形でもMJよりは全身出してくれることが多いけど
ガチャするより自分で落書きがにimg2imgで呪文被せるのが一番早い気がする
絵はmspaintレベルのこんなんでいいので
https://assets.st-note.com/img/1661433702833-NJIm9AzgDM.jpg

801 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:14:06.99 ID:bWnmVXgB.net
足に言及すると足を描こうとしてくれるから全身画像になりやすいのは確か
なんだったらfull bodyだって書いてんのにバストショットじゃねえかってなるのより信頼性高い

802 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:27:24.64 ID:9sIRYw75.net
img2imgを使うとこの位の画像なら数分で作れてしまうのが恐ろしい
絵が描ける人ならこれを下敷きに修正する作業なんてあっという間に終わるぞ

803 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:29:26.37 ID:9sIRYw75.net
あ、作った画像はこれな
ベースのプロンプトさえ用意できていればこれが数分はやっぱしゃれにならんわ
https://i.imgur.com/qv23qFT.jpg

804 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:29:30.81 ID:jvpUgcGf.net
念願のセクシーギャルできたぜ
https://i.imgur.com/uxnBJJ8.jpg

805 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:34:07.31 ID:fIDQ2OKU.net
>>803
背景はいいけど、顔も体がクニャクニャすぎて補正がめっちゃ大変な気がする

806 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:42:49.31 ID:jvpUgcGf.net
>>797
512x256みたいに縦長にしてまず全身像であることを説明してから「胸は小さめ」「足は裸足」とか言及してくと成功しやすいと思う。

807 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:47:24.58 ID:blvV9hXM.net
>>805
正直ゼロから描き起こした方がマシ
これじゃ下絵に引きずられてデッサン狂う

808 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:55:16.63 ID:jvpUgcGf.net
「脇の下を見せる」にしても「両手は組んで頭の後ろに」って説明文入れたほうが正確に描写してくれる。

809 :名無しさん@お腹いっぱい。:2022/08/28(日) 19:56:05.33 ID:nq7aQvlX.net
背景としては本当有用だと思う
俺も802みたいな画像生成したいが…無理!
英語わかんねえよ

810 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:03:23.92 ID:ytrXo6jw.net
導入で手こずって3日経つけどまだStableDiffusion導入できません
Windows11のWSLで1から環境構築して使えるようにしている記事とかありせんか?
ある記事ではCUDA入れろとか、ある記事ではCUDAの記述なかったりとかでどれも1から導入しても何かが足りなくて必ず躓いてしまうんです

現状はWSLインストールコマンドでインストールされたubuntuにアナコンダとCUDAを入れてみたんですがStableDiffsionのtext2img描画コマンド?でGPUがCUDA対応してないとかで弾かれて躓いてます(Windows側にNvidiaドライバーは入ってます)
たぶん導入やそれ以前の問題でこうなってるんじゃないかなと思い、1から手順通りに従って完全に動作するマニュアルみたいなものが欲しいんですが
そんな都合のいいものはないですかね?

Linux初心者です

811 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:07:02.34 ID:iUdk2Gjv.net
>>810
WSLでCUDA使う時点でハードモードだけどなんでそんな事してるの?

812 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:07:02.72 ID:QuNPQemV.net
Gregテンプレでも初音ミクって入れるとこんなに日本人っぽい絵になるんだよね
https://i.imgur.com/6WR4Iuk.png

やっぱりバッチの一枚目が一番プロンプトを意識した絵になる確率が高い気がする

813 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:11:50.55 ID:ytrXo6jw.net
>>811
なんの知識もない状態なので……
WSL環境ではUbuntu上(中?)にCUDAインストールしなくてもいいんでしょうか?
Windows側のシステム環境変数にubuntuパスのCUDAがどうも記述されてなかったので有効になってないのかなと
何がどうなってるのか本当に分かってないです

814 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:12:43.38 ID:9sIRYw75.net
エロを出したいときに直接nakedやnudeと指定すると引きずられて一気に絵が崩れる
裸にしたいときは裸でいそうなシチュエーションを間接的に指定したほうがいいな

815 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:13:17.86 ID:Tigam4L6.net
今後のイラストレーターの仕事の主流は
AIの描いた絵の手直しになりそう

816 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:14:01.64 ID:uvkTBquu.net
>>813
CUDA以前にWSLを使う理由がわからない。なんでそんな事してるの?

817 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:15:22.27 ID:bWnmVXgB.net
どのガイドを見ればWSLを入れだすことになるんだろうか
イキって独自導入記事書いてる変な人のヤツでも見たのか?

818 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:16:24.58 ID:QuNPQemV.net
>>814
nudist naturalist pornstarあたり…

819 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:17:30.56 ID:ytrXo6jw.net
>>816
Windows11環境だとコマンド一つで仮想linux環境が出来て簡単という話を見たからです
それとWindows標準の機能というのが個人的に安心できる点だったのもあります

皆さんはどういう環境で動かされてるんですか?

820 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:17:57.23 ID:QuNPQemV.net
WSLはオーバーヘッドあるからやめたほうがいいぞ
どう考えてもやる必要がない

821 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:19:01.62 ID:QuNPQemV.net
>>819
>Starter guides:
https://rentry.org/GUItard - current guide
https://rentry.org/tqizb - AMD guide
https://boards.4channel.org/g/thread/88330842#p88330842

822 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:19:32.20 ID:pIGMxA07.net
釣りキチ三平の矢口高雄が背景上手いと評判だからMDで海を描かせたら上手かった

823 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:20:13.45 ID:sBwVz76V.net
人体が微妙に崩れてるのは明らかなんだから
上から3Dモデルに同じようなポーズ取らせてから手直しするなりすりゃいいんじゃない

>>814
nudeでも、上手いというか写実的なイラストを描く人、具体的にはgreg師匠あたりに描かせると
実はこっそり描いてませんでした?ってくらい整ってる率が高い
なので崩壊要因が他のPromptなパターンもあるからセパレータでいろいろ試したほうがいいね

824 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:22:24.82 ID:ytrXo6jw.net
>>820
>>821
ありがとうございます
ちょっと色々見直してみます

825 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:25:28.09 ID:Pft0DBuS.net
初期?のAIの出した崩れた女体でしか性的興奮を覚えなくなったなんとかフィリアみたいな人もどこかに生まれているかもしれない…

826 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:28:18.65 ID:uvkTBquu.net
>>819
今(2022/8/28 20:00時点)の主流はこれかな

前提:モデル(sd-v1-4.ckpt)はダウンロード済み

https://github.com/hlky/stable-diffusion/wiki/Installation

1 git clone https://github.com/hlky/stable-diffusion.git
2 モデルをmodels\ldm\stable-diffusion-v1\ にmodel.ckpとリネームしておく
3 minicondaをインストールする
 https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
4 webui.cmd を実行する
5 Launch Waifu Diffusion で起動する → http://localhost:7860/ とかURLがでてくるのでブラウザでそのURLを開く

●以下はオプション
1. Download the GFPGAN pre-trained model
https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth
place it in /src/gfpgan/experiments/pretrained_models/

2. Download RealESRGAN_x4plus.pth and RealESRGAN_x4plus_anime_6B.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth
place them in /src/realesrgan/experiments/pretrained_models

827 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:28:19.74 ID:FQRqw5xU.net
グラビア的なセクシーポーズにしたかったら pin up girl とかいいよ
イラスト多めぽいから色がケバくなりがちだけども
on the bed とか on the couch みたいに状況設定すると
それなりなポーズをとってくれる

828 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:28:44.46 ID:C/1fkrEL.net
img2imgのあるgoogle colabとかありますか?

829 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:31:47.55 ID:uvkTBquu.net
>>821 のGUItardの手順は昨日までは良かったけど、今時点では古いと思う。
・webuiを別途ダウンロードする手順だけどマージされてる(最新ではないけど)
・webui.cmdは設定だけで起動しなくなってる。 Launch Waifu Diffusion で起動
・ldoのリネームもwebui.cmdでいい感じにしてくれるので不要になっている

勘違い、間違いがあったらごめん

830 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:34:44.50 ID:IhsqNdNl.net
今はローカル用のpc無くてStableDiffusionをGoogleColabで利用してるんだけど、近いうちにStableDiffusionが規制される可能性ってありますかね?

Colabで耐えててpcを揃えた頃にローカル版含めてStableDiffusionはインストール出来ませんになってたらって思うと不安しかない…
それともオープンソースだからそんな心配はないのですかね…?

831 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:35:07.40 ID:u/IBBuD1.net
エロい絵の加筆みたいなことをやってもらいたかったんだが、まだまだ現代の技術では無理だったようですね・・・
絵師が上半身しか描いてないから下半身もAIに描いてもらおうって思っただけなのに・・・
肝心な部分が文字で見えなくなってるから文字だけでも消してくれないかなとかね・・・

832 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:36:07.05 ID:VpEyRdfH.net
greg師匠でも初音ミクってワードを入れると激しく崩れるので
名前を入れないで工夫してミクを描かせてみた
https://i.imgur.com/wovW4x6.png

これくらいがいいところか

833 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:36:55.00 ID:QuNPQemV.net
>>829
随時更新されてるよ
まぁ基本はここ見ればいいんだけど
https://github.com/hlky/stable-diffusion/wiki/Installation

834 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:37:52.88 ID:sBwVz76V.net
>>830
規制解除版がgithubから消される可能性はあるけど、解除方法なんかはネットで語り継がれるんじゃないか
てか今使えなくてもとりあえずファイル一式落としておけばいいよ

835 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:43:20.99 ID:3C/JWEjb.net
粛々とAIに描かせた美少女画像を貼ってだべれる匿名掲示板的な居場所が欲しいんだがどこか無いものか
TwitterはBANやらなんやらでこういうのは向いてない
ここはなんか技術の話という感じで違いそうだが他に流速のありそうな板も見当たらず
みんなどこに居るんだ

836 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:44:03.87 ID:QuNPQemV.net
4chanの/h/とかに行きなされ

837 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:44:52.53 ID:IhsqNdNl.net
>>0833
あれ、StableDiffusionってコードを打ち込んでネットからインストールしてく手順でローカルに入れるものだと思ってました。

ファイル一式を落とせるとこってありましたか?

838 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:54:44.42 ID:pqJVfBkN.net
>>830
現状、deep fakeの実行がColabのBAN対象になってるから
少なくとも制限解除版が実行不可になる可能性は十分あり得ると思う

839 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:55:56.63 ID:sBwVz76V.net
>>837

モデル(画像を生成するための元情報みたいなの)は https://rentry.org/GUItardのStep1で落として
あとはhttps://github.com/hlky/stable-diffusion のリポジトリをローカルに持っておけばいいと思う

840 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:56:12.06 ID:3C/JWEjb.net
>>836
できれば日本語で…でもありがとう
久々に楽しいお祭り騒ぎだと思ったが時代だなあ
国内の匿名インターネット空間が壊滅していることに気づいてしまった

841 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:57:50.42 ID:QuNPQemV.net
>>840
ふたばはどう?

842 :名無しさん@お腹いっぱい。:2022/08/28(日) 20:57:53.64 ID:QKH/kr3+.net
>>833
そうですね。あくまで今時点はあってないってことで


>>837
一旦インストールしておけばオフラインで使えるよ

zipで固めて他の環境にも持っていける
minicondaのインストールは必要だけど

843 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:00:15.12 ID:jvpUgcGf.net
>>827
なるほどあたまいい

844 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:00:15.84 ID:QuNPQemV.net
GPT-3プロンプトジェネレータだって
https://colab.research.google.com/github/Skquark/structured-prompt-generator/blob/main/Enhanced_Stable_Diffusion_with_diffusers.ipynb#scrollTo=rCANdl958ikY

845 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:00:43.34 ID:QKH/kr3+.net
>>835
画像の公開はDiscordやTwitterが多いんじゃないかな。確かに匿名の場所は活発じゃないかも
ここも作品・プロンプトスレと分離してもいいかもね

846 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:02:46.31 ID:QuNPQemV.net
やっぱり()使えるらしい
https://i.4cdn.org/g/1661686659698431.jpg
https://boards.4channel.org/g/thread/88330889#p88333628

847 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:04:06.18 ID:bWnmVXgB.net


848 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:12:52.10 ID:IhsqNdNl.net
>>839
モデルの落とし方は分かりましたがリポジトリがよく分かりません…。
そのリポジトリは二番目のurlのどこにありますか?
プログラム用語情弱で申し訳ないです…

849 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:13:46.29 ID:zmiqUmaN.net
>>814
賢い
あとは文字では画風の指定だけして、img2imgで肌色であることをAIに理解してもらうとかうやな

850 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:15:31.47 ID:ubryl2ee.net
>>835
日本版discodeつくってみて

851 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:15:44.37 ID:QKH/kr3+.net
>>848
>>826の1番目の手順

git入ってなければgitもインストールする必要がある
(とりあえずzipダウンロードもできるけど後々gitはインストールしておいた方がいい)

852 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:16:15.65 ID:zmiqUmaN.net
>>832
食べ合わせが悪いものを混ぜると作画が大崩壊するね

俺もいい感じのリアルタッチ人物画を出せる呪文にたどり着いたけど
もう少しおっとりした目にしたいなって思って橋本環奈先生を混ぜたらその瞬間世界が崩壊したw

853 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:17:30.35 ID:BkACrwDk.net
拡散モデルってAVのモザイク消しを超大規模にやるみたいなもんって思っていい?

854 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:19:25.51 ID:ubryl2ee.net
>>848
https://github.com/CompVis/stable-diffusion
緑のコードおしてダウンロードzipでおk
つかうときはユーザーフォルダの直下におく

855 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:21:29.01 ID:sBwVz76V.net
>>848
すまん確かに
https://i.imgur.com/uGM2qPY.gif
緑色で[Code]となってる所クリックするとメニューが開く→ Download ZIP で保管
とりあえず練習兼ねてインストールしてみたら?

856 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:28:09.53 ID:IhsqNdNl.net
>>851
>>854
ありがとうございました!
これでローカル版用のパソコンに備えることができそうです!

857 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:29:44.33 ID:ytrXo6jw.net
>>826
レスが遅くなってすみません
詳細に書いていただきありがとうございます、参考にします!

858 :名無しさん@お腹いっぱい。:2022/08/28(日) 21:57:16.35 ID:ubryl2ee.net
AI画像にやっきになっている人の男女比が知りたい
あとSD発表されてからのgoogle colaboの使用率の変化

859 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:13:36.12 ID:1Gnup+rr.net
けっこう公式が中身の解説を出してくれているのが遊びがいあるなこれ
Pythonの勉強兼ねて遊んでるけど変に盛り上がると大手が買収飼い殺しが多いからマイナー文化でいて欲しいわ

860 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:17:51.61 ID:sBwVz76V.net
今更DALLの招待が来たけど、Stableまわりの勢いと進化が凄すぎて全然ワクワクしないな

861 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:18:23.42 ID:i7ddHUUW.net
これから100社単位で提携して各国語対応その他モデル構築する予定らしい
基盤モデルなんてこれからのど真ん中の技術だから、SDが主流かほかが巻き返すか知らないけどマイナーな訳はないと思う

862 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:19:52.72 ID:i7ddHUUW.net
Dalle、技術的には同じようなもんなんだろうけど、SDはオープンソースでみんなUI改造したりローカルで動かせるから勢いがいいよね

863 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:21:56.59 ID:60RqM723.net
初音ミク抜きミクさん試してみたけど、何回やってもくそでかツインテ描いてくれませんわ
つーかどっとうpって貼れないのね 2862938

864 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:23:10.65 ID:bWnmVXgB.net
DALL-Eはプロンプトに強制的に黒人を出現させるノイズが混入されたりするので使い物にならない

865 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:23:40.93 ID:QuNPQemV.net
大きめ画像はどっとうpをarchive.todayに通せば貼れる

866 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:29:37.43 ID:TiJAxvVE.net
AI君テクスチャとか繰り返しパターン弱すぎんか?
単調な模様がほしいんじゃ〜〜

867 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:36:46.00 ID:Pft0DBuS.net
もっとAIくんと精神を通じ合わせていけ

868 :名無しさん@お腹いっぱい。:2022/08/28(日) 22:41:27.89 ID:CxPKhoNE.net
img2img使えそうなcolab漁ってるけど全部setupが上手くいかねぇ
多分俺のやり方が悪いんだろうけど
なんかウェブサイト上とかで簡単に出来るの待つしかねーか

869 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:07:06.62 ID:7FoCDxFr.net
>>863
> つーかどっとうpって貼れないのね 2862938
今時どっとうpて・・削除する予定がないのなら普通にimgur使いなはれ

870 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:15:57.08 ID:uSo+PJF0.net
Midjourneyで女体がサランラップにぐるぐる巻きにされてテカテカしてる画像ばっかり生成してる人見つけちゃった……
あれも性癖なのだろうか

871 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:27:42.58 ID:bWnmVXgB.net
そら性癖よ
4chanだとアーマードコア風ロボットメイドさん量産してる人居たし

872 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:28:39.34 ID:i7ddHUUW.net
>>866
単調な模様ならプロシージャルテクスチャで作ったほうがいい気がする
文字生成とかもできないし、その辺使い分けはどうしてもいると思う

873 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:32:58.59 ID:8FnHIO5z.net
https://note.com/fururu3d/n/n951dd56da65c
シームレステクスチャはこれがいい

874 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:38:02.65 ID:i7ddHUUW.net
>>873
>>342で既出で、それが単調な模様作りにくいって話だと思う

875 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:39:08.54 ID:HiS2u78j.net
自分で固有名詞を追加学習させられたらいいのに。どのぐらい計算コストかかるもんなんだろ

876 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:40:35.25 ID:6+18B8jR.net
google colabで「GPU使えませんよ」が解除されるのは時間経過ですか? それとも時刻到達でしょうか

877 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:48:10.16 ID:CkMkrgMz.net
クソ遅グラボだしほぼ毎日のアップデートに対応するのもしんどいからローカル環境は見送ってるけど
今は色んな人が改造版を作ってるぽくて、どれがどう優れてるとか一番良いとか全然わからんなぁ…

878 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:48:50.75 ID:i7ddHUUW.net
>>875
追加学習は数枚~でもいけるらしい。Google Colabで3時間程度だとか。
※リンクが貼れないので検索ワード: Stable Diffusionをいらすとやでファインチューニングする

上の日本語のものはいらすとやを学習させてるけど、元ネタの方が自分のペットを学習させて登場させてるので
多分固有名詞を追加できそう
dreambooth.github.io/

試してないから多分こんな感じ?レベルのボンヤリ理解(間違ってるかも)

879 :名無しさん@お腹いっぱい。:2022/08/28(日) 23:58:45.89 ID:T3xBxkwV.net
ミクさんチャレンジ
"portrait of anime girl, ((turquoise colored twintail)), digital cg art by Greg Rutkowski"
https://i.imgur.com/mcRMLsT.png

880 :名無しさん@お腹いっぱい。:2022/08/29(月) 00:02:30.43 ID:S01XYd9t.net
test

881 :名無しさん@お腹いっぱい。:2022/08/29(月) 00:05:11.89 ID:8pofGjN6.net
>>879
これは完成度高い
Greg Rutkowskiすごいなw

いくつかランダムシードでやってみたけどどれも綺麗に出力された。いい呪文だ

882 :名無しさん@お腹いっぱい。:2022/08/29(月) 00:11:34.64 ID:adcon1OP.net
>>879
左上すげえ

先頭に主語入れるだけでそこそこの絵を出せるテンプレをひたすら回すだけになってしまった
もう自動でやってほしい

883 :名無しさん@お腹いっぱい。:2022/08/29(月) 00:16:34.97 ID:LcgOCUAl.net
>>879
右下好き

884 :名無しさん@お腹いっぱい。:2022/08/29(月) 00:58:48.57 ID:W3qecD7T.net
脱がせるとみんな胸がでかいんだけど、小さくするワードってある?slenderとか入れてもバインバイン。

885 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:01:39.89 ID:LcgOCUAl.net
>>884
slimとか低年齢に設定して身長を高くする。

886 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:05:09.27 ID:3oD6d6E1.net
>>884
”爆乳”が使えるから"貧乳"も行けるんじゃないか?試してないから知らんけど

887 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:06:32.58 ID:TKZ5Ug6s.net
>>879
色々やって気が付いたんだけど、意外と短文の方が強いんだよね

呪文は長ければ長い方がいいです的な説明が導入マニュアルに書いてあった気がするんだけど
意外と混ざることで良い要素が打ち消し合う力が強い

888 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:08:06.63 ID:adcon1OP.net
長いと身体とかぐちゃぐちゃになる

889 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:12:40.24 ID:/NRNxVuL.net
>>884
teenager

890 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:19:25.23 ID:/NRNxVuL.net
>>879
普通にこんなの出てきたんだけど・・ロリ天国か
https://i.imgur.com/EZlL8je.png

891 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:36:19.74 ID:7WlnsW/w.net
>>885-886
>>889
それぞれ最初の方に入れて試してみたけど、やっぱりどうにもバインバインですね……

892 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:39:49.16 ID:hJAn0cka.net
>>887
多分最初触ったときは自分が出したい画を端的に一文書いて終わりにする奴が多いだろうから
そういう奴へのメッセージなんじゃないかな
効きもしない言葉を数個並べてもそれこそどうしようもないものが生まれるだけだし

>>891
flat chestとでも入れたらどうよ

893 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:44:15.75 ID:adcon1OP.net
>>879
https://i.4cdn.org/g/1661704624784564.jpg
https://boards.4channel.org/g/thread/88335497#p88337179

894 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:51:11.88 ID:XY/qzhrx.net
>>893
一個一個見ていったら三回ぐらい出てくる奴が何人かいて、よくわからんが笑ってしまった

895 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:55:07.21 ID:TKZ5Ug6s.net
>>892
確かに
経験不足の間は、AIに対する説明不足もしくは説明不備のミスが多いやろうしな

多少理解が進んでくると、説明呪文の過剰の害が分かってくると

896 :名無しさん@お腹いっぱい。:2022/08/29(月) 01:55:43.29 ID:8pofGjN6.net
>>893
いいね
digital concept art of anime cute girl in summer dress, detailed eyes, gorgeous face, ((turquoise colored twintail)), smooth details, digital cg art by Greg Rutkowski
k_euler_a, cfg 10, steps 50, seed 721628136

4枚一組で、左端はオリジナル(同じのが3段ある) Original image on the left.

1段目 turquoise -> green -> red  色違い
2段目 twintail -> ponytail -> bun 髪型違い
3段目 summer -> cocktail -> maid 夏ドレス、カクテルドレス、メイドドレス

897 :名無しさん@お腹いっぱい。:2022/08/29(月) 03:35:24.59 ID:KUnhJn5S.net
考えてみると、AIという箱に文字列を打ち込むと絵を出力し、逆に絵をAIという箱に打ち込むと文字列を出力する、というのは、人間の知性の本質を突いてるよな

つまり対象を個別の要素に分解して、それを文字列なりイメージなりで認識するという抽象化能力が人間の認識的知性の本質
絵や文章というのはその個別の要素の組み合わせだということ

統合失調症患者がデティールが奇妙に歪んだ絵を書くのは、彼らが認識的知性において重要な統語能力=抽象化能力を脳機能の障害によって失っているからだろう

また同様に「言葉のサラダ」と言われる全体の繋がりを欠いた意味不明な文字列を口走ったり、他人の思考が流れてくると糖質患者が訴えるのも、同様に抽象化能力に障害があって、適切な言語化やイメージ化ができないからだとおもう

AIに例えるならば、アルゴリズムに奇妙な歪みがあって、APIを通して物体を絵や文字に変換しようとしても、適切に変換できないのが糖質患者なのかもしれない

だらだらと書いたけど、つまり何がいいたいかというとAIすげえな、ということ

898 :名無しさん@お腹いっぱい。:2022/08/29(月) 04:51:18.14 ID:3oD6d6E1.net
もしかしてと思って試したけど5本指の手できなすぎワロタ
苦手ってそういう事じゃないんだよAIちゃん
https://i.imgur.com/pltGnjj.jpg

close up of anime girl hand, ((Five fingers)), digital cg art by Greg Rutkowski
Steps: 20, Sampler: k_euler_a, CFG scale: 7.5, Seed: 1842527531

899 :名無しさん@お腹いっぱい。:2022/08/29(月) 05:49:23.89 ID:Rnvw2yrz.net
手ほんと苦手だなしかもグロくなりやすい
義手連想させる単語入れたらすごいことになった

900 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:07:56.07 ID:l6B+4duJ.net
>>898
迫真の ((Five fingers))にワロタ

901 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:30:08.96 ID:geDQJvVZ.net
手の学習データとか作られるんだろうな

902 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:33:51.32 ID:8pofGjN6.net
あんまり分かってないけど、画像を学習する時に、例えばこれは

https://i.imgur.com/RZr0oGw.jpg
「白と黒のぶち猫が座ってこっちを見ている」で、「顔が一つ、目が2つ、前足が2本の猫」とはならず、「指が5本」とか効かないのではって気もする

903 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:44:07.66 ID:eVfmuvS0.net
そろそろ3DCG版出て欲しいな
予定とかあんのかな?

904 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:49:18.46 ID:z+sZQrGZ.net
条件わからないけど生ゴミとか生首?画像出力されてビビることある

905 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:51:33.64 ID:3oD6d6E1.net
>>902
両手の画像も込みで「なんか肌色の細いやつが数本」みたいな認識されてたらお手上げだなw
じゃんけんをしている、とか効くんかな

あとCFGテストしたから置いとくわ
https://i.imgur.com/c2VknDZ.jpg

906 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:52:29.70 ID:8pofGjN6.net
>>43の「今後」のところに書いてるレベルなので、具体的には描いてないけど、3Dも予定あり、ですね

それはそうと今Google Colab混雑でGPU接続できないわ。まいった

907 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:56:30.09 ID:vsksoONt.net
普段使わないと思ってた人達までgpu使い始めたらgoogle悲鳴あげそう
いきなり規約改定が入る事を覚悟してゲーミングPCの準備をしておこう

908 :名無しさん@お腹いっぱい。:2022/08/29(月) 06:56:56.50 ID:8pofGjN6.net
GUItardというか、https://github.com/hlky/stable-diffusionと同等のノートブックが公開されてる

https://colab.research.google.com/drive/1cd35l21ewU0fwWEnPjY_th5YORmMfZCd

ノートブックのUIじゃなくて、WEBサーバーを立ち上げるので、ローカルと全く同じUIになる
*現在バグで、PROGRESSBARSにチェックを入れないと起動できない
*モデルは事前にダウンロードして自分のGoogleドライブに入れる前提

構築にかなり時間がかかるのが欠点だけど、使い勝手的にはこれが一番いいはず。構築も上から順に実行するだけでシンプル。

・・・のはずだけどGPU接続できないから確認できないw

909 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:00:26.43 ID:3oD6d6E1.net
rock, paper, scissors game ちょっと期待できそうなのワロタ
あとなんか可愛くなってる気がするわ
https://i.imgur.com/TuRO5aC.jpg

910 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:04:24.96 ID:E2pAsSUt.net
ファインチューニングやばくね?特定の作家の作風パクリ放題でしょ

911 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:04:56.47 ID:tcfKhZjr.net
3 animals って入れるとすごいキメラが出てくるぞ
普通にキモいので閲覧注意

912 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:06:07.21 ID:3oD6d6E1.net
「じゃーんけん」
https://i.imgur.com/BjwtVDi.png

「ぽん!」
https://i.imgur.com/KssH04X.png

「😠」
https://i.imgur.com/2wSXRyO.png

>>910
あれそういう意図で使うやつが増えたら大問題になると思うわ

913 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:18:40.85 ID:E2pAsSUt.net
ファインチューニングしたモデルは簡単に配布できるから
そのうち各作家や作品毎のモデルもアングラで配布されるようになるんだろうな
予想より進化の速度やばいわマジでパンドラの箱が開いた

914 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:28:13.29 ID:y65qW5Ek.net
>>876
>672に「12時間だっけ」とはあるが確証なし

915 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:35:16.33 ID:6+Vx5IWt.net
animeって単語は入れたらだめだと思ったがGreg先生と組み合わせると割と綺麗に出るんだな

916 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:36:28.89 ID:y65qW5Ek.net
いい解説ページがあった
GPUにいつ制限がかかるかや回復する条件は非公開とのこと

Google Colabの制限と対策|npaka
https://note.com/npaka/n/n1aa6f8c973d0

917 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:36:42.48 ID:8pofGjN6.net
あんまり分かってないけどファインチューニングって、例えばだけど「tanaka mamimi」の画像を数枚追加学習させると、
waterpaint, tanaka mamimi みたいな生成ができる、「reiji matsumoto」を学習させると、authored by reiji matsumotoが
できるになる、みたいなことかな?

既に、hlkyにtextual inversionとしてコードある。これもわからないけど、学習自体はhttps://github.com/rinongal/textual_inversion でやって
他でやると書いててできたembedding.ptを hlky版で使えるようにするみたいな機能なのかな?
https://github.com/hlky/sd-enable-textual-inversion


後別の話でhlkyはDocker関連ファイルも8時間前に用意された。
hlky勢いすごい

918 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:47:52.45 ID:06X0KUe/.net
ぶっちゃけ全く触ってこなかった分野なのでこれから色々学習していかないとなんだけど、スクリプト言語はPythonを勉強すればいいのかな?

ネットで他人が書いてるノートをコピーして実行は出来ても、自分でこういうことを追加したい、と思ってもうまくいかなくて

919 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:49:18.75 ID:3oD6d6E1.net
>>917
大体そうっぽい
SDが学習できてない要素をピンポイントで補う自作モデル みたいな
ちょっとやったくらいじゃ要素の一部を学習する程度だから今すぐどうこうってもんでもないと思うけど

920 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:51:04.37 ID:8pofGjN6.net
Emadさんのツイート
100MBってモデル(ckpt)がってこと???? 使用メモリはどうなんだろう

---
@EMostaque
#StableDiffusionは最終的に100メガバイトになり、最適化が進むと信じています。
今週は楽しい発表があります??。
あと6日...

For what it’s worth I believe #StableDiffusion will eventually get down to 100 megabytes, loads of optimisation to come.
We have some fun announcements this week coming ??
Already amazing to see what everyone is creating, we are going to accelerate that.

6 days in…

921 :名無しさん@お腹いっぱい。:2022/08/29(月) 07:56:31.39 ID:8pofGjN6.net
>>918
言語はPythonだね
「やりたいこと」がなにかで、追加で色々勉強しないとだめだったりすると思うけどまずはPythonはいる

922 :名無しさん@お腹いっぱい。:2022/08/29(月) 08:10:31.68 ID:06X0KUe/.net
>>921
ありがとう
解説書探してみるよ

923 :名無しさん@お腹いっぱい。:2022/08/29(月) 08:11:56.51 ID:1ZR01qcj.net
>>917
新しい機能を取り入れるスピードが速いから
hlky版に参加する開発者も増えてるね

924 :名無しさん@お腹いっぱい。:2022/08/29(月) 08:14:30.77 ID:ayWOlSNk.net
hlky版の完成度と更新頻度高すぎてPython知ってても手を入れる余地なかった

925 :名無しさん@お腹いっぱい。:2022/08/29(月) 08:16:01.28 ID:yKP5vfCN.net
ちょうどEmad氏が手足の問題に今週末あたり何かしら答えを出すみたいなこと言ってるな。

926 :名無しさん@お腹いっぱい。:2022/08/29(月) 08:24:34.59 ID:E2pAsSUt.net
img2imgは少し複雑な構図や服装になるとAIが全然理解できなくて
滅茶苦茶な絵を出力してくるからまだまだ限界があるのは感じるな

927 :名無しさん@お腹いっぱい。:2022/08/29(月) 09:55:00.70 ID:8ac36usK.net
これは久しぶりに伽藍とバザールの対比が炸裂したソリューションだな
象牙の塔で研究されてたものがOSSにされた途端ものすごい勢いで進化していく

928 :名無しさん@お腹いっぱい。:2022/08/29(月) 09:55:37.93 ID:q6r8reZ9.net
>>906
3Dの予定あんのね
サンクス

929 :名無しさん@お腹いっぱい。:2022/08/29(月) 10:17:25.44 ID:rT/h5pqx.net
https://zenn.dev/hidetoshi/articles/20220731_pytorch-m1-macbook-gpu
MacBook Pro M1 Max のディープラーニング性能
※StableDiffusionじゃないけど同じPytorchの性能

CPU: 訓練時間 2148秒 テスト時間 90秒
GPU(MPS) 訓練時間 286秒 テスト時間 45秒 → 訓練4.6倍、テスト時間2倍高速化

Geforce 1080Ti:
訓練時間 55秒 テスト時間 1.3秒 → M1 Maxより訓練5倍、テスト35倍高速

2世代前、もうすぐ3世代目になる1080Tiよりも、M1 Maxは桁違いに遅い。意外だった

930 :名無しさん@お腹いっぱい。:2022/08/29(月) 10:36:40.74 ID:UjoEPA0c.net
むしろノートなのに凄い性能だな

931 :名無しさん@お腹いっぱい。:2022/08/29(月) 10:51:02.05 ID:ChjOoZFX.net
ディスクリートGeForce搭載ノートと言うのもある

932 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:05:42.71 ID:uO71QwtQ.net
>>929
コスパ段違いやな
MAX搭載Macとか糞高いし

933 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:06:58.12 ID:Vg2SYCKd.net
>>920
ckptが100mbになるらしい
iPhoneで動くようになるんだと
ヤバすぎワロタ

934 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:07:14.14 ID:Vg2SYCKd.net
https://i.imgur.com/gmrX0Hb.jpg

935 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:07:18.19 ID:uO71QwtQ.net
自作詳しくないから知らんけど1080TiのPCとか下手したらディスプレイ込みで10万以内で作れるんちゃうの?

936 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:08:12.74 ID:E2pAsSUt.net
>>933
キッズに悪用されまくるのが目に見えてるわw
今はまだ最低限のリテラシーある層しか利用できないから大きな問題になってないけどさ
これから一般層に降りてくるとやばいよな

937 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:16:54.10 ID:0tWLLoMd.net
イラストサイトにAIイラスト爆撃までカウントダウン始まったな

938 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:20:05.54 ID:6+Vx5IWt.net
確かに1080tiってそんなに高額でもないな
メモリが多ければいいって話だし まあ今後最適化でまた違ってくるんだろうけど

939 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:33:05.29 ID:hJAn0cka.net
RTXからTensorコアが乗ってPytorchが加速されてるから
RTX2060でも1080Tiのさらに倍の推論性能
今コスパで行くなら2060 12GBがいい感じ

とはいえモデルの精度変更や刈り取りや圧縮が進んでいるので
今のVRAMこそ正義な状況がいつまで続くかという話だけれども

940 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:42:43.27 ID:E2pAsSUt.net
内部の計算速度に比べてメモリの入出力は極端に遅いから
今後もVRAM容量の節約と速度はずっとトレードオフの関係だろうけどね
出来るだけメモリに詰め込んで読み書き減らすのが正義なのは変わらない

941 :名無しさん@お腹いっぱい。:2022/08/29(月) 11:49:26.25 ID:n8fO39XV.net
早く1024や2048サイズがメモリ4GBくらいの古代グラボでも数秒で出力出来る時代になりますように…

942 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:09:02.17 ID:TrEphkRn.net
>>929
M1はニューラルエンジン積んでるけどそれに最適化したらまた変わってくるんじゃない?しらんけど
ゆうて単体GPUはやっぱ強いよな
今はmacだけど結局ゲーム用にWinも併用してるわ

943 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:09:16.82 ID:E2pAsSUt.net
拡散モデルがアニメ絵やデフォルメ絵が苦手なのは確かだけど
それでもサンプルが豊富なドラゴンボールやポケモンはある程度学習出来ているから
萌え系が上手くいかないのはサンプル不足の影響もかなりありそう
AIは抽象的な男とか女とかは学習できなくて○○さんの描く女の子やドラゴンボールの孫悟空みたいに
具体的に指定しないと駄目だから萌え系は作品のサンプル数が圧倒的に足りていないんじゃない?

944 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:22:58.54 ID:V8VqUSTe.net
>>896
このプロントしゅごいンゴ
https://i.imgur.com/0CipYrA.png

945 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:24:12.69 ID:0tWLLoMd.net
ドラゴンボールやポケモンは比較的画風が統一されてるけど、美少女イラストは人によって目鼻口のバランスが違う上に下手なのも混ざってるからな

946 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:29:23.97 ID:nqEfck//.net
ロボポン乳を許容する人もいれば許せない人もいるからそこら辺のバランスは顔に限らず難しい問題

947 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:30:31.19 ID:JuMoaf+y.net
適当に要素足してもRutkowskiがなんとかしてくれる安心感がある

948 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:33:32.34 ID:KdHuREsK.net
>>937
AIの描いた絵をAIが学習して
どんどん奇形化していきそう

949 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:34:42.55 ID:hJAn0cka.net
Rutkowski居なかったらStableDiffusionの評判が一段下がってるまである
Rutkowskiに足向けて寝られないわ

950 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:38:42.40 ID:Fb4Mj0XF.net
hlky版をVRAM4GBで動かせた
省メモリ版basujindalのturbo設定も実装されたから高速実行できる

方法は >>826 に加えて
scripts\relauncher.py をテキストエディタで開いてこのように追記する

python scripts/webui.py

python scripts/webui.py --optimized-turbo

951 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:44:06.07 ID:adcon1OP.net
image2image
https://huggingface.co/spaces/huggingface/diffuse-the-rest

952 :名無しさん@お腹いっぱい。:2022/08/29(月) 12:45:36.35 ID:adcon1OP.net
>>943
> ポケモンはある程度学習出来ている
いや俺の経験じゃポケモンダメダメなんだけどどうやってる?

953 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:02:21.75 ID:E2pAsSUt.net
顔は難しいけど、背景とか肌の色味のコツとかは多少分かって来た気がする
やっぱ研究が進んだら人間の絵描きは殆どいらなくなりそう
https://i.imgur.com/pGsQWL3.jpg

954 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:17:12.16 ID:adcon1OP.net
ピカチュウでさえこんな感じなのにポケモンが得意とか何を指して言っているのかわからない
https://i.4cdn.org/g/1661746212498693.jpg
https://boards.4channel.org/g/thread/88341759#p88344770

955 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:24:19.46 ID:S01XYd9t.net
>>953
巣に帰れ

CGの未来スレ
https://mevius.5ch.net/test/read.cgi/cg/1659706163

956 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:31:45.42 ID:E2pAsSUt.net
技術交換スレで何の情報も出さずにひたすら他人のアンチしてるキ〇ガイ君大丈夫か?

957 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:33:35.24 ID:hJAn0cka.net
悪いが勝手な妄想と間違った情報書き散らす奴よりはマシだと思うぞ

958 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:41:28.60 ID:jsuy+oYz.net
>>953
なぜか垂れ乳の知的障碍者みたいになるね

959 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:46:41.40 ID:FMdA7274.net
アニメっぽいの作るのに
この人のnoteめっちゃ参考になったからよかったらぜひ

https://note.com/6uclz1/n/nbc3d87d3e5b1

960 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:49:28.10 ID:S01XYd9t.net
>>956
>>1ちゃんと読め

961 :名無しさん@お腹いっぱい。:2022/08/29(月) 13:59:38.64 ID:5OZs72P+.net
ミイラ取りがミイラ
自治厨が荒らし

962 :名無しさん@お腹いっぱい。:2022/08/29(月) 14:05:45.27 ID:nqEfck//.net
コスプレねーちゃん書かせたいのにアニメ要素入れたら目が大きくなるのどうにかならないかマン

963 :名無しさん@お腹いっぱい。:2022/08/29(月) 14:12:03.14 ID:8X7deHaR.net
>>951
設定弄れないし、PCだと秒で終わる処理に数分かかるけど、スマホでも動くのはいいね。

>>959
ここはものすごく参考になりそうだ、ありがとう。

964 :名無しさん@お腹いっぱい。:2022/08/29(月) 14:15:16.55 ID:l6B+4duJ.net
>>954
右上ボルトロスとゾロアやん

965 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
あとCraiyonのアニメ特価版モデル来てた

966 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
商業で利用して売上があって後から著作権侵害認定されたら規模に比例して賠償金額が上がる
だから商業で使うならものすごく気を使って生成しなきゃいけないのは当然

趣味の個人アカウントで無料で公開する分にはリスクは少ないだろう

967 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>959
アイデアとして、pixivがいいんじゃないかとは思って入れてはいたんだけど
fanboxのが強いのは言われてみればその通りやわ

968 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
>>965
img2imgの元画像に良さそう

969 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
いくらドンピシャだとしてもアレコレ含んでそうな言葉には注意する
ド素人が認識すら危うい魑魅魍魎を混ぜているcursedな言葉を入れる時は特に注意するかそもそも入れない
ってのでpixivってド直球をプロンプトに入れてる人は少ない印象

970 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
イラストレーターから絵柄学習する奴悪用されそう

971 :名無しさん@お腹いっぱい。:[ここ壊れてます] .net
例の奴は元の絵師の絵柄をほぼ完全にコピー出来てるから凄いな

972 :名無しさん@お腹いっぱい。:2022/08/29(月) 14:59:06.96 ID:z0RT4pew.net
「自身の描いた画像だけ」とか、こんな規約誰も守らん

973 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:09:02.13 ID:HTwHei9X.net
kawaiiは奥が深いし難しい部分があるけど、背景を生成する分にはめちゃくちゃ便利すぎる

974 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:31:16.37 ID:E2pAsSUt.net
ファインチューニングの研究が進めばSDでも同じこと出来るのは時間の問題だよね
というか今でも頑張れば出来るのか?

975 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:41:52.85 ID:gsESt66C.net
漫画家で絵柄を再現したらアシスタントとか亡き漫画家の続編絵ができたり?
まあ悪用する奴はいるだろうけど

976 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:48:55.36 ID:oX9i99+h.net
>>974
できる
ってか最初からembeded pathのオプションあるw

977 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:52:00.61 ID:hJAn0cka.net
>>970-972
>>974-975

>>221

978 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:52:43.51 ID:LcgOCUAl.net
>>975
手塚治虫の新作出てたじゃん

979 :名無しさん@お腹いっぱい。:2022/08/29(月) 15:54:54.77 ID:ZNZ0831c.net
はい

Stable Diffusionをいらすとやでファインチューニングする - ほげほげ
https://birdmanikioishota.blog.%66c2.com/blog-entry-8.html

980 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:01:23.53 ID:bBsfaBGG.net
ファインチューニングしても使用者が想定してるものが出るとは限らないからな…
むしろ出るならすごい

981 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:02:37.36 ID:TKZ5Ug6s.net
>>979
いいね


なんかさ、AI画像ではgeforce3060がメモリ的にコスパいい説も有力だけど
個人レベルで機械学習させるのが流行ってくるとしたら、やっぱ中高級のGPUがええことになるんやろな

982 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:03:41.33 ID:LcgOCUAl.net
初音ミク
https://i.imgur.com/Zv68OnI.jpg

ツインテール
Turquoise hair, japanese double pigtails hairstyle

983 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:05:34.36 ID:l6B+4duJ.net
>>982
みんな!鼻を指で隠してみろ!😊

984 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:10:02.57 ID:0bMk5NBW.net
Pythonはじめて触ったもので、どなたか教えてください

Stable Diffusionをcolabで動かしていて、下記コードを使用しています

ここに「縦×横サイズ」「cfg scale」「ステップ数」の指定が出来るようにするにはどのようにコード書けばいいでしょうか?


from torch import autocast
from IPython.display import display
#import matplotlib.pyplot as plt
prompt = ""

for i in range(5):
with autocast("cuda"):
image = pipe(prompt)["sample"][0] # image here is in [PIL format](https://pillow.readthedocs.io/en/stable/)
display(image)

985 :名無しさん@お腹いっぱい。:2022/08/29(月) 16:10:13.29 ID:6+Vx5IWt.net
というかリアル調の鼻が目立たなくなったのがアニメ顔なんだけどね

https://i.imgur.com/82SNJyl.png

986 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:09:17.08 ID:adcon1OP.net
https://i.4cdn.org/g/1661760079567004.png
https://boards.4channel.org/g/thread/88344924#p88346555
https://boards.4channel.org/g/thread/88344924#p88346566

987 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:09:18.86 ID:3SqGfZxt.net
というか否定モードが欲しいね
「small breasts」とか入れても逆に胸が強調されちゃう
ピンクの象を想像しないでください問題

988 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:13:30.30 ID:yVpH1TXj.net
>>987
一応こういうことを試みてる人はいるみたいなんだけどなあ
https://zenn.dev/td2sk/articles/eb772103a3a8ff

989 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:14:39.91 ID:zrVIZvjl.net
Twitterでmimicというサービスが騒がれていたけど
二次元に対応してるやん!と思ったら
顔しか生成できないのね

多分、近いうちにAIが二次元を理解するだろうから、すぐ産廃になりそう

990 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:28:05.70 ID:adcon1OP.net
>>989
これは?
顔はこれで作って体をSDに描いてもらうのも悪くはないんじゃない?
https://waifulabs.com/

991 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:29:22.71 ID:E2pAsSUt.net
>>989
DALL E2は自動的に絵柄揃えて描き足しが出来るから
顔だけ生成できれば全身絵が出力できる
顔はmimicで有名絵師の絵を完コピ、DALLで全身生成、背景はMJ
既にこうやって作った高品質な絵を上げてる奴もいるよ

992 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:32:35.15 ID:VCetP0oT.net
現状だと高品質な顔画像を元に他のAIに身体を出力させる方法が使える
StableDiffusionだとファインチューニングで画風を揃えたinpaintingもできそう

https://twitter.com/II0FU5/status/1553587549704458240
(deleted an unsolicited ad)

993 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:35:13.75 ID:hJAn0cka.net
>>991
妄想の披露は別のスレでどうぞ>>221
できると言うのなら実際にやってここに貼ってください
そういうスレなので

994 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:37:04.41 ID:ZNZ0831c.net
お、立てられた

Midjourney】AI画像生成技術交換3【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661762186/

995 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:40:20.99 ID:lMWF1V0z.net
>>994
たておつ

996 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:47:18.58 ID:ZNZ0831c.net
>>984
そのスクリプトがどこにあったものかわからないけど、

https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

の下の方を見たらわかるかも

997 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:48:58.47 ID:3SqGfZxt.net
>>988
そのものズバリじゃん
ありがとう

998 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:51:32.86 ID:1He7nitR.net
やたら時間と手間はかかるだろうけど
顔生成して、ポーズ生成して、置換してもらって、中割描いてもらってで
遠くない未来にノースキルの人がアニメ作れるようになるかも、という想像ができるくらいまで来てるのはすごいね

日本語も効く言葉あるけど、英語混ぜると後ろに置いても一気に乗っ取られるなぁ
日本語でやるなら日本語オンリーじゃないと厳しいか

999 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:51:45.09 ID:nqEfck//.net
>>994


1000なら頑張る

1000 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:53:43.19 ID:zrVIZvjl.net
すでにやっている人がいるというのは妄想ではないのでは?

1001 :名無しさん@お腹いっぱい。:2022/08/29(月) 17:54:39.31 ID:6+Vx5IWt.net
Gregさん今日は調子悪いわ

1002 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1002
313 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200