เมื่อคนวาดรูปไม่เป็น ใช้ AI วาดรูปให้

Описание к видео เมื่อคนวาดรูปไม่เป็น ใช้ AI วาดรูปให้

คือ ก่อนหน้านี้ 2 เดือน ได้ยินเรื่อง AI วาดรูปเยอะมาก แต่ไม่อยากรีบออกมาพูดเพราะ อยากลองจับก่อนจะออกมาพูดตามคนอื่น

โดยที่ผมลองมาจะมี Disco Diffusion, Midjouney, Stable Diffusion, Dall E 2

พวกตัวใหม่ๆอย่าง Dreambooth, textual inversion อันนี้คือ ยังไม่ได้ลอง แต่ได้ศึกษามาบาง เลยไม่ขอพูดในคลิปละกัน

ตัว Disco Diffusion มันเป็น model ที่เก่าพอๆกับ dall e v.1 เลย โดยปล่อยมาครั้งแรกตอน Oct 29th 2021 โดยเราสามารถไปใช้ได้ ฟรีบน google colab แต่เท่าที่ลอง model มันใหญ่มากๆ ทำงานช้าจัดๆ ผลลัพธ์ที่ได้ไม่ค่อยดีเท่าไหร่ ในเรื่องความสมจริง แต่ถ้าเป็นความ abstract คือใช้ได้เลย

ต่อมาคือ Midjouney เนื่องจาก Dall E2 ก็ไม่ให้เราใช้ Stable Diffusion ก็ยังไม่เปิด model ให้ใช้ Midjouney แบบจ่ายเงินก็เปิดตัวมา และ ภาพที่ได้คือ สวยมากๆ ส่วนใหญ่จะเป็น digital art ซะส่วนใหญ่ พวกใบหน้า หรือ anime style ยังทำไม่ค่อยดีในตอนแรก แต่เท่าที่รู้ตอนนี้เขามี beta ที่ทำได้ดีขึ้นแล้ว แต่ยังไม่ได้กลับไปลอง ส่วนภาพจะออกมาดีไม่ดี ขึ้นอยู่กับว่าเราหา prompt ที่เหมาะเจอไหม

เช่น ผมบอกว่าอยากได้ "A Horror Classroom" แบบนี้คือ จะได้ภาพไม่ค่อยดีนะ ต้องเขียนว่า "A Horror Classroom, realistic, 8k, HD, unreal engine, octave render, 3D, volumatic light" มันต้องหา prompt ว่าอันไหนมีผลให้ตรงกับสิ่งที่เราต้องการด้วย

คือมองว่า ถ้าพวก AI drawing มันบูมแล้วมาเป็น tools ที่ใช้ทั่วไปในอนาคต อีกหน่อยเราอาจจะต้องมีงานสำหรับเขียน prompt AI อีกที เหมือนกับงาน SEO หรืออาจจะต้องฝึกเป็น skill googling อะไรแบบนี้เลย

AI ตัวต่อมาคือ Stable Diffusion ตัวฟรีที่ปล่อยมาแล้วผลงานดีมากๆ และ open sourse เลยมีคนเอาไปต่อยอดมากมาย จนใช้งานง่าย ก็พอเทียบกับ Midjouney ได้ แต่ผลงานมันจะออกแนว realistic มากกว่า digital art ของ midjouney และก็เจอภาพที่เป็น fail case ค่อนข้างบ่อยๆ แต่มันฟรี ก็นับว่าใช้แทนได้เกือบๆ 70%

แต่ที่สำคัญคือ Stable Diffusion มันสามารถต่อกับ textual inversion ได้ สรุปง่ายๆคือ ถ้าเราอยากสร้างภาพที่มีความ specific เช่น เราอยากได้ตัวละคร A แต่ตัวละครนี้ไม่ได้ถูก train ใน dataset ของ stable diffusion มันก็จะได้ภาพที่ไม่ตรงตามที่ต้องการ หรือ ได้ยาก

ตัว textual inversion เลยเข้ามาช่วยตรงนี้ คือเราสามารถ train model แยกแล้ว ใช้ model นั้นเมื่อเจอ specific word ได้เช่น "A photo of A" พอเจอ word ที่บอกถึงตัวละคร A มันจะไปใช้ model มา generate รูปให้ โดยการ train ใช้แค่ 3-5 รูปเท่านั้นเอง

ทำให้ Stable Diffusion ตอนนี้เป็นตัวที่มีความเป็นไปได้ในการเติบโตสูงมากๆ

ตัวสุดท้าย Dall e 2 ภาพสมจริง ดีมาก, ภาพ การ์ตูน ดีมาก, ภาพ art ดีมาก, UI/UX ดีมาก, การเขียน prompt มึนมาก

เอาจริงๆ Dall e 2 ตอนใช้คือประทับใจมากๆ ใช้งานง่าย ภาพสวย แทบไม่เจอ fail case แต่ถ้าใช้ Midjouney มา เวลาใส่ prompt มันจะมึนๆ หน่อยอย่าง midjouney มันจะเขียนแบบ "A, B, C, D" แต่ Dall e ส่วนใหญ่จะเขียนแบบ "a C photo of A in B style, D" และ ตัวอย่างที่เอามาโชว์ค่อนข้างน้อย ทำให้งงกับ prompt หน่อยๆ แต่ถ้าใส่แบบ midjouney ก็ได้เหมือนกันนะ ไม่ใช่ไม่ได้ แต่บางทีมันออกมาแบบ ขอ realistic อะ ทำไมกลายเป็น cartoonize วะ อะไรงี้

และ นี้คือทั้งหมดที่ลอง เอาเป็นว่า ใครชอบก็ไปลองเองต่อได้ ทุกตัวสามารถลองได้โดยไม่เสียเงิน อย่าง midjouney ก็มี credit ฟรีให้ตอนเริ่ม dall e 2 ก็มีใครทุกเดือน
ลิงค์ ของแต่ละอันอยู่ส่วน ref ไปใช้ได้

➤ code ส่วนลดจาก futureskill
มันจะมี 2 code นะ ถ้าใครอยากเรียนหลายๆ Course ก็กดรายปีได้
Buffet Pakage Code : AFFXTechCast
(แพ็คเกจ 1 ปี ลด 50% จาก 9948 เหลือ 4974 บาท)
แพ็คเกจรายปี : https://bit.ly/3RKAiNI

แต่ถ้าดูแล้วอยากเรียนแค่ Course เดียวก็ใช้อันนี้แทน
Coures Pakage Code : AFFXTechCast1
(ส่วนลด 100 บาทคอร์สเรียนเดี่ยว คอร์สใดก็ได้ On top ลดเพิ่มจากราคาลดแล้วจากบนหน้าเว็บไซต์)
แพ็คเกจรายคอร์ส :

➤ ช่องทางติดตาม
facebook :   / techcastneedsponsor  
discord:   / discord  

➤ support me
promptpay : https://bit.ly/3m3uH5p

➤ มาเป็น Member และ Sponsor ให้ Techcast ได้แล้ววันนี้
ด้วยการสมัครเป็นสมาชิกเพื่อเข้าถึงสิทธิพิเศษอีกมากมาย
   / @techcast  

➤ Music Credit
spirited away - Itsumo Nando demo

➤ Ref.
Disco diffusion
https://github.com/alembics/disco-dif...

Midjouney
https://www.midjourney.com/app/

Stable Diffusion
https://github.com/CompVis/stable-dif...

Stable Diffusion แบบ WebUI
https://github.com/AUTOMATIC1111/stab...

Textual inversion
https://textual-inversion.github.io/
https://github.com/AUTOMATIC1111/stab...

Dreambooth
https://github.com/XavierXiao/Dreambo...

Dall E 2
https://openai.com/dall-e-2/

latent space
https://en.wikipedia.org/wiki/Latent_...
   • A.I. Experiments: Visualizing High-Di...  
   • Variational Autoencoder (VAE) Latent ...  

diffusion model
https://lilianweng.github.io/posts/20...
   • What are Diffusion Models?  
   • Diffusion models from scratch in PyTorch  

Комментарии

Информация по комментариям в разработке