OKMD KNOWLEDGE PORTAL

Home

บทความ

การสร้างภาพด้วย Generative AI

28 พฤษภาคม 2025

1901 อ่านข่าวนี้

ในยุคที่เทคโนโลยีเข้ามามีบทบาทอย่างลึกซึ้งในชีวิตประจำวัน “ปัญญาประดิษฐ์” (Artificial Intelligence: AI) ได้กลายเป็นคำที่ได้ยินอยู่เสมอ โดยเฉพาะอย่างยิ่งในแวดวงสร้างสรรค์ ที่ AI ไม่เพียงแค่ทำหน้าที่วิเคราะห์ข้อมูล แต่ยังสามารถ “สร้าง” สิ่งใหม่ๆ ได้ด้วยตัวเอง ซึ่งหนึ่งในแขนงที่น่าสนใจคือ Generative AI หรือ AI ที่สามารถสร้างเนื้อหาใหม่ เช่น ภาพ วิดีโอ ดนตรี หรือข้อความ จากคำสั่งของมนุษย์เพียงไม่กี่คำ

ความหมายของ AI และ Generative AI
AI (Artificial Intelligence) คือ เทคโนโลยีที่ออกแบบมาให้เครื่องจักรสามารถคิด วิเคราะห์ ตัดสินใจ หรือเรียนรู้จากข้อมูลได้โดยเลียนแบบมนุษย์

Generative AI คือ แขนงหนึ่งของ AI ที่มุ่งเน้นการ “สร้าง” สิ่งใหม่ๆ จากการเรียนรู้รูปแบบของข้อมูลจำนวนมหาศาล ตัวอย่างที่ชัดเจนคือการสร้างภาพจากข้อความ (Text-to-Image) หรือสร้างวิดีโอจากคำสั่ง

เครื่องมือ Generative AI สำหรับสร้างภาพ
ปัจจุบันมีเครื่องมือมากมายสำหรับสร้างภาพด้วย Generative AI ที่ช่วยให้ผู้ใช้สามารถสร้างภาพจากข้อความได้ง่ายและรวดเร็ว ตัวอย่างเครื่องมือที่ได้รับความนิยม ได้แก่:
Midjourney – เป็นหนึ่งในเครื่องมือที่ได้รับความนิยมสูงสุด โดดเด่นด้วยคุณภาพของภาพที่สวยงามและมีเอกลักษณ์ ใช้งานผ่าน Discord โดยใช้ข้อความเพื่อสั่งให้ AI สร้างภาพ
Raphael AI – เป็นเครื่องมือ Generative AI สำหรับสร้างภาพที่สามารถใช้งานผ่านเว็บไซต์ได้โดยตรง ไม่ต้องติดตั้งโปรแกรมใดๆ จุดเด่นคือเปิดให้ใช้งาน ฟรี 100% โดยไม่มีค่าใช้จ่าย
ChatGPT – รองรับการสร้างภาพสามารถใช้ร่วมกับโมเดล DALL·E เพียงพิมพ์คำสั่ง AI ก็จะสร้างภาพตามคำอธิบาย พร้อมมีฟีเจอร์ปรับแต่งภาพ เช่น การลบ/เพิ่มวัตถุ
Gemini – พัฒนาโดย Google มีฟังก์ชัน Text-to-Image ที่ให้ผู้ใช้สร้างภาพผ่านระบบของ Google ด้วยการประมวลผลที่เร็วและเข้าใจภาษาหลากหลาย
Copilot – เครื่องมือจาก Microsoft ที่เน้นผู้ใช้งานทั่วไป สามารถช่วยสร้างภาพได้เช่นเดียวกัน
Alisa – แชทบอท AI ของคนไทยใช้งานผ่าน LINE รองรับการสร้างภาพเช่นเดียวกัน มีจุดเด่นคือการใช้งานที่ง่ายและรองรับภาษาไทย
Recraft – โดดเด่นในด้านการสร้างภาพถ่ายเสมือนจริง เหมาะกับงานโฆษณา

เครื่องมือเหล่านี้ต่างก็มีการพัฒนาความสามารถอย่างต่อเนื่อง ให้ใช้งานง่ายขึ้น รองรับภาษาได้หลากหลายขึ้น และเปิดโอกาสให้ผู้ใช้จากทั่วโลกสามารถสร้างสรรค์ผลงานในแบบของตนเองได้อย่างไร้ขีดจำกัด

Midjourney: ผู้นำด้าน Generative AI สำหรับการสร้างภาพ
Midjourney ถือเป็นหนึ่งในเครื่องมือเจ้าแรกๆ ที่จุดประกายกระแส Generative AI สำหรับการสร้างภาพ โดยมีจุดเด่นคือคุณภาพของภาพที่มีสไตล์เฉพาะตัว มีความละเอียดสูง และสามารถควบคุมรูปแบบได้หลากหลาย

แนวคิดและคำสั่งสำคัญใน Midjourney:

Text to Image (ข้อความสู่ภาพ) เป็นคำสั่งพื้นฐานของ Midjourney ด้วยการพิมพ์ข้อความหรือคำอธิบาย (Prompt) เพื่อให้ AI สร้างภาพตามจินตนาการ สามารถระบุรายละเอียด เช่น โทนสี มุมกล้อง อารมณ์ภาพ หรือเทคนิคศิลปะได้ เช่น a futuristic city at night, cyberpunk style, neon lights, ultra-realistic --v 5
Variations (Vary) เมื่อได้ภาพแล้ว สามารถสร้าง ภาพใหม่ในแนวเดียวกับต้นฉบับ แต่มีความแตกต่างกันเล็กน้อย เหมาะสำหรับการสร้างภาพในเวอร์ชันที่ใกล้เคียงกับสิ่งที่ต้องการมากที่สุด
Upscale ใช้สำหรับ เพิ่มความละเอียดของภาพที่เลือก ให้เหมาะสำหรับการนำไปใช้งานจริง เช่น การพิมพ์โปสเตอร์และสื่อโฆษณา
Remix ทำให้สามารถ แก้ไข prompt จากภาพที่สร้างไปแล้วเพื่อสร้างภาพใหม่ในแบบที่เปลี่ยนแปลงเฉพาะบางส่วนของต้นฉบับ เหมาะกับการทดลองปรับสไตล์หรือองค์ประกอบของภาพโดยยังคงแนวคิดเดิมไว้
Pan / Zoom Out / Zoom In

Zoom Out : ขยายขอบเขตของภาพ (เช่น จากภาพครึ่งตัวให้เห็นทั้งตัว)
Zoom In : ซูมเข้าเพื่อเน้นรายละเอียด
Pan : เลื่อนกรอบภาพไปด้านบน ล่าง ซ้าย ขวา เพื่อสร้างฉากต่อเนื่อง

Inpainting (Vary Region) ใช้สำหรับ แก้ไขเฉพาะบางส่วนของภาพ โดยสามารถลากกรอบและใส่ prompt ใหม่ในบริเวณนั้น เหมาะกับการเปลี่ยนเสื้อผ้า ใบหน้า ฉากหลัง หรือเพิ่ม/ลบวัตถุ
Image Prompt ใช้รูปภาพแทนข้อความ เพื่อเป็นแนวทางให้ AI สร้างภาพใหม่ในแบบที่ใกล้เคียงกับต้นฉบับ สามารถใช้ร่วมกับข้อความเพื่อให้ชัดเจนยิ่งขึ้น
Character Reference / Style Reference ใช้เพื่อให้ AI รู้ว่าต้องการให้ออกแบบตาม ลักษณะตัวละคร หรือ สไตล์ศิลปะ ที่เคยระบุไว้
Describe ใช้กับรูปภาพเพื่อให้ Midjourney แปลภาพเป็นข้อความเหมาะกับการสร้าง prompt ใหม่จากภาพต้นฉบับ หรือใช้เพื่อเรียนรู้สไตล์ของภาพที่ชอบ

เทคนิคการเขียน Prompt ให้ได้ภาพที่ดี

Image Prompt Guidelines: ใช้โครงสร้างที่ชัดเจน เช่น [subject], [style], [lighting], [mood] เพื่อให้ AI เข้าใจองค์ประกอบของภาพที่ต้องการอย่างแม่นยำ
Choose the Right Words: เลือกใช้คำเฉพาะทาง เช่น “vintage”, “cyberpunk”, “macro lens” เพื่อกำหนดโทนหรือสไตล์ของภาพ
Be Specific with Numbers: ระบุจำนวนให้ชัดเจน เช่น “5 birds”, “3 buildings” เพื่อควบคุมปริมาณวัตถุในภาพ
Be clear about details: ระบุรายละเอียดที่สำคัญให้ชัดเจน เช่น
• Subject : เช่น “cat in a space suit” (แมวใส่ชุดอวกาศ)
• Medium : Pencil Sketch, Watercolor, Pixel Art, Graffiti
• Environment : City, Garden, Forest, Ocean
• Mood : Sad, Joyful, Shy, Angry, Happy
• Color : Sepia, Pastel, Grayscale, Neon
• Composition : อยู่ตรงกลาง, แบบสมมาตร, ใช้กฎสามส่วน (rule of thirds)

การใช้งานของแต่ละเครื่องมือ :
1. Raphael AI – เป็นเครื่องมือสร้างภาพด้วย Generative AI ที่เปิดให้ใช้งาน ฟรี 100% ผ่านเว็บไซต์ https://raphael.app/ เพียงพิมพ์คำสั่งแล้วกดปุ่ม Generate ก็สามารถสร้างภาพตามคำอธิบายได้ทันที

2. Gemini – โมเดลจาก Google ใช้งานผ่านเว็บ https://gemini.google.com สร้างภาพจากคำสั่งข้อความ รองรับภาษาไทยด้วย ตัวอย่างเช่น ให้ Gemini สร้างรูปแมวใส่ชุดไทย

3. ChatGPT – Generative AI ยอดนิยม สามารถใช้งานผ่าน https://chatgpt.com/ สร้างภาพผ่านคำสั่งข้อความ รองรับคำสั่งหลายภาษา และมีความสามารถในการแก้ไขรูปภาพ

ตัวอย่างการสร้างรูปผู้หญิงใส่เสื้อเชิ้ตสีขาวสูทชมพู

แก้ไขรูปภาพโดยให้ผู้หญิงในรูปภาพที่สร้างก่อนหน้านี้ถือสินค้าจากรูป และใส่ป้ายข้อความด้านหลัง

การแก้ไขรูปภาพเฉพาะส่วน โดยเลือกบริเวณดวงตาและระบุให้มีการใส่แว่น

4. Copilot – AI ChatBot ที่พัฒนา Microsoft เข้าใช้งานได้ที่ https://copilot.microsoft.com สามารถช่วยสร้างภาพได้เช่นเดียวกัน ตัวอย่างเช่น สร้างรูปเต่าดื่มกาแฟบนหลังคาบ้าน

5. Alisa – แชทบอท AI ของคนไทยใช้งานผ่าน LINE สามารถสั่งคำสั่งสร้างรูปผ่าน LINE ได้เลย ตัวอย่างเช่นผลลัพธ์จากการสร้างภาพผู้หญิงโดยมีตัวเลือกให้สามารถบันทึกและปรับแก้รูปภาพได้

7. Recraft – https://www.recraft.ai เหมาะกับงานโฆษณา

สร้างภาพแก้วกาแฟสีขาวอยู่บนโต๊ะไม้

จากนั้นนำโลโก้มาแปะไว้ที่แก้ว เพื่อแสดงภาพตัวอย่างสินค้า

สรุป
การสร้างภาพด้วย Generative AI ได้พลิกโฉมวงการสร้างสรรค์ ไม่เพียงแต่เปิดโอกาสให้ศิลปิน นักออกแบบ และผู้ใช้ทั่วไปสามารถเข้าถึงการสร้างภาพระดับมืออาชีพได้ง่ายขึ้น แต่ยังช่วยประหยัดเวลา เพิ่มไอเดีย และเปิดกว้างให้กับความคิดสร้างสรรค์อีกด้วย

หมายเหตุ :

OKMD Career Bootcamp 2025 Season 2

สามารถชม Live ย้อนหลังหรือทบทวนบทเรียนได้ที่ :

ครั้งที่ 1 AI Image : https://www.youtube.com/watch?v=Uut7TA1My3k&t=14s

ครั้งที่ 2 AI Media : https://www.youtube.com/watch?v=NLiLvAk5Ung

ครั้งที่ 3 Digital Ethics & Laws : https://www.youtube.com/watch?v=-Sc2eAQyYEM