OKMD KNOWLEDGE PORTAL

Home

บทความ

การสร้างวิดีโอและเสียงด้วย Generative AI

04 มิถุนายน 2025

3855 อ่านข่าวนี้

ในยุคที่เนื้อหาดิจิทัลขับเคลื่อนโลก การสร้างสรรค์สื่อวิดีโอและเสียงคุณภาพสูงอาจไม่จำเป็นต้องใช้งบประมาณมหาศาลอีกต่อไป เทคโนโลยี Generative AI ได้เข้าเปลี่ยนแปลงวงการนี้อย่างมาก ทำให้การผลิตคอนเทนต์ระดับมืออาชีพเป็นเรื่องที่ทุกคนเข้าถึงได้ง่ายขึ้น ลองนึกภาพโปรเจกต์ที่เคยต้องใช้งบประมาณกว่า 400,000 ดอลลาร์สหรัฐฯ แต่ตอนนี้สามารถสร้างสรรค์ได้ในราคาไม่ถึง 400 ดอลลาร์สหรัฐฯ ดังตัวอย่างที่ David Blagojevic ได้แสดงให้เห็นถึงกระบวนการสร้างโฆษณาคุณภาพสูงโดยใช้เครื่องมือ AI ซึ่งตามปกติแล้วต้องใช้งบประมาณที่สูงมาก โดยใช้เครื่องมือ Generative AI เช่น Runway ML, Kling AI, Google DeepMind Veo, Luma AI และ OpenAI Sora เป็นการพลิกโฉมของการผลิตสื่ออย่างมาก โดยในบทความนี้จะแนะนำวิธีการใช้ Generative AI ในการสร้างสรรค์วิดีโอและเสียง เริ่มตั้งแต่การแปลงความคิดให้เป็นภาพ วิดีโอ และเสียง ไปจนถึงการประกอบรวมเป็นผลงานที่พร้อมเผยแพร่

ภาพจากโฆษณาที่สร้างสรรค์ด้วย Generative AI
https://www.instagram.com/davinci_production/reel/DH33WGxxGUv/

Video Prompting Guide: เคล็ดลับสร้างวิดีโอตรงใจด้วยคำสั่ง AI

การสั่งการให้ Generative AI สร้างวิดีโอให้ตรงตามจินตนาการ หัวใจสำคัญอยู่ที่ "พรอมต์" (Prompt) หรือชุดคำสั่งข้อความที่ป้อนให้ AI เข้าใจ นี่คือหลักการสำคัญในการเขียนพรอมต์ที่มีประสิทธิภาพ:

● ความเรียบง่าย: พรอมต์ที่สั้น กระชับ ไม่ซับซ้อน และตรงประเด็นให้ผลลัพธ์ที่ดี เพราะ AI สามารถตีความต้องการจากพรอมนต์ที่เรียบง่ายได้ชัดเจนกว่า

● ภาพอินพุตคุณภาพสูง: หากคุณเริ่มต้นจากการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอ ควรใช้รูปภาพที่มีความคมชัดสูง เพื่อให้ AI มีข้อมูลตั้งต้นที่ดีที่สุดในการสร้างสรรค์

● เน้นการเคลื่อนไหว: แทนที่จะบอกแค่ "ผู้หญิงคนหนึ่งยืนอยู่" ลองระบุการเคลื่อนไหวให้ชัดเจนขึ้น เช่น "ผู้หญิงคนหนึ่งกำลังเดินอย่างสง่างามบนถนนที่จราจรติดขัด" การใส่รายละเอียดการเคลื่อนไหวจะทำให้วิดีโอมีชีวิตชีวามากขึ้น

● ใช้ถ้อยคำเชิงบวก: AI ทำงานได้ดีกว่าเมื่อคุณบอกว่าต้องการอะไรโดยตรง แทนที่จะบอกว่า "ห้ามมีรถยนต์ในฉาก" ให้ลองใช้ "ฉากในชนบทที่เงียบสงบปราศจากสิ่งรบกวน" การใช้คำสั่งเชิงบวกจะช่วยให้ AI โฟกัสไปที่ผลลัพธ์ที่คุณต้องการ

● อ้างอิงแบบทั่วไป: ในบางครั้ง การใช้คำกว้างๆ เช่น "ตัวแบบ (the subject)" หรือ "วัตถุ (the object)" จะช่วยให้ AI มีอิสระในการตีความและสร้างสรรค์ผลลัพธ์ที่หลากหลาย โดยเฉพาะเมื่อคุณยังไม่มีภาพต้นแบบที่ชัดเจนในใจ

● องค์ประกอบสำคัญของพรอมต์: เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น ควรระบุรายละเอียดเหล่านี้:

○ Subject motion (การเคลื่อนไหวของตัวแบบ): ตัวละครหลักกำลังทำอะไร (เช่น วิ่ง กระโดด เต้นรำ)

○ Scene motion (การเคลื่อนไหวของฉาก): บรรยากาศรอบๆ มีการเคลื่อนไหวอย่างไร (เช่น ใบไม้ปลิว คลื่นซัดฝั่ง)

○ Camera motion (การเคลื่อนไหวของกล้อง): มุมกล้องมีการเคลื่อนที่แบบไหน (เช่น แพนกล้อง ซูมเข้า-ออก, เคลื่อนที่แบบ Dolly)

○ Style descriptors (คำอธิบายสไตล์): วิดีโอควรมีลักษณะอย่างไร (เช่น สไตล์ภาพยนตร์ ภาพเคลื่อนไหวช้า การ์ตูน ภาพวาดสีน้ำ)

Image to Video: จากภาพนิ่งสู่เรื่องราวที่เคลื่อนไหว

การเปลี่ยนรูปภาพนิ่งให้กลายเป็นวิดีโอที่เคลื่อนไหวได้เป็นหนึ่งในความสามารถที่น่าทึ่งของ Generative AI กระบวนการนี้มักเริ่มต้นจากการสร้างรูปภาพตั้งต้นด้วย AI แล้วนำไปต่อยอดในเครื่องมือสร้างวิดีโอ

● ตัวอย่างขั้นตอน:

○ ChatGPT สร้างรูปภาพ https://chatgpt.com/: เริ่มต้นด้วยการใช้ ChatGPT (หรือเครื่องมืออื่น ๆ อย่าง Midjourney, DALL-E) เพื่อสร้างรูปภาพตามที่คุณจินตนาการ เช่น อัพโหลดภาพสินค้าแล้วใช้พรอมต์ "สร้างรูปแมวอ้วนสีส้มซูดมาม่าคัพ"

สร้างภาพจาก ChatGPT

○ Runway ML แปลงรูปภาพเป็นวิดีโอ https://runwayml.com/: เมื่อได้รูปภาพที่ต้องการแล้ว ให้นำไปอัปโหลดที่ Runway ML แพลตฟอร์มนี้จะวิเคราะห์รูปภาพและใช้ AI สร้างวิดีโอสั้นๆ พร้อมการเคลื่อนไหวตามที่คุณกำหนดเพิ่มเติมในพรอมต์ เช่น "Cat eating a cup of instant noodles. Pull the camera back from the noodle cup logo to reveal the full cat. A dramatic lava splash bursts behind the scene"

เลือก Use Image to Video

อัพโหลดภาพและใส่พรอมต์สำหรับสร้างวิดีโอจากภาพ

วิดีโอผลลัพธ์จาก Runway ML

○ KlingAI https://klingai.com/global: นอกจาก Runway ML แล้ว KlingAI ก็เป็นอีกแพลตฟอร์มที่มีประสิทธิภาพในการแปลงรูปภาพเป็นวิดีโอ ลองใช้ทั้งสองเพื่อเปรียบเทียบผลลัพธ์และค้นหาเครื่องมือที่ตอบโจทย์สไตล์งานของคุณที่สุด

สร้างวิดีโอจากภาพด้วย KlingAI

อัพโหลดภาพและใส่พรอมต์สำหรับสร้างวิดีโอจากภาพ

Product Avatar: สร้างผู้ช่วยเสมือนเพื่อนำเสนอสินค้า

การสร้าง Product Avatar หรือตัวแทนสินค้าที่เป็นบุคคลเสมือนจริงที่สามารถพูดและนำเสนอสินค้าได้ เป็นเครื่องมือที่น่าสนใจสำหรับธุรกิจที่ต้องการสร้างเนื้อหาโปรโมทสินค้าที่ดึงดูดสายตาโดยไม่ต้องพึ่งพานักแสดงจริง

● ขั้นตอนการใช้งาน:

○ นำสินค้าเข้าสู่ Avatar ด้วย TOPVIEW https://www.topview.ai/: ใช้แพลตฟอร์มอย่าง TOPVIEW (หรือเครื่องมือที่คล้ายกัน) เพื่อนำภาพสินค้าของคุณไปวางบนตัวแบบ Avatar ที่เลือกไว้ ไม่ว่าจะเป็นคนจริงในรูปแบบดิจิทัล หรือตัวการ์ตูนอนิเมะ

เลือกตัวแบบ Avatar แล้วอัพโหลดภาพสินค้า

เลือกลักษณะการจับสินค้า

ได้ผลลัพธ์เป็นวิดีโอของตัวแบบ Avatar ที่ถือสินค้าอยู่

Text to Voice: เนรมิตข้อความให้เป็นเสียงพูด

การแปลงข้อความเป็นเสียงพูด หรือ Text-to-Speech (TTS) เป็นเครื่องมือสำคัญในการสร้างวิดีโอ พอดแคสต์ หรือเนื้อหาใดๆ ที่ต้องการเสียงบรรยายหรือเสียงพากย์ ช่วยประหยัดเวลาและทรัพยากรในการบันทึกเสียงมนุษย์

● Botnoi https://voice.botnoi.ai/: สำหรับผู้ใช้งานในประเทศไทย Botnoi เป็นแพลตฟอร์ม AI ที่โดดเด่นในการให้บริการ TTS ด้วยเสียงภาษาไทยที่หลากหลายและเป็นธรรมชาติ คุณสามารถป้อนข้อความเข้าไป เลือกเสียงที่ต้องการ (มีทั้งชาย หญิง หลายสำเนียง) และ Botnoi จะสร้างไฟล์เสียงคุณภาพสูงให้คุณนำไปใช้งานได้ทันที เพิ่มความเป็นมืออาชีพให้กับผลงานของคุณ

https://voice.botnoi.ai/

ป้อนสคริปต์บทพูด

เลือกเสียงที่ต้องการ (มีให้เลือกหลากหลายโทนเสียง)

บันทึกไฟล์เสียงเพื่อนำไปใช้ต่อได้

Text to Music: สร้างสรรค์ดนตรีประกอบด้วย AI

เสียงดนตรีประกอบเป็นองค์ประกอบสำคัญที่ช่วยเพิ่มอารมณ์และบรรยากาศให้กับวิดีโอหรือเนื้อหาเสียง Generative AI ทำให้การสร้างเพลงประกอบง่ายขึ้นมาก ไม่ว่าจะเป็นเพลงมีเนื้อร้องหรือเพลงบรรเลง

● Suno สำหรับเพลงมีเนื้อร้อง https://suno.com/: Suno เป็น AI ที่เชี่ยวชาญในการสร้างเพลงพร้อมเนื้อร้อง คุณเพียงแค่ป้อนข้อความที่เป็นเนื้อเพลง หรือระบุแนวเพลงและอารมณ์ที่ต้องการ Suno จะสร้างทำนอง ดนตรีประกอบ และเสียงร้องออกมาให้คุณเลือกฟัง ทำให้คุณสามารถสร้างเพลงประกอบที่มีเอกลักษณ์เฉพาะตัว

https://suno.com/

ผลลัพธ์เป็นเพลงที่มีเนื้อร้อง

● Udio สำหรับเพลงบรรเลง http://udio.com/: สำหรับเพลงบรรเลงที่ใช้ประกอบฉากหรือพอดแคสต์ Udio คือตัวเลือกที่ยอดเยี่ยม คุณสามารถระบุแนวเพลง อารมณ์ที่ต้องการ (เช่น สุขุม, ตื่นเต้น, ผ่อนคลาย) หรือแม้แต่เครื่องดนตรีที่อยากให้มีในเพลง Udio จะสร้างเพลงประกอบที่เหมาะสมกับบรรยากาศของงานของคุณโดยอัตโนมัติ

http://udio.com/

ป้อนพรอมต์เพื่อสร้างเพลงบรรเลง

บันทึกเพลงเพื่อนำไปใช้ต่อไปได้

Podcast: ยกระดับการผลิตพอดแคสต์ด้วย AI

การสร้างพอดแคสต์กำลังเป็นที่นิยม การใช้ AI เข้ามาช่วยในกระบวนการนี้สามารถลดความซับซ้อนและเพิ่มประสิทธิภาพในการสร้างสรรค์เนื้อหาเสียงได้เป็นอย่างดี

● แนะนำ NotebookLM: NotebookLM เป็นเครื่องมือที่พัฒนาโดย Google ที่ช่วยให้คุณจัดระเบียบข้อมูล สรุปเนื้อหา และสร้างสคริปต์สำหรับพอดแคสต์ได้อย่างชาญฉลาด ด้วยความสามารถในการวิเคราะห์ข้อมูลและสร้างข้อความอัตโนมัติ คุณสามารถใช้ NotebookLM ในการร่างโครงเรื่อง สรุปประเด็นสำคัญ หรือแม้แต่สร้างบทพูดสำหรับแต่ละช่วงของรายการ ทำให้กระบวนการเตรียมการรวดเร็วและเนื้อหามีความน่าสนใจมากยิ่งขึ้น

ตัวอย่างการสร้าง Podcast ด้วย NotebookLM

Story: จากจินตนาการสู่เรื่องราวภาพและเสียงที่สมบูรณ์

การสร้างเรื่องราวด้วย AI เป็นจุดเริ่มต้นที่สำคัญในการผลิตวิดีโอและสื่อต่างๆ การใช้ ChatGPT ในการสร้างโครงเรื่องหรือบทภาพยนตร์สามารถประหยัดเวลาและเป็นแหล่งรวมความคิดสร้างสรรค์อันไร้ขีดจำกัด

● ขั้นตอนการสร้าง Story และสื่อประกอบ:

○ สร้างเรื่องราวด้วย ChatGPT: เริ่มต้นด้วยการใช้ ChatGPT เพื่อสร้างโครงเรื่องที่คุณต้องการ เช่น "สร้างนิทานเกี่ยวกับแมววิเชียรมาศและหมาไซบีเรียนฮัสกี 2 ฉาก โดยเกี่ยวกับการคืนของที่เจอให้เจ้าของ ฉากละไม่เกิน 10 วินาที"

○ สร้างภาพประกอบแต่ละฉาก: ใช้ ChatGPT หรือเครื่องมือสร้างภาพด้วย AI อื่นๆ เพื่อสร้างรูปภาพประกอบสำหรับแต่ละฉาก

○ สร้างวิดีโอคลิปด้วย RunwayML: นำรูปภาพแต่ละฉากที่ได้จาก ChatGPT มาใส่ใน RunwayML เพื่อสร้างเป็นวิดีโอคลิปสั้นๆ คุณสามารถเพิ่มพรอมต์เพื่อกำหนดการเคลื่อนไหวของกล้องหรือตัวละคร เช่น "กล้องแพนตามกระต่ายที่วิ่งเร็ว"

○ สร้างเสียงบรรยายด้วย Botnoi: ใช้ Botnoi เพื่อสร้างเสียงบรรยายสำหรับนิทาน โดยป้อนข้อความที่เป็นเนื้อหาของเรื่องราวเข้าไป

○ สร้างดนตรีประกอบด้วย Udio: ใช้ Udio เพื่อสร้างดนตรีประกอบที่เข้ากับบรรยากาศของนิทาน เช่น เพลงบรรเลงที่ให้ความรู้สึกผ่อนคลายสำหรับฉากในป่า หรือเพลงที่มีจังหวะสนุกสนานเมื่อกระต่ายวิ่งแข่ง

Video Editor: ประกอบทุกองค์ประกอบให้เป็นผลงาน

เมื่อคุณได้องค์ประกอบสำคัญทั้งหมดไม่ว่าจะเป็นคลิปวิดีโอ เสียงบรรยาย และเพลงประกอบแล้ว ขั้นตอนสุดท้ายคือการนำทุกอย่างมารวมกันให้เป็นผลงานวิดีโอที่สมบูรณ์และน่าสนใจ

● CapCut http://capcut.com/: CapCut เป็นโปรแกรมตัดต่อวิดีโอที่ใช้งานง่ายและมีประสิทธิภาพสูง เหมาะสำหรับทั้งผู้เริ่มต้นและมืออาชีพ มีฟังก์ชันการตัดต่อที่หลากหลาย เช่น การตัดต่อวิดีโอ การเพิ่มข้อความ การใส่ฟิลเตอร์และเอฟเฟกต์ต่างๆ

● นำผลลัพธ์ทั้งหมดมาประกอบใน CapCut: คุณสามารถนำคลิปวิดีโอจาก RunwayML (หรือ KlingAI), ไฟล์เสียงบรรยายจาก Botnoi และเพลงประกอบจาก Udio มาอัปโหลดเข้าสู่ CapCut จากนั้นจัดลำดับเหตุการณ์ของคลิปให้ตรงกับเรื่องราว ปรับแต่งเสียงบรรยายให้เข้ากับภาพ เพิ่มเสียงเพลงประกอบให้เหมาะสมกับอารมณ์ของฉาก รวมถึงการใส่เอฟเฟกต์การเปลี่ยนฉาก (transition), ข้อความบรรยาย หรือกราฟิกต่างๆ เพื่อให้ได้ผลงานวิดีโอที่สมบูรณ์แบบ มีความเป็นมืออาชีพ และพร้อมที่จะเผยแพร่

Generative AI ไม่ได้เป็นเพียงแค่เทคโนโลยีแห่งอนาคตอีกต่อไปแล้ว แต่ได้กลายเป็นเครื่องมือที่เข้าถึงได้ง่ายและมีประสิทธิภาพมหาศาลในการสร้างสรรค์สื่อวิดีโอและเสียง ไม่ว่าคุณจะเป็นผู้ผลิตคอนเทนต์มืออาชีพ นักการตลาด หรือเพียงผู้ที่ต้องการเล่าเรื่องราวที่น่าสนใจ AI เหล่านี้คือเครื่องมืออันทรงพลังที่จะช่วยให้ความคิดสร้างสรรค์ของคุณกลายเป็นจริงได้อย่างรวดเร็ว มีคุณภาพ และมีประสิทธิภาพที่เหนือกว่าเดิม

หมายเหตุ :

OKMD Career Bootcamp 2025 Season 2

สามารถชม Live ย้อนหลังหรือทบทวนบทเรียนได้ที่ :

ครั้งที่ 1 AI Image : https://www.youtube.com/watch?v=Uut7TA1My3k&t=14s

ครั้งที่ 2 AI Media : https://www.youtube.com/watch?v=NLiLvAk5Ung

ครั้งที่ 3 Digital Ethics & Laws : https://www.youtube.com/watch?v=-Sc2eAQyYEM