Generative AI หรือ GenAI คืออะไร? มันดียังไง? เป็นอันเดียวกันกับ ChatGPT รึเปล่า? จะเริ่มใช้ยังไงดี? แล้วมันต่างกับ AI ปกติยังไง?
เต็มไปด้วยความงงและสงสัย เหล่านี้คือคำถามที่ผมได้ยินมาครับ จริงๆต้องบอกว่า GenAI หรือชื่อเต็ม Generative AI เนี่ยมันก็ถูกพูดถึงกันมาสักพักนึง แต่ว่าไอคำถามข้างต้นเนี่ยก็ยังเป็นสิ่งที่ผมได้ยินมาอยู่เรื่อยๆครับ
ดังนั้นบทความนี้ผมเลยอยากจะมาเล่าเกี่ยวกับ GenAI ในแบบพื้นฐานสุดๆ พร้อมกับแนะนำ 5 เครื่องมือ GenAI ที่น่าจะทำให้ชีวิตของท่านผู้อ่านสบายขึ้นอย่างมหาศาลครับ
เอาล่ะ ลุยกันเลยยยยยยย
Generative AI คืออะไร?
เอาล่ะครับ มาเริ่มปูพื้นกันแบบพื้นฐานสุดๆเลยละกันครับ Generative AI คืออะไร? เอาแบบง่ายๆเลยครับมันคือคำว่า Generate + AI งั้นผมเลยจะขอเริ่มเล่าจากคำว่า AI ก่อนละกัน (เอ้าทำไมไม่เล่าจาก Generate เล่าาาาา)

คำว่า AI เนี่ยมันย่อมาจาก Artificial Intelligence ครับ แปลเป็นไทยว่า ปัญญาประดิษฐ์ (ซึ่งแปลไทยแล้วก็งงมาก) อธิบายง่ายๆเลยมันคือการที่เราพยายามเลียนแบบ “ปัญญา” หรือ “ความฉลาด” ของมนุษย์ ด้วยการ “ประดิษฐ์” หรือ “สร้าง” ขึ้นมาครับ
ซึ่งไอวิธีการสร้าง AI เนี่ยส่วนใหญ่มันก็เป็นการว่าด้วยตัวเลข หรือ สถิติต่างๆที่เราก็คืนครูไปตั้งแต่ ป.4 เพราะฉะนั้นผมจะข้ามไปนะครับ
ทีนี้เรากลับมาที่ Generative AI มันก็คือการพยายามจะเลียนแบบความฉลาดของมนุษย์ในด้านของการ Generate หรือ การสร้างอะไรสักอย่างขึ้นมานั่นละครับ
หรือจะสรุปง่ายๆว่า Generative AI คือ AI ที่มีหน้าที่ในการสร้างสิ่งใหม่ๆขึ้นมาโดยที่มันจะใช้ข้อมูลบางอย่างที่เคยมีในอดีตมาฝึกฝนตัวมันครับ
สร้างอะไรได้บ้าง? ก็เป็นคำถามต่อมาใช่มั้ยละครับ ผมเลยจะขอเล่าถึงประเภทของ Generative AI ต่อเลยละกันนะครับ
Generative AI มีกี่ประเภท?
500 ล้านประเภทครับ ล้อเล่น จริงๆก็มีอยู่หลากหลายประเภททีเดียวครับแต่ผมอาจจะขอยกตัวอย่างสัก 4 ประเภทที่ท่านผู้อ่านน่าจะได้ผ่านหูผ่านตากันมาบ้างละกันนะครับ
Text Generation (ประเภทสร้างข้อความ) – GenAI ประเภทนี้น่าจะเป็น 1 ในประเภทที่เราคุ้นๆกันที่สุดครับ เพราะ 1 ในตัวอย่างของ GenAI ประเภทสร้างข้อความ ก็คือ ChatGPT ครับ

หน้าที่หลักๆเลยก็คือการที่มันจะสร้างตัวอักษร หรือ ข้อความ จากคำสั่งที่เราสั่งลงไปครับ ไม่ว่าจะ เขียนบทความ, แต่งกลอน, แก้ Grammar, เขียน Email,เขียน Status อกหักลง Facebook, แต่งเพลงไปง้อแฟน หรือ อีกมากมาย เหล่านี้เจ้า GenAI ประเภท Text Generation ก็สามารถทำได้หมดครับ
Image Generation (ประเภทสร้างรูปภาพ) – อีก 1 ประเภทยอดฮิต ซึ่งแน่นอนว่าหลายๆคนก็น่าจะเคยผ่านตาอีกเช่นกัน เพราะเป็น 1 ใน GenAI ที่มีดราม่าบ่อยม้ากกกกกกกกก เช่น พระเล่นคอนเสิร์ต Rock หรือ ข่าวปลอมรูปปลอมต่างๆ ที่เกิดจาก AI ก็ล้วนแต่ดังเป็นพลุแตกมาแล้วทั้งสิ้น

Generative AI ประเภท Image Generation ก็เหมือนก่อนหน้านี้เลยครับ คือ มันจะสร้างรูปภาพตามคำสั่งต่างๆที่เราส่งไปครับ เช่น นางแบบ, นายแบบ, บ้านในฝัน, หมาแต่งตัวเป็นต้นไม้, หนังเรื่อง Harry Potter แต่ถูกสร้างในปี 60 หรือ อะไรก็ตามที่สมองเราจะนึกถึง แล้วใจเราจะปรารถนา ซึ่งโปรแกรมที่ฮิตๆกันก็คือ Midjourney ครับ
Voice Generation (ประเภทสร้างเสียง) – จริงๆแล้ว GenAI ประเภทนี้ดูเป็นสิ่งที่เกิดขึ้นมานานแล้วเพราะเราอาจจะรู้จักกันในอีกชื่อคือ Text-to-Speech (TTS) ที่ไม่ว่าเราจะพิมพ์อะไรไปก็ตามตัวระบบหรือโปรแกรมก็จะตอบเรากลับมาเป็นเสียงหรือคำพูดตามที่เราต้องการ

แต่ในยุคของ Generative AI เจ้าโมเดล TTS รูปแบบเดิมถูกยกระดับไปอีกขั้น เพราะเสียงที่ถูกสร้างขึ้นมาไม่ได้เป็นเพียงแค่เสียงทั่วไป หรือ เสียงที่ระบบมีให้อีกต่อไปแล้ว เพราะในปัจจุบันเทคโนโลยีก้าวไปถึงขั้นที่ว่า เพียงแค่เรามีเสียงที่เราอยากได้ เช่นเสียงดารา หรือ เสียงตัวเราเอง ส่งเข้าไปให้ AI ฟัง หลังจากนั้น AI จะทำการเรียนรู้เสียงเหล่านั้น และ สร้างเสียงตามคำสั่งเราในรูปแบบของเสียงที่เราส่งเข้าไป
พี่ตูน Bodyslam ร้องเพลงช้าง, อดีตนายกร้องเพลง Silly Fools หรือ แม้กระทั่งตัวคุณเองพูดภาษาตุรกี ทุกอย่างเป็นไปได้แล้วเพียงแค่จ่ายเงิน ถถถถถถถถถถ
Video Generation (ประเภทสร้างวีดิโอ) – ประเภทนี้แหละครับ เร้าใจสุด ว้าวสุด เสี่ยงสุด อันตรายสุดๆเช่นกัน ยังคงการทำงานรูปแบบเดิมครับคือ เมื่อเราป้อนคำสั่งใดๆเข้าไประบบก็จะสร้างวีดิโอตามคำสั่งให้เราครับ

จริงๆต้องบอกว่าการสร้างวีดิโอนับว่าเป็นงานที่ยากมากของ GenAI เพราะมีความซับซ้อนเป็นอย่างมากในแง่ของการสร้างวีดิโอที่ต่อเนื่องกัน แล้วมีการขยับที่มันสมจริงมากที่สุด
ต้องบอกว่าก่อนหน้านี้เทคโนโลยี GenAI ประเภทนี้ก็เป็นอีกประเภทที่มีการพัฒนาไปอย่างรวดเร็วมากครับ ก่อนหน้านี้สัก 6 เดือน เราอาจจะสร้างวีดิโอได้ยาวประมาณ 2 – 3 วินาที แต่ปัจจุบันนี้เริ่มมี GenAI ล้ำๆอย่าง Sora เปิดตัวออกมาที่สร้างวีดิโอได้ค่อนข้างนาน และสมจริงอย่างมากจนเริ่มมีการทดลองไปทำเป็นหนังสั้นเรียบร้อยแล้ว
Generative AI ถูกสร้างมาอย่างไร?
โอเคตื่นเต้นมาก อยากมี Generative AI เป็นของตัวเอง อยากสร้างไว้ให้แมวที่บ้านเล่นบ้างต้องทำอย่างไร ผมเลยขอแนะนำวิธีการง่ายๆ เพื่อจะทำให้ทุกท่านเข้าใจที่มาที่ไปและธรรมชาติของ GenAI เพิ่มขึ้นผ่าน 4 ขั้นตอนดังนี้ครับ
อ้อ แต่จริงๆ GenAI แต่ละประเภทก็มีรายละเอียดยิบย่อยที่แตกต่างกันไปนะครับแต่ผมขอแนะนำเป็นภาพรวมๆ เป็นหลักครับ
1.เก็บและคัดเลือก Data – ย้อนกลับไปที่อะไรคือ Generative AI บางท่านอาจจะพอเห็นว่า ผมมีการเขียนคำว่า “ข้อมูลบางอย่างที่เคยมีในอดีตมาฝึกฝน” นี่แหละครับคือสิ่งที่เราต้องเก็บและเอามาแยก

สมมุตในกรณีของข้อความ หรือ Text Generation เราก็จำเป็นจะต้องมีข้อมูลประเภทตัวอักษรต่างๆที่เอามาให้ GenAI เรียนรู้หรือฝึกฝนครับ เช่น งานเอกสารต่างๆ , ข้อมูลบนเว็บไซต์ , รีวิวเกี่ยวกับเรื่องนู้นเรื่องนี้ , บทความงานเขียนต่างๆ และ อื่นๆอีกมากมาย ซึ่งไอเหล่านี้แหละมันจะถูกนำไปใช้งานในการสร้าง GenAI ครับ
แน่นอนว่าไม่ใช่ทุก Data ที่จะสามารถใช้งานได้ เพราะว่าบางข้อมูลก็ถูกเก็บไว้ในรูปแบบที่เอามาใช้งานได้ยาก มีลิขสิทธิ์ หรือ แม้กระทั่งข้อมูลบางประเภทเราก็ไม่ควรจะเอามาใช้งาน เช่น ข่าวปลอม หรือ ข้อมูลที่เต็มไปด้วย Bias ต่างๆอย่างข้อความเหยียดสีผิว หรือ ชาติพันธุ์เป็นต้นครับ
2.เลือกและฝึกฝน Model – เพราะ Generative AI แต่ละประเภทนั้นก็ทำงานแตกต่างกันออกไป ดังนั้น Model แต่ละตัวที่จะใช้ฝึกฝนเพื่อต่อยอดไปเป็น GenAI แต่ละตัวก็ย่อมแตกต่างกันไป
ยกตัวอย่างเช่น ChatGPT หรือ GenAI ประเภทสร้างตัวอักษร อาจจะเลือกใช้ Transformer-Based Model ส่วนของ Midjourney หรือ GenAI ประเภทสร้างรูป จะเลือกใช้ Diffusion model เป็นต้น

ซึ่งไอความแตกต่างของตัว Model แต่ละตัวทั้งในแง่ของการทำงานและการฝึกฝน ผมอาจจะขอแยกไปอีกโพสต์นึงเลย เนื่องจากมันย๊ากกกกกส์และซับซ้อนพอประมาณ เอาเป็นว่าเราต้องเลือกและฝึกฝนให้ถูกนั่นละครับ

3.ตรวจสอบและแก้ไข Model – จริงๆระหว่างการฝึกฝนเนี่ยมันก็มีการ ตรวจสอบและแก้ไขมาแล้วระดับนึงแหละครับ แต่แน่นอนว่าสี่เท้ายังรู้พลาด นักปราชญ์ยังรู้พลั้ง จะไปคาดหวังอะไรกับโมเดลลลลลลลลลลล

เรื่องให้ตรวจสอบเพียบครับ แน่นอนว่าแตกต่างกันไปตามแต่ละประเภทครับ เช่น GenAI ประเภทสร้างภาพก็ต้องระวังว่าจะไปสร้างภาพโป๊ หรือ สร้างภาพที่ละม้ายคล้ายชาวบ้านคนใดคนหนึ่งมากเกินไปรึเปล่า
หรือ GenAI ประเภทสร้างตัวอักษร ก็ต้องระวังว่าเวลามันไปตอบคำถาม User เนี่ยมันได้แนะนำวิธีการสร้างระเบิดทำมือด้วยอุปกรณ์ที่หาซื้อได้ในร้านสะดวกซื้อรึเปล่า หรือ ข่าวปลอมต่างๆนาๆก็ต้องมาตรวจสอบและแก้ไขกันไปเรื่อยๆ บางทีก็มีการใช้เทคนิคบางอย่างมาช่วยเช่นการทำ RLHF (เดี๋ยวมาเล่าให้ฟังทีหลัง)
4.นำไปใช้งาน – ในที่สุดหลังจากเคี่ยวกรำมานาน เลือดตาแทบกระเด็น หมดทรัพยากร ไปอย่างมากมาย ใช้เงินไปอย่างมหาศาล ก็ได้เวลาปล่อยสู่ตลาดโลกซักที เย้!
โอเค เอากลับมาแก้ใหม่…
ชีวิตมันก็โหดร้ายประมาณนี้แหละครับ เพราะต้องยอมรับจริงๆว่าเมื่อ GenAI ของเราออกสู่ตลาด เราก็จะพบกับผู้ใช้งานหลากหลายสารทิศ ร้อยพ่อพันแม่ เพราะฉะนั้นเราก็จะเจอช่องโหว่มหาศาลที่ไม่คาดไว้

ChatGPT ก็เคยแจก Key เถื่อนของ Microsoft Office ให้ผู้ใช้งานมาแล้วนะครับ หรือ แม้กระทั่งการโดนทำ Prompt Injection ด้วยการไปแต่งละครให้กับ ChatGPT ฟังว่าพ่อดิฉันกำลังป่วยหนัก และจะหายดีขึ้นในทันใดถ้าเขาได้เห็น ข้อมูลเลขบัตรประชาชนของชาวอเมริกันสักคน
ChatGPT ก็ อ่ะๆ เอาปายยยยยยยยย
แล้วทั้งหมดทั้งมวลมันก็วนลูปไปเรื่อยๆ กินเงินและทรัพยากรของผู้พัฒนาไปเรื่อยๆครับ ยังอยากมี GenAI เป็นของตัวเองอยู่มั้ยครับ ฮ่าาาาา
5 เครื่องมือ GenAI น่าใช้
เอาละครับ ไหนๆก็มีหลายๆคนล้มเลิก Project การสร้าง GenAI ไว้ให้แมวใช้แล้ว ดังนั้นผมเลยขอแนะนำ 5 เครื่องมือที่น่าจะเหมาะกับทุกคนแทนแล้วกันนะครับ
เคยใช้แล้ว! นั่นเสียงใครน่ะ ใจเย็นๆก่อนขอเล่าก่อน ChatGPT เนี่ยยังไงก็ยังเป็น 1 ใน GenAI ตัวที่ผมต้องแนะนำครับ เนื่องจากความสามารถของมันช่างน่าตื่นเต้น และ น่าตื่นเต้นขึ้นทุกวันครับ

ChatGPT เป็น Generative AI ที่ทำหน้าที่หลักๆของมันก็คือ คุยกับเรา ทำตามที่เราต้องการ หาคำตอบในคำถามที่เราถาม ตอบหลายๆโจทย์ในชีวิตเรา (นี่พูดถึงคู่ชีวิตอยู่รึไงงงง)
โดยหัสเดิมแล้วเนี่ยมันก็เป็น Chat ตัวนึงที่ถามตอบเป็นตัวอักษร หรือ Text เป็นหลักครับ แต่ปัจจุบันเวลาผ่านไปไม่นาน ChatGPT ก็เริ่มสร้างรูปภาพ ทำงานกับข้อมูลต่างๆเช่น Excel, Word หรือ PDF ได้แล้วครับ

และอีกหลายๆความสามารถที่ท่านๆอาจจะไม่เคยรู้คือ เราสามารถ Run Program บางอย่างบน ChatGPT ได้ด้วยเช่นกันนะ เช่น แปลงไฟล์, แปลงรูป, สร้าง QR Code ต่างๆนาๆ
ที่สำคัญเลยคือมันฟรีครับ (แต่เวอร์ชันเสียเงินก็ล้ำขึ้นอีก)
เคยใช้อีกแล้ว! โอ้ยรู้แล้วๆ ใจเย็นๆ เผื่อว่ามีใครยังไม่เคยใช้ และอยากจะเข้าวงการ GenAI แบบสนุกมากๆด้วยการสร้างรูปภาพ ผมแนะนำ Midjourney เลยครับเนื่องจากเป็นเครื่องมือที่ใช้ค่อนข้างง่ายและที่สำคัญคือมันตอบความฝันวัยเด็กเรากันมากๆเลยครับ

เคยอยากเป็นนักวาดการ์ตูนมั้ยครับ? เคยอยากเป็นตัวละครในนารูโตะมั้ยครับ? หรือ อยากเปลี่ยนตัวเองเป็นเจ้าหญิงจัสมินจะพาพี่ฟินขี่พรมกับหนู (เห้ยนั่นเพลงแล้วโว้ยยย)
ทั้งหมดนี้ทำได้ด้วย Midjourney ด้วยแพคเกจเริ่มต้นราวๆ 600 บาทต่อเดือนก็สามารถเติมเต็มความฝันได้แล้วครับ
ในที่สุดก็ไม่เคยใช้กันใช่มั้ยละะะะะะ 1 ในปัญหาที่ชีวิตผมต้องพบเจอบ่อยมากๆก็คือการทำ Presentation หรือการทำ Slide ที่มันใช้เวลายาวนานซะเหลือเกิน แถมพอทำเสร็จเวลาเอาไปใช้งานมันก็โคตรจะสั้น (นี่มันขยะดิจิตอลชัดๆๆ)

แต่แล้วสวรรค์ก็ทรงโปรดด้วยการส่ง Generative AI สำหรับการสร้าง Presentation มา ซึ่งก็มีอยู่หลากหลายตัวเชียวแหละครับ แต่เท่าที่ลองมาผมก็ยังไม่เจอตัวไหนฉลาดเท่ากับ Gamma.app ครับ
เพียงแค่เราพิมพ์หัวข้อที่เราต้องการ หลังกจากนั้นระบบจะทำการสร้าง Presentation มาให้เราอย่างเสร็จสรรพเลยครับ และ ที่สำคัญคือ ข้อมูลที่มันสร้างมาให้เรามันดี รูปที่มันหาให้ก็ใช้งานได้ดีมาก หน้าตามันสวยงาม การจัดเรียงก็เป็นระเบียบเรียบร้อยมาก และถ้าเราไม่ชอบเราก็สามารถแก้ทุกสิ่งอย่างได้ตามใจอยาก

และที่สำคัญคือมันไม่ได้สร้างได้แต่ Presentation ครับ มันยังสร้าง Website ได้อีกด้วยและสามารถให้คนเข้าไปใช้งานได้จริงๆ สามารถให้คลิกออกไปนู่นนี่นั่นแบบล้ำๆได้เลย และนอกจากนั้น Gamma ยังสามารถสร้างรูปภาพด้วย AI เพื่อเอามาประกอบสไลด์ได้อีกด้วย จะล้ำไปไหนเนี่ย
สิริรวมความล้ำความฉลาดล้ำเลิศเนี่ยก็สามารถใช้งานฟรีๆได้ด้วยนะครับ แต่ถ้าใช้จนหมดโควต้าก็ต้องเสียตังเดือนละ 600 บาทเช่นกันครับ
สร้าง Video ด้วยการพิมพ์คำสั่งน่าจะเป็นสิ่งที่หลายๆคนถวิลหาใช่ไหมละครับ แต่ผมว่าความเจ๋งของไอ Runway.ML เนี่ยนอกจากการสร้างวีดิโอด้วยการพิมพ์คำสั่งหรือ Prompt แล้วก็คือการเปลี่ยนรูปภาพให้เป็น Video ครับ

คือไอฟังก์ชันการเปลี่ยนรูปภาพให้เป็นวีดิโอเนี่ยมันเป็นอะไรที่ล้ำมาก เพราะเราสามารถกำหนดทิศทางการขยับซ้ายขวาของวัตถุต่างๆในรูปนั้นได้ครับ
เช่นถ้าเรามีรูปน้ำลำไยอยู่ แล้วเราต้องการจะให้ลำไยเราตกจากฟ้าลงมาบนแก้ว น้ำลำไยในแก้วก็สาดกระเซ็นไปทั่วจอ (อะไรวะเนี่ยอีกแล้ว) ก็ทำได้ง่ายๆเพียงแค่อัพรูปแล้วก็เอาพู่กันลากๆกำหนดทิศทางการขยับเท่านั้นพอ

นับ 1 2 3 แล้วก็นับต่ออีกสัก 50 วินาที หลังจากนั้นก็จะได้วีดิโอที่ขยับไปขยับมาโดยใช้รูปเราเป็นสารตั้งต้นได้แล้วครับ นอกจากนั้นตัว Runway.ML ก็ยังสามารถทำฟังก์ชันอื่นๆได้อีกด้วยนะครับ เช่น สร้างเสียงด้วย Prompt , ทำ LipSync วีดิโอ, ถอดเทป หรือ Grade สีต่างๆ
เก่งๆแบบนี้มีโควต้าให้ลองเล่นฟรีอีกแล้วครับก็ลองเข้าไปทดสอบใช้งานกันดูนะครับ
ไม่ต้องเข้า RS ก็แต่งเพลงเองได้ด้วย Generative AI ตัวนี้ครับ เจ้า Suno หรือ Suno.AI เนี่ยมันเป็น GenAI ประเภทสร้างเพลงครับ
เพียงแค่เราพิมพ์เพลงที่เราต้องการลงไปพร้อมกับแนวเพลง ตัวของ Suno ก็จะสร้างเพลงขึ้นมาให้เราเลยครับ ทั้งเนื้อร้อง ทำนอง ต่างๆ เช่น เพลงค้างคาวกินกล้วยแบบแจ๊ส , แต่งเพลงให้คนอกหักแต่เอาแบบเป็นเอเลี่ยนอกหัก , เพลงประกอบหนังคาวบอยแต่เอาเป็นคาวบอยอวกาศ (Starwars นี่เอง) หรือ ต่างๆนาๆก็เชิญเล่นได้ตามสะดวก

และที่สำคัญคือเนื้อเพลงภาษาไทยก็ไม่หวั่นนะครับสามารถแต่งได้เช่นเดียวกัน เก่งๆเจ๋งๆแบบนี้แน่นอนว่า ไปทดลองใช้ฟรีก่อนได้เช่นกันครับ
เอาละครับครบแล้ว 5 เครื่องมือที่ผมเชื่อว่าน่าจะช่วยงานทุกท่านได้อย่างมหาศาล ดังนั้นก่อนที่จะหาว่าผมโม้ ซึ่งผมก็โม้มานานมากแล้ว ผมอยากให้ทุกท่านลองไปใช้งานพวก Generative AI ทั้ง 5 ตัวนี้ก่อนครับ
เพราะนอกจากความเจ๋งตามที่ผมได้เล่าไปแล้ว นี่คือวิธีการที่ง่ายที่สุดที่ทุกท่านจะได้ทำความรู้จัก และ ก้าวเข้าสู่โลกของ Generative AI แบบง่ายๆด้วยตัวเองครับ
สรุป
ทั้งหมดทั้งมวลที่ผมเล่าให้ฟังก็เป็นพื้นฐานอย่างมากเลยนะครับเกี่ยวกับ Generative AI แต่ผมเชื่อว่ายุคที่เรากำลังจะพบเจอเนี่ยมันคือยุคของ Generative AI แบบที่เราไม่สามารถหลีกเลี่ยงได้เลยครับ
ดังนั้นสิ่งที่เป็นการบ้านของมนุษย์แบบเราก็คือการทำความรู้จักและหาวิธีที่จะนำ Generative AI มาใช้งานเป็นผู้ช่วยเรานั่นเองครับ
เพราะต่อให้ Technology หรือ AI จะถูกพัฒนาไปอย่างรวดเร็ว หรือ ไกลแค่ไหนสุดท้ายแล้วคนที่จะยังเป็นคนคอยควบคุม และ ใช้งานมันก็คือมนุษย์อย่างเรานี่แหละครับ

Leave a Reply