บทความโดย : รศ.ดร.ธนชาติ นุ่มนนท์ ผู้อำนวยการ สถาบันไอเอ็มซี
ในช่วงปีที่ผ่านมา วิวัฒนาการของ AI โดยเฉพาะ Generative AI ได้พัฒนาอย่างก้าวกระโดดและน่าประทับใจ และบริษัทเทคโนโลยีรายใหญ่ต่างก็เร่งพัฒนาโมเดล AI ใหม่ๆ ออกมาแข่งกัน จนผู้ใช้เองก็ปรับตัวไม่ทัน
พัฒนาการของโมเดล AI ต่างๆ ที่ออกมาทำให้เราสามารถใช้ในการเขียนบทความต่างๆ ได้ดียิ่งขึ้นจนเริ่มแยกแยะได้ยากว่าเนื้อหาเขียนด้วย AI หรือคน แม้แต่ภาษาไทยก็เก่งขึ้นเรื่อยๆ รวมถึงการเขียนโปรแกรมก็พบว่าโมเดลต่างๆ มีความสามารถมากขึ้นอย่างน่าประหลาดใจ จนทำได้ดีกว่าโปรแกรมเมอร์ระดับพื้นฐาน
นอกจากนี้เมื่อต้นปีที่เรายังเห็นโมเดลเหล่านี้มีความสามารถได้เพียงแค่เรื่องของการสร้างเนื้อหาเป็นภาษาต่างๆ หรือรูปภาพ ก็กลายเป็นว่ากลางปีเราเริ่มเห็นความสามารถของโมเดลอย่าง ChatGPT ที่เริ่มพูดคุยกับเราได้เป็นภาษาไทย แม้ช่วงแรกๆ สำเนียงอาจจะเสมือนคนต่างชาติพูดภาษาไทย แต่หลังจากนั้นอีกไม่กี่เดือนเขาก็สามารถสนทนากับเราเป็นภาษาไทยได้อย่างปกติ และโต้ตอบเสมือนคนทั่วไปคุยกัน
ล่าสุดเมื่อสัปดาห์ที่ผ่านมามีโมเดล AI ใหม่อย่าง Sora ที่สามารถสร้างภาพวิดีโอเสมือนจริง รวมถึงการที่โมเดล AI ต่างๆ อย่าง ChatGPT หรือ Gemini มีฟังก์ชันให้ใช้กล้องบนโทรศัพท์มือถือวิเคราะห์ภาพต่างๆ แบบเรียลไทม์พร้อมการสนทนากับเรา ตอบคำถามในสิ่งที่เขามองเห็นได้ ผมได้ทดลองกับภาพกระดานหมากรุกสากลแล้วขอคำแนะนำในการเล่น AI ก็สามารถที่จะตอบได้ดีในระดับหนึ่ง
บริษัทเทคโนโลยีรายใหญ่ต่างๆ ยังคงมุ่งมั่นพัฒนาโมเดล AI อย่างต่อเนื่อง และในปีหน้าคาดว่าจะมีบทบาทสำคัญในการเปลี่ยนแปลงรูปแบบการทำงาน เช่น การใช้ AI ช่วยวางแผนการทำงานที่ซับซ้อนในองค์กร การทำงานร่วมกับเครื่องมือ AI ต่างๆ และการนำ AI มาใช้ในชีวิตประจำวัน เช่น การพัฒนาผู้ช่วยเสมือนที่สามารถตอบสนองคำสั่งได้รวดเร็วและแม่นยำมากขึ้น
สำหรับการวิเคราะห์แนวโน้มของ Generative AI ในปีหน้า ผมเลือกที่จะทดลองใช้โมเดล Gemini Advanced Pro 1.5 ซึ่งเป็นเครื่องมือที่เพิ่งเปิดตัวล่าสุด มีความสามารถในการค้นคว้าและสรุปข้อมูลได้อย่างมีประสิทธิภาพ ซึ่ง Gemini ก็ได้ทำการค้นข้อมูลจากเว็บไซต์ต่างๆ แล้วทำการคาดการณ์พัฒนาการเทคโนโลยีด้าน Generative AI สำหรับปี 2025 โดยประกอบไปด้วย 10 ด้าน ดังนี้
- Edge AI: Generative AI จะถูกผสานรวมเข้ากับการประมวลผลที่ปลายทาง (Edge Computing) มากขึ้น ทำให้อุปกรณ์อย่างกล้องอัจฉริยะและเซ็นเซอร์ต่างๆ สามารถจัดการงานที่ซับซ้อนภายในอุปกรณ์ ซึ่งจะส่งผลกระทบอย่างมากต่ออุตสาหกรรม เช่น การแพทย์ การผลิต การค้าปลีก และยานยนต์
- AI as a service (AIaaS) models: ธุรกิจต่างๆ กำลังนำบริการ AIaaS บน Cloud computing มาใช้มากขึ้นเพื่อเข้าถึงศักยภาพ AI ขั้นสูงโดยไม่ต้องลงทุนในโครงสร้างพื้นฐานจำนวนมาก
- การผสานกับโลกเสมือนและความเป็นจริงเสริม (AR/VR): คาดว่าแชทบอทที่ขับเคลื่อนด้วย Generative AI จะผสานเข้ากับเทคโนโลยี AR/VR เพื่อเพิ่มความสมจริงและสร้างปฏิสัมพันธ์กับลูกค้าได้ดียิ่งขึ้น
- Multimodal AI models: Generative AI กำลังก้าวหน้าอย่างรวดเร็วในการจัดการรูปแบบอินพุตและเอาต์พุตหลายแบบ เช่น ข้อความ รูปภาพ เสียง และวิดีโอ ทำให้เครื่องมือ AI มีความหลากหลายมากขึ้น
- การสร้างข้อมูลสังเคราะห์ (Synthetic Data Generation): การใช้ Generative AI เพื่อสร้างข้อมูลสังเคราะห์จะเพิ่มขึ้นอย่างมาก โดยเฉพาะในระบบที่ข้อมูลจริงมีราคาแพง หาได้ยาก หรือถูกจำกัดด้วยข้อกำหนดด้านความเป็นส่วนตัว การใช้ข้อมูลสังเคราะห์ในการสร้างโมเดลจะช่วยให้องค์กรสามารถจำลองสภาพแวดล้อมและค้นหาโอกาสในการพัฒนาผลิตภัณฑ์ใหม่ๆ ได้ โดยเฉพาะในอุตสาหกรรมที่มีกฎระเบียบเข้มงวด อีกทั้งยังช่วยในการสร้างต้นแบบซอฟต์แวร์และประสบการณ์ดิจิทัลได้อย่างรวดเร็ว
- การใช้งานแบบเรียลไทม์ (Real-time Applications): เครื่องมือ Generative AI มีความสามารถมากขึ้นในการจัดการแอปพลิเคชันแบบเรียลไทม์ เช่น การสร้างเนื้อหาในระหว่างการสนทนาสด และการสร้างภาพที่ปรับแต่งได้ทันที
- AI Modeling as a Service (AIMaaS): AIMaaS คาดว่าจะเติบโตอย่างมาก โดยมีผู้ให้บริการ AI เสนอโมเดลแบบเปิดและปรับแต่งได้ตามความต้องการของผู้ใช้หลากหลายประเภท
- การประยุกต์ในด้านเสียง (Applications in Audio): Generative AI กำลังเปลี่ยนแปลงโลกสร้างสรรค์โดยการสร้างงานศิลปะ งานประพันธ์ดนตรี มีการนำมาใช้ในการสังเคราะห์เสียง การสร้างดนตรีตามความต้องการ
- การพัฒนาผลิตภัณฑ์ (Product Development): Generative AI จะช่วยให้องค์กรสร้างผลิตภัณฑ์ใหม่ๆ ได้เร็วขึ้น เช่น ยาใหม่ ผลิตภัณฑ์ทำความสะอาดที่ปลอดภัยกว่า รสชาติและกลิ่นใหม่ๆ โลหะผสมใหม่ และการวินิจฉัยโรคที่เร็วและแม่นยำยิ่งขึ้น
- การประยุกต์ในด้านวิดีโอ (Video Applications): Generative AI ถูกนำไปใช้ในแอปพลิเคชันวิดีโอหลากหลาย เช่น การตัดต่อวิดีโอ เทคนิคพิเศษ การพัฒนาโลกเสมือน และการประชุมผ่านวิดีโอ ตัวอย่างเช่น สามารถช่วยในการทำให้ภาพดูอ่อนวัยหรือสูงวัย สร้างเอฟเฟกต์เสมือน และการซิงค์ปากหรือพากย์เสียงในกระบวนการหลังการผลิตวิดีโอ
การคาดการณ์เหล่านี้แสดงให้เห็นถึงศักยภาพของ Generative AI ที่จะมีการพัฒนาให้มีความสามารถยิ่งขึ้นในหลากหลายด้าน การที่ AI มีบทบาทมากขึ้นในชีวิตประจำวันจะทำให้ผู้คนและองค์กรต่างๆ ต้องปรับตัวอย่างมาก พร้อมทั้งสร้างโอกาสใหม่ๆ ที่ไม่เคยมีมาก่อน เพื่อให้คนทำงานได้ในโลกที่กำลังเปลี่ยนแปลงไปอย่างรวดเร็ว