เจาะลึก Gemini AI 1.5 Pro โมเดลภาษา AI ใหม่ล่าสุดจาก Google

ในยุคปัจจุบัน เทคโนโลยีปัญญาประดิษฐ์ (AI) พัฒนารุดหน้าอย่างรวดเร็ว โดยหนึ่งใน AI ที่น่าจับตามองที่สุดในตอนนี้คือ Gemini AI หรือ AI ที่พัฒนาโดย Google ดังจะเห็นได้จากล่าสุด ในเดือนกุมภาพันธ์ 2024 ที่ผ่านมา Google ได้เปิดตัวเวอร์ชันใหม่ Gemini 1.5 Pro ซึ่งต่อยอดจาก Gemini 1.0 โดย AI ตัวนี้ได้รับการขนานนามว่าล้ำหน้ากว่าโมเดลอื่น ๆ ถึงขั้นมีการเปิดเผยว่า ความสามารถของ Gemini 1.5 Pro เหนือชั้นมากจนสามารถเอาชนะ GPT-4 แทบทุกการทดสอบ!

Gemini AI มีหลักการทำงานอย่างไร รวมถึง Gemini 1.5 Pro จะแตกต่างจากเวอร์ชันเดิมมากน้อยแค่ไหน เราจะขอพาทุกคนไปเจาะลึกทุกเรื่องที่ควรรู้พร้อมกัน!

Google Gemini AI เครื่องมือโมเดลภาษาที่กำลังมาแรงตอนนี้

ทำความรู้จัก Gemini AI คืออะไร?

ก่อนจะไปถึง Gemini 1.5 Pro เราขอพาทุกคนย้อนมาทำความรู้จัก Gemini AI กันก่อน

Gemini AI คือ โมเดลภาษาขนาดใหญ่ที่พัฒนาโดย Google AI เปิดตัวครั้งแรกในเดือนธันวาคม 2023 ในชื่อของ Gemini 1.0 ซึ่ง AI ตัวนี้เป็นโมเดลต่อเนื่องหลายรูปแบบ (MFM: Multimodal AI ) หมายความว่าสามารถประมวลผลข้อมูลได้มากกว่าหนึ่งประเภทในเวลาเดียวกัน เช่น ข้อความ รูปภาพ และวิดีโอ

 

Gemini 1.0  มีหลักการทำงานอย่างไร?

Gemini 1.0 ใช้โมเดลภาษาขนาดใหญ่ PaLM (Pathway Language Model) ซึ่งจะประกอบด้วยองค์ประกอบหลัก 3 ประการ

  1.   Transformer: เป็นโมเดลประสาทเทียมที่ใช้สำหรับประมวลผลภาษาธรรมชาติ ทำหน้าที่แปลงลำดับคำที่ผู้ใช้ป้อนเข้าไป (Input) ให้เป็นลำดับคำที่จะแสดง (Output)
  2.   Sparse Attention: กลไกที่ช่วยให้โมเดลจดจ่อกับส่วนที่สำคัญที่สุดของ input ช่วยให้ประมวลผลข้อมูลได้อย่างมีประสิทธิภาพ
  3.   Pathway System: ระบบที่ช่วยให้โมเดลเรียนรู้จากข้อมูลหลากหลายประเภท

Gemini 1.0 ทำงานโดยใช้ Transformer แปลง Input ให้เป็น Output ซึ่งจะใช้ Sparse Attention จดจ่อกับส่วนที่สำคัญ และใช้ Pathway System เรียนรู้จากข้อมูลที่หลากหลาย ทำให้สามารถประมวลผลข้อมูลได้ทั้งข้อความ รูปภาพ และวิดีโอ อีกทั้งยังมีความเข้าใจและสร้างข้อความได้ลึกซึ้งและแม่นยำ ทั้งในแง่ของการแปลภาษา เขียนเนื้อหาสร้างสรรค์ ตอบคำถาม โดยประมวลผลข้อมูลทุกอย่างรวดเร็วภายในไม่กี่วินาที

 

Gemini 1.0  มีรุ่นไหนบ้าง?

Gemini 1.0 พัฒนาออกมาด้วยกัน 3 รุ่น

  • Gemini Nano: รุ่นฟรี เหมาะสำหรับการใช้งานทั่วไป เช่น การแปลภาษา การเขียนอีเมล
  • Gemini Pro: รุ่นเสียเงิน เหมาะสำหรับการใช้งานมืออาชีพ เช่น การเขียนบทความ การวิเคราะห์ข้อมูล
  • Gemini Ultra: รุ่นสำหรับองค์กร เหมาะสำหรับการใช้งานที่ต้องการประสิทธิภาพสูง เช่น การสร้างแชตบอต (Chatbot) การพัฒนาโมเดล AI

 

จุดเด่นของ Gemini 1.0

  • เป็นโมเดลภาษาต่อเนื่องหลายรูปแบบ (MFM): Gemini 1.0 สามารถประมวลผลข้อมูลได้หลากหลายรูปแบบ ช่วยให้เข้าใจและสร้างข้อความ แปลภาษา เขียนเนื้อหาสร้างสรรค์ประเภทต่าง ๆ และตอบคำถามที่ป้อนเข้าไปอย่างมีข้อมูลและสมเหตุสมผล
  • ได้รับการเทรนนิงเกี่ยวกับชุดข้อมูลขนาดใหญ่:  ช่วยให้สามารถเข้าใจและสร้างข้อความได้อย่างลึกซึ้งและแม่นยำ
  • มีโมเดลภาษาที่ล้ำสมัย: ใช้โมเดล PaLM (Pathway Language Model) ช่วยให้ประมวลผลข้อมูลได้อย่างรวดเร็วและมีประสิทธิภาพ
  • สร้างโค้ดคุณภาพสูงได้: Gemini AI สามารถใช้เพื่อสร้างโค้ดคุณภาพสูงในภาษาโปรแกรมหลัก ๆ เช่น Python, Java, C++ และ Go

 

ข้อจำกัดของ Gemini 1.0

แม้ Gemini 1.0 จะเป็นโมเดลภาษาขนาดใหญ่ที่ได้ชื่อว่าก้าวล้ำมากกว่า AI ตัวอื่น ๆ ทว่า โมเดลตัวนี้ก็ยังมีข้อจำกัดอยู่เช่นกัน

  • ยังอยู่ในช่วงพัฒนา: ฟีเจอร์และความสามารถของ Gemini 1.0 อาจไม่สมบูรณ์ ทำให้อาจมีการทำงานผิดพลาด หรือผลลัพธ์ไม่ถูกต้อง 100%
  • มีอคติ: ข้อมูลที่แสดงผลบางครั้งอาจมีอคติได้ ไม่ว่าจะเป็นในแง่ของเนื้อหาที่ไม่เหมาะสม ผิดกฎหมาย หรือล่วงละเมิด ซึ่งทาง Google ก็กำลังพัฒนาในส่วนนี้ เพื่อให้คำตอบที่แสดงปราศจากอคติให้ได้มากที่สุด
  • มีค่าใช้จ่าย: สำหรับ Gemini รุ่น Pro และ Ultra อาจมีค่าใช้จ่ายค่อนข้างสูง ตามฟีเจอร์ที่พัฒนาให้ตอบโจทย์ผู้ใช้
  • ความเป็นส่วนตัว: Gemini 1.0 อาจมีการนำข้อมูลของผู้ใช้ไปรวบรวมเพื่อพัฒนาโมเดล ซึ่งมีความเสี่ยงต่อการละเมิดความเป็นส่วนตัวได้
  • ความเข้าใจภาษาไทย: Gemini 1.0 ยังอยู่ในช่วงพัฒนา ทำให้อาจยังไม่สามารถมอบผลลัพธ์ภาษาไทยได้อย่างมีประสิทธิภาพและมีรายละเอียดชัดเจนมากนัก ก่อนนำผลลัพธ์ไปใช้งานต่อ ผู้ใช้ยังจำเป็นต้องปรับเนื้อหา และหาข้อมูลอ้างอิงที่น่าเชื่อถือเพิ่มเติม 

 

Gemini AI 1.5 Pro โมเดลภาษาตัวล่าสุดจาก Google ที่พัฒนาเพื่อทำลายข้อจำกัด!

ล่าสุด! เมื่อวันที่ 16 กุมภาพันธ์ที่ผ่านมา Google ก็ได้กลับมาอีกครั้ง พร้อมเปิดตัว Gemini 1.5 Pro โมเดลใหม่ล่าสุดที่มีความสามารถไม่แพ้ Gemini 1.0 ทว่า เวอร์ชันนี้ ดีงามมากกว่านั้น เพราะ Google ได้พัฒนาให้ทำลายข้อจำกัด ทั้งในแง่ของการประมวลผลน้อยกว่า และรองรับ Input ได้มากกว่า 1 ล้านโทเคน!

 

Gemini AI 1.5 Pro มีหลักการทำงานอย่างไร?

Gemini 1.5 Pro จะทำงานบนโมเดลที่เรียกว่า Mixture-of-Experts (MoE) ซึ่งประกอบด้วยเครือข่าย neural network ขนาดเล็กจำนวนมาก แต่ละเครือข่ายมีความเชี่ยวชาญเฉพาะด้าน และเมื่อใช้งาน Gemini 1.5 Pro จะเลือกเครือข่ายที่เกี่ยวข้องกับงานนั้น ๆ มาทำงานร่วมกัน ซึ่ง MoE จะช่วยให้ Gemini 1.5 Pro ทำงานได้อย่างมีประสิทธิภาพ แม่นยำ และประหยัดพลังงาน

ตัวอย่างเช่น

  • เขียนบทความ: Gemini 1.5 Pro จะเลือกเครือข่ายที่เชี่ยวชาญด้านภาษา ไวยากรณ์ และความรู้ทั่วไป
  • แปลภาษา: Gemini 1.5 Pro จะเลือกเครือข่ายที่เชี่ยวชาญด้านภาษา วัฒนธรรม และบริบท
  • ตอบคำถาม: Gemini 1.5 Pro จะเลือกเครือข่ายที่เชี่ยวชาญด้านค้นคว้าข้อมูล สรุปประเด็นสำคัญ และตอบคำถาม

นอกจากนี้ Gemini 1.5 Pro ยังใช้เทคนิคอื่น ๆ ในการประมวลผล เช่น

  • Self-attention: ช่วยให้โมเดลเข้าใจความสัมพันธ์ระหว่างคำในประโยค
  • Transformer: ช่วยให้โมเดลประมวลผลข้อมูลได้ยาวนาน
  • Pretraining: ช่วยให้โมเดลเรียนรู้จากข้อมูลจำนวนมหาศาล

Gemini AI 1.5 Pro มีรุ่นไหนบ้าง?

Gemini AI 1.5 Pro ตอนนี้พัฒนาออกมาทั้งหมด 3 รุ่น ซึ่งแต่ละรุ่นกำลังอยู่ในช่วงทดสอบและคาดว่าจะมีค่าใช้จ่ายทั้งหมด

  1.   Standard: รุ่นพื้นฐาน เหมาะสำหรับการใช้งานทั่วไป เช่น การเขียนบทความ แปลภาษา ตอบคำถาม สรุปข้อมูล
  2.   Enterprise: รุ่นสำหรับองค์กร เหมาะสำหรับงานที่ต้องการความเร็ว ประสิทธิภาพ และความปลอดภัย เช่น การวิเคราะห์ข้อมูล การสร้างแชตบอต (Chatbot) 
  3.   Custom: รุ่นที่ปรับแต่งตามความต้องการ เหมาะสำหรับงานเฉพาะ เช่น การพัฒนาโมเดล AI

 

ความสามารถของ Gemini 1.5 Pro

ด้วยความที่รองรับ Input ได้มากกว่า 1 ล้านโทเคน! จึงทำให้เวอร์ชันนี้รองรับการใช้งานในด้านต่าง ๆ ได้มีประสิทธิภาพมากขึ้น เช่น

  • ประมวลผลข้อมูลมหาศาลได้ในคราวเดียว โดยหากเปรียบเทียบ 1 ล้านโทเคน เปรียบได้กับการประมวลไฟล์วิดีโอยาว 1 ชั่วโมง ไฟล์เสียงความยาว 11 ชั่วโมง Source Code มากกว่า 3 หมื่นบรรทัด และบทความมากกว่า 7 แสนคำ
  • อัปโหลดได้หลายไฟล์และตอบได้หลากหลายคำถามในครั้งเดียว
  • เข้าใจโค้ดทั้งหมดด้วยการอัปโหลดจาก Computer หรือ Google Drive ได้อย่างรวดเร็ว
  • เข้าใจวิดีโอได้สูงสุด 1 ชั่วโมง โดย Gemini 1.5 Pro จะแบ่งวิดีโอออกเป็นพัน ๆ เฟรม (โดยไม่มีเสียง) จากนั้นเราสามารถถาม Gemini ในเชิงเหตุผลหรือรายละเอียดในวิดีโอได้
  • ให้เหตุผลที่ซับซ้อนสำหรับข้อมูลขนาดใหญ่ โดย Google ได้ทดสอบผ่านการใช้ Gemini 1.5 Pro อ่านเอกสาร PDF กว่า 1,000 หน้า แล้วถามฉากต่าง ๆ อีกทั้งยังทดสอบด้วยการให้วิเคราะห์ข้อมูลบทสนทนาในภารกิจ Apollo 11 จำนวน 402 หน้า ซึ่ง Gemini 1.5 Pro ก็สามารถตอบคำถามต่าง ๆ ได้อย่างถูกต้อง

 

เปรียบเทียบความแตกต่างของ Gemini AI 1.0 และ Gemini 1.5 Pro

 Gemini 1.5 Pro เป็นโมเดลที่พัฒนาต่อยอดมาจาก Gemini AI 1.0 ให้มีประสิทธิภาพมากกว่า ซึ่งจะเห็นถึงความแตกต่างจากตามตารางเปรียบเทียบด้านล่างนี้

 

    คุณสมบัติ          

       Gemini 1.0         

 Gemini 1.5 Pro 

พารามิเตอร์

137 พันล้านตัว

1 ล้านล้านตัว

สถาปัตยกรรม

Transformer

MoE

ความเร็ว

ปานกลาง

เร็ว

ความแม่นยำ

ปานกลาง

สูง

ประสิทธิภาพ

ปานกลาง

สูง

ความปลอดภัย

ปานกลาง

สูง

รูปแบบ

Nano, Pro, Ultra

Standard, Enterprise, Custom

การเข้าถึง

จำกัด

เข้าถึงได้

ราคา

Nano ฟรี

Pro, Ultra มีค่าใช้จ่าย

มีค่าใช้จ่ายทุกรุ่น

สถานะ

เปิดให้ใช้งาน

อยู่ในระหว่างการทดสอบ

Gemini 1.5 Pro เปิดให้ใช้งานเมื่อไร?

Gemini 1.5 Pro ยังไม่ได้เปิดให้ใช้งานทั่วไปอย่างเป็นทางการ เนื่องจากยังเป็นโมเดลที่อยู่ระหว่างการทดสอบ อย่างไรก็ดี ตอนนี้ ผู้ใช้สามารถใช้งานเวอร์ชัน 128,000 โทเคนไปก่อนได้ ส่วนเวอร์ชัน 1 ล้านโทเคนยังต้องรอกันต่อไป โดยหาก Google มีการอัปเดตเมื่อไร เราจะรีบนำข้อมูลมาอัปเดตให้คุณผู้อ่านทันที!

 

สรุป

Gemini AI เป็นบริการจาก Google ที่กำลังมีบทบาทมากขึ้นในทุกอุตสาหกรรมของโลกดิจิทัล ณ ขณะนี้ ซึ่งก็ต้องมาติดตามกันต่อว่าหาก Gemini 1.5 Pro เปิดใช้งานจริง จะมีประสิทธิภาพมากน้อยแค่ไหน และจะสามารถตอบโจทย์ผู้ใช้งานได้จริงเหมือนที่ Google เผยไว้หรือเปล่า

ก่อนจะไปถึงเวลานั้น คุณเองก็สามารถยกระดับธุรกิจด้วยโมเดลภาษา AI ที่เปิดให้ใช้งานอยู่ตอนนี้ได้! แต่ถ้าไม่รู้จะเริ่มต้นอย่างไรก็สามารถติดต่อ Primal Digital Agency ของเราได้เลย เราคือเอเจนซีรับทำการตลาดดิจิทัลหรือรับทำการตลาดออนไลน์ชั้นนำที่พร้อมปรับกลยุทธ์การตลาดให้สอดคล้องกับเทรนด์และธุรกิจของคุณมากที่สุด รับรองว่าธุรกิจของคุณจะเติบโตไปพร้อมกับการพัฒนาของ AI แน่นอน!