ภาษามือถือเป็นวิธีการสื่อสารที่ซับซ้อนและมีความสำคัญอย่างยิ่งสำหรับผู้ที่มีความบกพร่องทางการได้ยิน โดยภาษามือจะใช้การเคลื่อนไหวของมือ การแสดงสีหน้า และภาษากายในการถ่ายทอดความหมาย อย่างเช่นภาษาอเมริกัน (American Sign Language) ที่เป็นตัวอย่างที่ชัดเจนถึงความซับซ้อนนี้ เนื่องจากมีโครงสร้างไวยากรณ์และรูปแบบที่เฉพาะเจาะจง
ใช่แล้ว, ภาษามือไม่ได้เป็นภาษาสากล เนื่องจากมีการใช้ภาษามือที่หลากหลายมากมายในแต่ละประเทศ และแต่ละประเทศก็มีไวยากรณ์ ศัพท์ และรูปแบบที่แตกต่างกัน นั่นจึงแสดงออกถึงความหลากหลายและความซับซ้อนของภาษามือทั่วโลก ซึ่งในบางครั้งก็ตามมาด้วยปัญหาและความยากในการแปลความหมายเช่นกัน
ดังนั้นเพื่อปรับปรุงการเข้าถึงการสื่อสารสำหรับผู้ที่มีความบกพร่องทางการได้ยิน นักวิจัยทั่วโลกจึงพยายามค้นหาวิธีการที่จะแปลงและแปลการเคลื่อนไหวของมือในภาษามือให้เป็นข้อความหรือภาษาพูด “แบบเรียลไทม์” มาโดยตลอด แต่ตลอดเวลาที่ผ่านมายังคงเป็นจุดอ่อนที่ไม่สามารถพัฒนาระบบที่เชื่อถือได้ จนกระทั่งข่าวงานวิจัยล่าสุดนี่เองที่ทีมวิจัยจากวิทยาลัยวิศวกรรมศาสตร์และวิทยาการคอมพิวเตอร์ประจำมหาวิทยาลัย Florida Atlantic ได้พัฒนาโมเดลที่มีชื่อว่า “YOLOv8” ขึ้นมา
โดยทีมวิจัยได้ดำเนินการศึกษาในลักษณะที่ไม่เคยมีมาก่อน กล่าวคือเป็นการใช้ AI ที่มุ่งเน้นไปที่การจดจำการเคลื่อนไหวของอักษรในภาษามืออเมริกันผ่านการมองเห็นด้วยคอมพิวเตอร์ ทีมงานได้สร้างชุดข้อมูลซึ่งประกอบด้วยภาพนิ่งการเคลื่อนไหวของมือถึง 29,820 ภาพ โดยใช้เครื่องมือชื่อว่า MediaPipe ในการทำเครื่องหมายแต่ละภาพด้วยจุดสำคัญ 21 จุดบนมือ ซึ่งช่วยให้สามารถเก็บข้อมูลที่ละเอียดเกี่ยวกับโครงสร้างและตำแหน่งของมือได้ ซึ่งข้อมูลการทำเครื่องหมายนี้มีบทบาทสำคัญในการเพิ่มความแม่นยำให้กับโมเดล YOLOv8 ที่นักวิจัยได้ฝึก โดยช่วยให้โมเดลสามารถตรวจจับความแตกต่างที่ละเอียดในการเคลื่อนไหวของมือได้ดีขึ้น
ผลการศึกษาของโมเดล YOLOv8 ตีพิมพ์ในวารสาร Franklin Open ของ Elsevier ที่ได้แสดงให้เห็นว่า การใช้ข้อมูลการเคลื่อนไหวของมือที่มีความละเอียดนี้ โมเดลสามารถจับภาพโครงสร้างที่ซับซ้อนของการเคลื่อนไหวในภาษามืออเมริกันได้อย่างถูกต้อง ทำให้เกิดระบบที่มีประสิทธิภาพในการจดจำการเคลื่อนไหวของอักษรในภาษามืออเมริกันด้วยความแม่นยำที่สูง แถมยังเป็นแบบเรียลไทม์ด้วย
Bader Alsharif ผู้เขียนหลักและนักศึกษาปริญญาเอกในภาควิชาวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ที่ FAU กล่าวทิ้งท้ายในงานวิจัยไว้ว่า “วิธีนี้ยังไม่เคยนำเสนอในงานวิจัยก่อนหน้ามาก่อน ดังนั้นจึงถือเป็นแนวทางใหม่ที่มีแนวโน้มที่ดีสำหรับการพัฒนาที่จะเกิดขึ้น เพราะผลการวิจัยชี้ให้เห็นว่าโมเดลสามารถทำงานได้ด้วยความแม่นยำถึง 98% การค้นพบนี้จึงไม่เพียงแสดงให้เห็นถึงความแข็งแกร่งของโมเดล แต่ยังจุดประกายความหวังในการใช้งานในสถานการณ์จริงเพื่อการติดต่อสื่อสารที่เป็นธรรมชาติมากขึ้นในอนาคตด้วย”