เนคเทคส่งงานวิจัยแปลภาษาโฉมใหม่ 9 ภาษาใน 8 ประเทศเอเชีย แปลงภาษา ก่อนผ่านระบบสังเคราะห์เสียงพูดส่งกลับ ตั้งเป้าแปลภาษาไทย-มาลายูถิ่นปัตตานี ช่วยงานตชด.ปี 54?
ภาษา นับเป็นช่องทางการสื่อสารที่ทุกประเทศใช้ติดต่อเชื่อมโยงระหว่างกัน แต่จะดีแค่ไหนถ้าวันนี้ สามารถเข้าใจภาษาต่างๆ ได้อย่างง่ายดาย ตามกระแสโลกาภิวัฒน์ หรือความเป็นโลกเดียวกันที่มีความทันสมัย โดยผ่านเทคโนโลยีล่ามอิเล็กทรอนิกส์ นวัตกรรมพื้นฐานที่สามารถประยุกต์ใช้ได้ในหลายงาน เช่น ช่วยส่งเสริมการท่องเที่ยว ช่วยเพิ่มศักยภาพในการสื่อสารข้ามเชื้อชาติเพื่อลดช่องว่างทางภาษาและ วัฒนธรรม ช่วยอำนวยความสะดวกในการประชุมวิชาการนานาชาติ ช่วยเพิ่มประสิทธิภาพในการติดต่อสื่อสารข้ามภาษาภาคธุรกิจต่างๆ และช่วยเพิ่มศักยภาพในการเรียนการสอนภาษา
ดร.ชัย วุฒิวิวัฒน์ชัย
ดร.ชัย วุฒิวิวัฒน์ชัย ผู้อำนวยการหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ หรือเนคเทค ชี้แจงเป้าหมายการสร้างระบบล่ามอิเล็กทรอนิกส์ (Speech-to-speech translation) ว่า เพื่ออำนวยความสะดวกให้ ผู้คนจากหลากหลายเชื้อชาติ หลายภาษา สามารถสื่อสารพูดคุยกันได้โดยการพูดภาษาของตัวเอง และระบบจะทำหน้าที่แปลเสียงจากภาษาหนึ่งไปเป็นอีกภาษาหนึ่งให้โดยอัตโนมัติ ในระยะแรกนี้ ระบบดังกล่าวจะทำงานผ่านเครือข่ายอินเทอร์เน็ต เพื่อเชื่อมต่อเว็บบริการจากหลากหลายประเทศ ให้สามารถแปลได้หลายภาษา ในเนื้อหาเกี่ยวกับการท่องเที่ยว
ผอ.หน่วยปฏิบัติการวิจัยวิทยา การมนุษยภาษา เนคเทค ยกตัวอย่างการขั้นตอนทำงานว่า หากจะแปลเสียงพูดภาษาไทยเป็นภาษาอังกฤษ ระบบจะทำงานโดยรับเสียงพูดจากผู้พูดคนไทย แล้วแปลงเสียงพูดภาษาไทยนี้เป็นข้อความภาษาไทย โดยใช้ระบบแปลงเสียงพูดเป็นข้อความ (Automatic speech recognition: ASR) ข้อความภาษาไทยที่ได้จะถูกแปลเป็นภาษาอังกฤษ โดยใช้ระบบแปลภาษา (Machine translation: MT) ได้ผลเป็นข้อความภาษาอังกฤษ ข้อความนี้จะถูกนำไปผลิตเป็นเสียงพูดภาษาอังกฤษ ด้วยระบบสังเคราะห์เสียงพูด (Text-to-speech synthesis: TTS) ส่งเสียงกลับไปยังผู้พูดต่างชาติที่ใช้ภาษาอังกฤษ ทำนองเดียวกัน ผู้พูดอังกฤษก็สามารถพูดภาษาอังกฤษเข้าไปยังระบบ และระบบจะแปลงเป็นเสียงพูดภาษาไทยส่งกลับไปยังผู้พูดไทยได้
ดร.ชัย ระบุต่อว่า งานวิจัยดังกล่าวร่วมมือกับหน่วยงานวิจัยระดับชาติของประเทศในเอเชียอีก 7 ประเทศ ได้แก่ ญี่ปุ่น เกาหลี จีน เวียดนาม สิงคโปร์ อินโดนีเซีย และอินเดีย ภายใต้ชื่อ A-STAR consortium (Asian Speech Translation Advanced Research) ทั้งนี้ ประเทศสมาชิกจะแลกเปลี่ยนงานวิจัยและนักวิจัยเพื่อถ่ายทอดองค์ความรู้ให้แก่ กัน เพื่อร่วมกันพัฒนาคลังข้อมูลที่จำเป็นสำหรับการสร้างระบบ รวมทั้งผลักดันมาตรฐานการเชื่อมต่อเว็บบริการเข้าหากันให้เป็นที่ยอมรับใน ระดับสากล อีกทั้ง ระบบต้นแบบที่พัฒนาขึ้นเป็นระบบที่ทำงานผ่านเครือข่ายอินเทอร์เน็ต โดยเชื่อมต่อระบบแปลงเสียงพูดเป็นข้อความ ระบบแปลภาษา และระบบสังเคราะห์เสียงพูด ที่ถูกสร้างขึ้นในแต่ละประเทศสมาชิก ส่งผลให้ระบบนี้สามารถแปลเสียงพูดได้ถึง 9 ภาษา (ไทย ญี่ปุ่น เกาหลี จีน เวียดนาม มาเลย์ อินโดนีเซีย ฮินดี และอังกฤษ) ในเนื้อหาเกี่ยวกับการท่องเที่ยว
ในส่วนของเนคเทค ผอ.หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา อธิบายว่า พัฒนาระบบแปลงเสียงพูดเป็นข้อความสำหรับภาษาไทยและอังกฤษ ระบบแปลภาษาไทย-อังกฤษ และระบบสังเคราะห์เสียงพูดไทยและอังกฤษ เนื่องจากเป็น 2 ภาษาที่คนไทยใช้เป็นหลัก นอกจากนี้ จะต่อยอดงานวิจัยใน 2 รูปแบบ คือ 1.ผลักดันให้เปิดระบบเป็นบริการสาธารณะ เช่นเดียวกับบริการแปลภาษาที่เห็นอยู่ในหลายเว็บไซต์ โดยเบื้องต้นคาดการณ์ว่าจะเปิดบริการสำหรับการแปลไทย-อังกฤษได้ในปี 2553 หรือปีหน้าสำหรับภาษาอื่นๆ จะมีการหารือเพิ่มเติมในเร็วๆ นี้ และ2.ผลักดันให้มีการต่อยอดเทคโนโลยีไปใช้ประโยชน์จริง เช่น พัฒนาไปใช้แปลภาษาไทย-มาลายูถิ่นปัตตานี เพื่อช่วยในกิจการของตำรวจชายแดน และพัฒนาไปใช้ในโครงการส่งเสริมการท่องเที่ยวในประเทศไทย เป็นต้น
?ระบบ จะเปิดเป็นบริการสาธารณะในช่วงปลายไตรมาส 2 ของปีงบประมาณ 2553 โดยครอบคลุมเนื้อหาเกี่ยวกับการท่องเที่ยว นอกจากนี้ เนคเทคยังอยู่ระหว่างการหารือความร่วมมือในโครงการส่งเสริมการท่องเที่ยวใน ประเทศไทย ทั้งนี้ มีโอกาสที่จะบรรจุเทคโนโลยีนี้เป็นส่วนหนึ่งในแผนของโครงการ ส่วนการต่อยอดไปสู่ในการใช้งานในเนื้อหาหรือกิจการอื่นๆ ขณะนี้เริ่มหารือกับตำรวจตระเวนชายแดน เพื่อพัฒนาระบบไปใช้ในการแปลภาษาไทย-มาลายูถิ่นปัตตานี อีกทั้ง คาดการณ์ว่าหากโครงการเริ่มต้น จะมีระบบต้นแบบสำหรับแปลข้อความเป็นเสียงพูดทำงานบนโทรศัพท์เคลื่อนที่ภายใน ปี 2554 หรืออีก 2 ปีข้างหน้า? ดร.ชัย กล่าว ผอ.หน่วยปฏิบัติการวิจัย วิทยาการมนุษยภาษา เนคเทค กล่าวถึงอุปสรรคครั้งนี้ว่า แม้ว่าขณะนี้ จะยังครอบคลุมคำศัพท์ไม่เพียงพอสำหรับการท่องเที่ยว โดยเฉพาะคำเฉพาะ เช่น ชื่อสถานที่ท่องเที่ยว ชื่อคน ชื่อถนน เป็นต้น ขณะที่การพัฒนาระบบให้ครอบคลุมได้ทุกคำที่ใช้ในภาษาหนึ่งๆ เป็นเรื่องยาก ดังนั้นการต่อยอดการวิจัยพัฒนา จะต้องอาศัยหน่วยงานภายนอกที่สนใจจะใช้เทคโนโลยี ช่วยตีกรอบเนื้อหาที่ต้องการ และช่วยให้ข้อมูลแก่นักวิจัยในการพัฒนาระบบเฉพาะสำหรับเนื้อหานั้นๆ อย่างไรก็ตาม อาจต้องใช้งบประมาณพัฒนาอีกจำนวนหนึ่ง หากหน่วยงานที่สนใจมีความเข้าใจในระบบและวิธีการพัฒนาระบบ ก็จะส่งผลให้สามารถพัฒนาระบบให้ใช้งานได้จริง
ดร.ชัย เสนอแนะด้วยว่า ประสิทธิภาพของระบบขึ้นกับหลายปัจจัย ตั้งแต่เนื้อหาที่จะพูด สภาพแวดล้อมในการใช้งานระบบ และข้อจำกัดทางด้านฮาร์ดแวร์และเครือข่าย ในทางทฤษฎี ระบบแปลงเสียงพูดเป็นข้อความสามารถแปลงเสียงพูดผ่านโทรศัพท์เคลื่อนที่ได้ ถูกต้อง 70-90% ขึ้นอยู่กับสภาพแวดล้อมของการใช้งาน ระบบแปลภาษาสามารถแปลได้ถูกต้องเกินกว่า 70% หากใช้ในเนื้อหาจำกัด ดังนั้นมีความเป็นไปได้ที่จะพัฒนาระบบให้มีประสิทธิภาพรวมเกินกว่า 70% และสามารถทำได้สูงถึง 90% หากสามารถจำกัดเงื่อนไขต่างๆ ในการใช้งานได้
?มี หน่วยงานที่เกี่ยวข้องจำนวนมาก ทั้งภาครัฐและเอกชน ที่สามารถนำเทคโนโลยีนี้ไปต่อยอดใช้งานได้ อย่างไรก็ตาม ระบบต้นแบบยังทำงานเฉพาะสำหรับเนื้อหาการท่องเที่ยว ครอบคลุมคำศัพท์ที่ใช้ในการท่องเที่ยวประมาณ 20,000 คำ การจะต่อยอดใช้งานระบบจริง จำเป็นต้องได้รับความร่วมมือจากหน่วยงานผู้ใช้งาน ในการเพิ่มเติมหรือปรับปรุงคำศัพท์และรูปแบบประโยคที่จะใช้เฉพาะในแต่ละ เนื้อหาที่ผู้ใช้ต้องการ? ผอ.หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา เนคเทค ทิ้งท้าย
ในระยะที่ 2 ของโครงการ หน่วยวิจัยมีความมุ่งมั่นที่จะต่อยอดงานวิจัยสู่การใช้งานจริง จึงจำเป็นต้องได้รับความสนใจและความช่วยเหลืออย่างจริงจังจากหน่วยงานที่จะ ใช้งาน กระทรวงวิทยาศาสตร์จำเป็นต้องสื่อสารกับหน่วยงานต่างๆ ที่มีโอกาสจะใช้งานเทคโนโลยี เพื่อเฟ้นหาผู้ที่จะร่วมลงทุนพัฒนาระบบไปสู่การใช้งานจริง ทั้งนี้ หน่วยงานดังกล่าวจำเป็นต้องรับทราบถึงประสิทธิภาพและข้อจำกัดของเทคโนโลยี และมีความยินดีที่จะให้ข้อมูลเพื่อช่วยในการพัฒนาระบบ
ต่อจากนี้ไป ประเทศไทย คงได้แต่นั่งนับถอยหลังรอวันผลงานวิจัยที่คลอดออกมาแล้ว เติบโตเป็นรูปเป็นร่างขึ้นมา และจะดีแค่ไหนถ้าหลากหลายเชื้อชาติ หลายภาษา สามารถสื่อสารพูดคุยกันได้โดยการพูดภาษาของตัวเอง และถูกแปลเสียงจากภาษาหนึ่งไปเป็นอีกภาษาหนึ่งให้โดยอัตโนมัติ และเข้าใจตรงกัน…
กนกรัตน์ โกวิชัย itdigest@thairath.co.th
ที่มา หนังสือพิมพ์ไทยรัฐ