ภาษาศาสตร์คอมพิวเตอร์

ภาษาศาสตร์คอมพิวเตอร์ หรือ ภาษาศาสตร์เชิงคำนวณ (อังกฤษ: computational linguistics) เป็นสหวิทยาการที่ว่าด้วยการสร้างแบบจำลองเชิงตรรกะของภาษาธรรมชาติ จากมุมมองในเชิงคำนวณ แบบจำลองนี้ ไม่ได้จำกัดอยู่แค่ในสาขาในสาขาหนึ่งของภาษาศาสตร์

เดิมทีเดียว นักภาษาศาสตร์คอมพิวเตอร์มักจะเป็นนักวิทยาศาสตร์คอมพิวเตอร์ ซึ่งเชี่ยวชาญในด้านการประยุกต์ใช้คอมพิวเตอร์เพื่อประมวลผลภาษาธรรมชาติ (natural language) แต่งานวิจัยในช่วงหลัง ได้แสดงให้เห็นว่า ภาษานั้นซับซ้อนเกินกว่าที่คาดคิดไว้ ดังนั้นกลุ่มศึกษาภาษาศาสตร์คอมพิวเตอร์จึงกลายสภาพเป็นกลุ่มสหวิทยาการไป โดยจะต้องมีอย่างน้อยหนึ่งคนที่เป็นนักภาษาศาสตร์​ (นั่นคือ ฝึกฝนมาทางด้านภาษาศาสตร์โดยเฉพาะ) ส่วนคนอื่น ๆ อาจจะเชี่ยวชาญในสาขา วิทยาศาสตร์คอมพิวเตอร์ ปัญญาประดิษฐ์ จิตวิทยาปริชาน (en:cognitive psychology) ตรรกวิทยา และอื่น ๆ

จุดกำเนิด

ภาษาศาสตร์คอมพิวเตอร์นั้นนับเป็นแขนงวิชาแรกเริ่มของปัญญาประดิษฐ์แขนงหนึ่ง ซึ่งเริ่มต้นในสหรัฐอเมริกาในช่วงคริสต์ทศวรรษที่ 1950 (พ.ศ. 2493 ถึง พ.ศ. 2503) เพื่อที่จะแปลเอกสารภาษาต่างประเทศไปเป็นภาษาอังกฤษโดยอัตโนมัติ โดยเฉพาะการแปลวารสารวิทยาศาสตร์ของสหภาพโซเวียต[1] ในสมัยนั้นคอมพิวเตอร์ได้พิสูจน์ความสามารถแล้วว่า สามารถแก้ปัญหาทางคณิตศาสตร์ที่ซับซ้อนได้เร็วกว่าและแม่นยำกว่ามนุษย์มาก แต่ถึงกระนั้น เทคนิคต่าง ๆ ก็ยังไม่ได้รับการพัฒนาให้มีประสิทธิภาพมากพอที่จะประมวลผลภาษาได้[2]

เมื่อการแปลภาษาอัตโนมัติ (machine translation) ที่ให้ผลลัพธ์แม่นยำได้ล้มเหลว จึงได้มีการกลับมามองปัญหาของการประมวลผลภาษาใหม่ พบว่าปัญหานั้นซับซ้อนเกินกว่าที่ได้คาดคิดไว้ในตอนแรก ภาษาศาสตร์คอมพิวเตอร์จึงได้ถือกำเนิดขึ้นเป็นศาสตร์ใหม่ ที่อุทิศให้กับการพัฒนาขั้นตอนวิธี และซอฟต์แวร์ประมวลผลข้อมูลทางภาษาอย่างชาญฉลาด เมื่อปัญญาประดิษฐ์ได้ถือกำเนิดขึ้นในช่วงคริสต์ทศวรรษที่ 1960 (พ.ศ. 2503 ถึง พ.ศ.​ 2513) ภาษาศาสตร์คอมพิวเตอร์จึงได้กลายมาเป็นแขนงหนึ่งของปัญญาประดิษฐ์ โดยเน้นการจัดการกับความเข้าใจในระดับมนุษย์ (human-level comprehension) และการสร้างภาษาธรรมชาติ (production of natural languages)

ในการแปลภาษาหนึ่งไปเป็นอีกภาษาหนึ่งนั้น ได้มีการศึกษาวิจัยแล้วว่า คนจะต้องเข้าใจวากยสัมพันธ์ (syntax - หน้าที่และความสัมพันธ์ของคำคำหนึ่งกับคำอื่น ๆ ในข้อความ) ของภาษาทั้งสอง และอย่างน้อยก็ต้องในระดับหน่วยคำ (morphology) และทั้งประโยค ในการเข้าใจวากยสัมพันธ์ คนจะต้องเข้าใจอรรถศาสตร์ (semantics - ความหมาย) ของคำศัพท์ และรวมถึงความเข้าใจในวัจนปฏิบัติศาสตร์ (pragmatics - การสื่อความหมายที่เกิดจาก/หรือแปรไปตาม การใช้งาน) ว่าภาษานั้นใช้อย่างไร เช่น เพื่อบอกเล่า (declarative) หรือเพื่อการประชดประชัน (ironic) ดังนั้นการที่จะแปลความระหว่างภาษาได้นั้น จะต้องใช้องก์ความรู้ทั้งหลายที่มุ่งเน้นความเข้าใจเกี่ยวกับ การประมวลผลและการสังเคราะห์ประโยคของภาษาธรรมชาติแต่ละภาษาโดยใช้คอมพิวเตอร์นั่นเอง[3]

สาขาย่อย

ภาษาศาสตร์คอมพิวเตอร์สามารถแบ่งออกเป็นหลายแขนงหลัก ตามสื่อกลางของภาษาที่ประมวลผล ไม่ว่าจะเป็นทางการพูดหรือการเขียน และตามวิธีการใช้ภาษา ทั้งการวิเคราะห์และสังเคราะห์

  • การรู้จำเสียง (en:speech recognition) และการสังเคราะห์เสียง (en:speech synthesis) เป็นการศึกษาวิธีการเข้าใจหรือสร้างภาษาพูด
  • การแจกแจงโครงสร้าง (en:parsing) และการสังเคราะห์ภาษา (generation) เน้นไปที่การแยกภาษาเป็นส่วน ๆ และการประกอบรวมภาษาให้สื่อความได้ ตามลำดับ
  • การแปลภาษาด้วยเครื่อง ยังคงเป็นแขนงสำคัญอันหนึ่งของภาษาศาสตร์คอมพิวเตอร์ โดยมีหลายแนวคิด เช่น การแปลจากภาษาหนึ่งไปเป็นอีกภาษาหนึ่งโดยตรง หรือการแปลจากภาษาต้นทางไปเป็นภาษากลาง (ภาษาสากล - inter lingua) ก่อน จากนั้นค่อยแปลจากภาษากลางไปเป็นภาษาปลายทาง

ในการวิจัยด้านภาษาศาสตร์คอมพิวเตอร์ส่วนใหญ่ จะมีแนวทางดังต่อไปนี้

  • ภาษาศาสตร์คลังข้อมูล โดยใช้คอมพิวเตอร์ช่วยวิเคราะห์ (computer aided corpus linguistics)
  • การออกแบบโปรแกรมแจกแจงประโยค (parser) ให้รองรับภาษาธรรมชาติ
  • การออกแบบตัวกำกับ (tagger) เช่น ตัวกำกับชนิดคำ (en:part-of-speech tagger หรือ POS-tagger)
  • การนิยามตรรกศาสตร์แบบพิเศษ เช่น ตรรกศาสตร์ทรัพยากร เพื่อการประมวลผลภาษาธรรมชาติ (Natural language processing หรือ NLP)
  • การวิจัยความสัมพันธ์ระหว่างภาษาฟอร์มอลกับภาษาธรรมชาติในสภาวะปกติ

สมาคมภาษาศาสตร์คอมพิวเตอร์ ​ (Association for Computational Linguistics หรือ ACL) ได้นิยามภาษาศาสตร์คอมพิวเตอร์ไว้ว่า "เป็นการศึกษาภาษาตามแนวทางวิทยาศาสตร์จากมุมมองเชิงคำนวณ นักภาษาศาสตร์คอมพิวเตอร์จะสนใจที่การสร้างแบบจำลองเชิงคำนวณ (en:computational model) ของปรากฏการณ์ทางภาษาศาสตร์ทั้งหลาย"[4]

อ้างอิง

ดูเพิ่ม

แหล่งข้อมูลอื่น

🔥 Top keywords: วชิรวิชญ์ ไพศาลกุลวงศ์หน้าหลักองค์การกระจายเสียงและแพร่ภาพสาธารณะแห่งประเทศไทยยูฟ่าแชมเปียนส์ลีกชนกันต์ อาพรสุทธินันธ์สโมสรฟุตบอลแมนเชสเตอร์ซิตีพิเศษ:ค้นหาดวงใจเทวพรหม (ละครโทรทัศน์)กรงกรรมอสมทลิซ่า (แร็ปเปอร์)จีรนันท์ มะโนแจ่มสโมสรฟุตบอลอาร์เซนอลสโมสรฟุตบอลเรอัลมาดริดธี่หยดฟุตซอลชิงแชมป์เอเชีย 2024เฟซบุ๊กสโมสรฟุตบอลบาร์เซโลนาประเทศไทยเอเชียนคัพ รุ่นอายุไม่เกิน 23 ปี 2024วิทยุเสียงอเมริกาสโมสรฟุตบอลลิเวอร์พูลพระราชวัชรธรรมโสภณ (ศิลา สิริจนฺโท)พระบาทสมเด็จพระวชิรเกล้าเจ้าอยู่หัวรักวุ่น วัยรุ่นแสบวันไหลนริลญา กุลมงคลเพชรสโมสรฟุตบอลเชลซีสมเด็จพระกนิษฐาธิราชเจ้า กรมสมเด็จพระเทพรัตนราชสุดาฯ สยามบรมราชกุมารีหลานม่าสุภาพบุรุษจุฑาเทพ (ละครโทรทัศน์)สโมสรฟุตบอลไบเอิร์นมิวนิกกรุงเทพมหานครสโมสรฟุตบอลแมนเชสเตอร์ยูไนเต็ดคิม ซู-ฮย็อนภาวะโลกร้อนสาธุ (ละครโทรทัศน์)รายชื่ออักษรย่อของจังหวัดในประเทศไทยสโมสรฟุตบอลปารีแซ็ง-แฌร์แม็ง