Utilization of Large-Scale Texts using NLP Technology การใช้ประโยชน์ข้อมูลข้อความขนาดใหญ่โดยเทคโนโลยีการประมวลภาษาธรรมชาติ

Thanaruk Theeramunkong

Information Technology Program
Sirindhorn International Institute of Technology
P.O. Box 22, Thammasat-Rangsit Post Office, Pathum Thani 12121, Thailand.
 
ธนารักษ์  ธีระมั่นคง

สาขาเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีนานาชาติสิรินธร
ตู้ ปณ. 22  ปทฝ. ธรรมศาสตร์ รังสิต ปทุมธานี 12121

ABSTRACT: In these days, a cyberspace era, there has been an ever-increasing flood of text information culminating in the advent of massive digital libraries and the Internet.  Exploring the way to efficiently utilize such text information becomes an interesting and important topic. For this purpose, the discipline of natural language processing (NLP) provides many useful techniques. This paper mainly introduces tasks and a number of previous researches in three related NLP areas: information retrieval (IR), information extraction (IE) and text mining (TM).

บทคัดย่อ: ปัจจุบันที่เป็นยุคแห่งไซเบอร์สเปซนี้ มีการสร้างจัดเก็บและรวบรวมข้อมูลประเภทข้อความจำนวนมหาศาลในรูปของห้องสมุดดิจิทัลและการเครือข่ายอินเตอร์เน็ต ดังนั้นการนำข้อมูลที่มีจำนวนมากมายนี้มาใช้ประโยชน์อย่างมีประสิทธิภาพจึงเป็นหัวข้อที่น่าสนใจและสำคัญมาก ศาสตร์ทางด้านการประมวลผลภาษาธรรมชาติ ได้ให้วิธีการและเทคนิคต่างๆที่มีประโยชน์สำหรับจุดประสงค์นี้ ในบทความนี้จะขอแนะนำขอบข่ายงานและงานวิจัยที่เกี่ยวข้องกับ 3 สาขาย่อยของการประมวลผลภาษาธรรมชาติคือ การสืบค้นข้อมูล การสกัดข้อมูล และการทำเหมืองข้อมูลประเภทข้อความ

Download