Search Engine แบบ indexer
posted on 24 Jan 2008 13:21 by darkness-it
คุณสมบัติของ ThaiQuest Search Engine
เป็น Search Engine แบบ indexer
- สามารถทำดัชนีแบบเรียลไทม์ (Real-time Indexing) โดยไม่จำเป็นต้องรอหรือกำหนด เวลาล่วงหน้า เพื่อการ สืบค้น ข้อมูลได้อย่างรวดเร็ว และแม่นยำ
- สนับสนุนการทำดัชนีเฉพาะข้อมูลส่วนที่เพิ่มขึ้น (Incremental Indexing) โดยไม่จำเป็น ต้องทำดัชนีของเอกสารทั้งหมดใหม่ทุกครั้ง
- สามารถ สืบค้น ข้อมูลแบบข้อความเต็ม (Full-text Search) ได้ทั้ง ภาษาไทย และภาษาอังกฤษ โดยไม่จำเป็นต้องกำหนดคำที่ต้องการให้ สืบค้น ไว้ล่วงหน้า
- รองรับการ สืบค้น แบบมีเงื่อนไขพิเศษ (ฺBoolean Search) เช่น และ หรือ และไม่ ได้
- สามารถใช้เครื่องหมายวงเล็บ ( ) เพื่อช่วยในการ ค้นหา ข้อมูลที่มีลักษณะซับซ้อนได้
- สามารถ สืบค้น ข้อมูลแบบใช้ Wildcard * ในกรณีที่ต้องการ ค้นหา คำหลายๆ คำ พร้อมกันได้ เช่น คำค้น "Thai*" จะมีความหมายว่าให้ ค้นหา คำที่ขึ้นต้นด้วย Thai ใดๆ เช่น Thai, Thailand, Thais เป็นต้น
- สนับสนุนการ สืบค้น วลี โดยใช้เครื่องหมายคำพูด " " ครอบวลีที่ต้องการ สืบค้น เช่น "พลเอกเปรม ติณสูลานนท์"
- สามารถ สืบค้น ข้อมูลโดยใช้ระบบกำหนดกลุ่มคำที่สะกดไม่เหมือนกัน (ระบบผันคำ ภาษาไทย) เพื่อช่วยในการ ค้นหา คำที่มีการสะกดหลายแบบ เช่น "อิเล็กโทรนิกส์", "อิเล็คโทรนิคส์", "อีเล็คทรอนิคส์" ซึ่งทุกคำ เป็นคำที่มีการใช้งานอยู่จริง
- รองรับ สืบค้น ข้อมูลได้หลากหลายประเภทเอกสาร เช่น MS Word, MS Excel, MS PowerPoint, PDF, HTML, Web Archive (MHT) และ Text
- สนับสนุนการตัดคำ ภาษาไทย เพื่อแยกความแตกต่างของคำกำกวมได้ เช่น ค้นหา คำว่า ตลาด จะไม่พบในเอกสารที่มีคำว่า เขตลาดพร้าว
- สามารถแสดงผลลัพธ์แบบมีการเน้นคำที่ผู้ใช้ สืบค้น (Highlight) เพื่อช่วยให้ผู้ใช้หาข้อมูลที่ต้องการได้เร็วขึ้น
- สนับสนุนการพัฒนาระบบงานต่างๆ โดยสามารถเชื่อมต่อได้หลากหลายภาษา เช่น VB.NET, ASP.NET, C#, JAVA, PHP และอื่นๆ ทั้งการนำข้อมูลเข้าระบบ และการ สืบค้น ข้อมูลโดยใช้มาตรฐานเปิดของระบบ Web Services เพื่อให้ทำงาน ร่วมกับทุก Platform ได้
โครงสร้างของ ThaiQuest Search Engine
ThaiQuest Search Engine มีองค์ประกอบหลัก 3 ส่วนดังนี้
1. Web Services เปรียบเสมือน API เพื่อให้นักพัฒนาสามารถเขียนโปรแกรมเชื่อมต่อการทำงานได้อย่างอิสระ ทำให้เกิดการประยุกต์ที่หลากหลายมากยิ่งขึ้น โดยจะประกอบไปด้วย ส่วนของการ นำข้อมูลเข้า (เพิ่ม/ลบ/แก้ไข) และส่วนการ สืบค้น ข้อมูล (Search)
2. Full-text Search Engine คือหัวใจหลักของระบบทั้งหมด ทำหน้าที่สร้างดัชนีทันทีเมื่อมีข้อมูลใหม่อัพเดทเข้ามา เพื่อรองรับการ สืบค้น ข้อมูลแบบข้อความเต็มทั้งไทย-อังกฤษ ได้อย่างรวดเร็ว และแม่นยำ
3. Data Storage เป็นที่เก็บข้อมูลดิบ เพื่อให้การเรียกใช้งานข้อมูลมีความสมบูรณ์มากยิ่งขึ้นID: 5005104032
edit @ 24 Jan 2008 14:01:24 by Darkness