การกำหนด Data Labeling ในชุดข้อมูล (Dataset)

X-Brain

X-Brain คือ แพลตฟอร์มที่พัฒนาขึ้นเพื่อรองรับการสำรวจข้อมูล (Data Exploration) และการทำป้ายชื่อข้อมูล (Data Labeling) สำหรับการสร้างโมเดล AI พร้อมด้วยระบบการปรับใช้แบบอัตโนมัติ (Automated Deployment) ซึ่งช่วยให้กระบวนการสร้างโมเดล AI เป็นไปอย่างราบรื่น รวดเร็ว และมีประสิทธิภาพสูงสุด แพลตฟอร์มนี้ออกแบบมาเพื่อตอบสนองความต้องการในหลายด้าน ไม่ว่าจะเป็นการศึกษา การวิจัย และการประยุกต์ใช้ในอุตสาหกรรม AI และ Machine Learning

Data Labeling

Data Labeling คือ กระบวนการกำหนดป้ายกำกับหรือฉลากให้กับข้อมูลแต่ละชิ้นในชุดข้อมูล (Dataset) เพื่อบ่งบอกลักษณะหรือความหมายของข้อมูลนั้น ๆ กระบวนการนี้มักใช้ในงานที่เกี่ยวข้องกับการพัฒนาโมเดล Machine Learning และ AI โดยการ Labeling จะช่วยให้โมเดลเรียนรู้และเข้าใจความสัมพันธ์ของข้อมูลเพื่อให้สามารถทำการทำนายหรือจำแนกข้อมูลใหม่ได้อย่างถูกต้อง ตัวอย่างเช่น การระบุว่าในภาพมีวัตถุใดบ้าง หรือการจัดประเภทข้อความตามหมวดหมู่ที่กำหนดไว้ การทำ Data Labeling ที่มีคุณภาพเป็นปัจจัยสำคัญที่ทำให้โมเดลมีความแม่นยำและประสิทธิภาพสูง

Dataset

Dataset คือ กลุ่มของข้อมูลที่ถูกรวบรวมและจัดเก็บไว้ในรูปแบบที่มีโครงสร้าง เพื่อใช้ในการวิเคราะห์ ประมวลผล หรือการสร้างโมเดลทางสถิติและปัญญาประดิษฐ์ (AI) โดย Dataset อาจประกอบด้วยข้อมูลในรูปแบบต่าง ๆ เช่น ตัวเลข ข้อความ รูปภาพ หรือสัญญาณเสียง ซึ่งสามารถถูกจัดเรียงในรูปแบบของตาราง รายการ หรือโครงสร้างอื่น ๆ ที่ช่วยให้ง่ายต่อการเข้าถึงและใช้งาน Dataset เป็นพื้นฐานสำคัญในการวิจัยและพัฒนาในหลายสาขา เช่น วิทยาศาสตร์ข้อมูล (Data Science), การเรียนรู้ของเครื่อง (Machine Learning), และการวิเคราะห์เชิงสถิติ

ขั้นตอนการ Labeling Dataset บน X-Brai

ในส่วนของขั้นตอนนี้จะเป็นขั้นตอนในการกำหนดขอบเขตหรือระบุประเภทของข้อมูลที่ต้องการนำไปให้ระบบปัญญาประดิษฐ์สามารถเรียนรู้ตามองค์ประกอบที่ผู้ใช้งานกำหนด เช่นการวาดกรอบสำหรับระบุประเภทของกราฟข้อมูลเวลา (time-series) เป็นต้น โดยสำหรับในคอร์สเรียนนี้จะมีขั้นตอนการดำเนินงานดังต่อไปนี้

1. Upload file

click upload data
choose Device and click upload
การเลือก Data Labeling

2. ลังจากที่เลือกเมนูแพลตฟอร์มจะทำ redirect ไปหน้าต่างใหม่เพื่อทำการ label ข้อมูลกราฟ (time-series)

ไฟล์ข้อมูลที่ redirect มาที่ label

3. ก่อนจะทำการ label ข้อมูล จะต้องทำการตั้งค่าข้อมูลที่จำเป็นก่อนจึงจะเริ่ม label ข้อมูลได้ โดยไปที่เมนู "Settings" ที่บนขวาของหน้าต่างการทำงาน

หมายเหตุ ข้อมูลที่จะติดป้ายกำกับ (Label) ได้นั้น จำเป็นจะต้องเป็นข้อมูลประเภท time series (ชุดของข้อมูลที่มีการเก็บรวบรวมตามระยะเวลาที่ติดต่อกัน)

ตั้งค่าข้อมูลที่จะทำการ label

4. ทำการเลือกเมนู "Labeling Interface" เพื่อทำการตั้งค่าดังต่อไปนี้

เลือกเมนู Labeling Interface
  • คลิก “Image/Video” จากนั้นเลือก “Time Series

เลือกรูปแบบการตั้งค่า label
  • ตั้งค่าการแสดงผลกราฟของข้อมูลตามรูปแบบของข้อมูล (ในกรณีข้อมูลตัวอย่างให้ตั้งค่าตามขั้นตอนดังต่อไปนี้)

    • ตั้งค่า Configure data ให้เป็น "$csv"

    • ตั้งค่า Config Time Column ให้เป็น "index"

ค่าการแสดงผลกราฟ
  • ตั้งค่า Config column from ให้เป็น "accx"

  • ตั้งค่า Config column from ให้เป็น "accy"

  • ตั้งค่า Config column from ให้เป็น "accz"

ค่าการแสดงผลกราฟ
  • Create Label

    • ทำการสร้างประเภทของข้อมูลที่ต้องการให้ระบบปัญญาประดิษฐ์เรียนรู้ข้อมูลเสร็จเรียบร้อยแล้วกดปุ่ม "Save" เพื่อทำการเริ่ม label ข้อมูล

Click "X" to remove labels
Add new label

5. ระบุหรือใส่คำอธิบายประกอบ (Label) กราฟ time series โดยจะมีตัวเลือกในการจำแนกส่วนเฉพาะของกราฟตามประเภทของกิจกรรม เพียง 3 กิจกรรมเท่านั้น ได้แก่ Circle, side-to-side และ Square

  • เลือก label ข้อมูลที่ต้องการแล้วทำการตีกรอบสี่เหลี่ยมในกราฟ

  • เมื่อทำการ label ภาพปัจจุบันเรียบร้อยให้กดปุ่ม "Submit"

รูปแบบข้อมูลกราฟการ label ข้อมูลทีละประเภท

6. ในกรณีที่ต้องการจะแก้ไขหรือปรับเปลี่ยนตำแหน่งของกราฟที่ Label ไว้นั้น สามารถทำได้โดย

  • คลิกที่ปุ่ม “Delete annotation

ลบป้ายกำกับข้อมูลออก (delete annotation)
  • เลือกส่วนเฉพาะของกราฟตามประเภทของกิจกรรมใหม่อีกครั้ง

เลือกป้ายกำกับข้อมูลใหม่
  • คลิกเลือก “Update

Update ป้ายกำกับข้อมูลใหม่

7. ในกรณีที่ต้องการจะเพิ่มตำแหน่ง Label ของกราฟนั้น สามารถทำได้โดย

  • เลื่อนตำแหน่งของกราฟที่แสดงผล

นตำแหน่งกราฟ
  • เลือกประเภทของกิจกรรมและส่วนของกราฟที่ต้องการจะระบุหรือใส่คำอธิบายประกอบ (Label)

ส่ป้ายกำกับข้อมูล
  • คลิกเลือก “Update

Update ป้ายกำกับข้อมูลใหม่

8. หลังจากนั้นให้ไปที่เมนู "Dataset" จะปรากฎผลลัพธ์ดังรูปภาพด้านล่าง ซึ่งในตอนเริ่มต้นจะว่างเปล่า แต่ปัจจุบันจะแสดงผลไฟล์ .csv ที่ถูก label ข้อมูลขึ้นมาในหน้าต่างนี้

ตัวอย่างภาพก่อนการ label ข้อมูล
ไฟล์ข้อมูลที่ได้จากการ label ข้อมูล

9. ในกรณีที่ต้องการจะบันทึกไฟล์ที่ Label นั้น สามารถทำได้โดย คลิกเลือกที่ “...” ของไฟล์ข้อมูลและเลือกที่ “Download

Download ไฟล์ที่มีการ Label แล้ว

Last updated

Was this helpful?