การกำหนด Data Labeling ในชุดข้อมูล (Dataset)
X-Brain
Data Labeling
Dataset
ขั้นตอนการ Labeling Dataset บน X-Brai






















Last updated
Was this helpful?
X-Brain คือ แพลตฟอร์มที่พัฒนาขึ้นเพื่อรองรับการสำรวจข้อมูล (Data Exploration) และการทำป้ายชื่อข้อมูล (Data Labeling) สำหรับการสร้างโมเดล AI พร้อมด้วยระบบการปรับใช้แบบอัตโนมัติ (Automated Deployment) ซึ่งช่วยให้กระบวนการสร้างโมเดล AI เป็นไปอย่างราบรื่น รวดเร็ว และมีประสิทธิภาพสูงสุด แพลตฟอร์มนี้ออกแบบมาเพื่อตอบสนองความต้องการในหลายด้าน ไม่ว่าจะเป็นการศึกษา การวิจัย และการประยุกต์ใช้ในอุตสาหกรรม AI และ Machine Learning
Data Labeling คือ กระบวนการกำหนดป้ายกำกับหรือฉลากให้กับข้อมูลแต่ละชิ้นในชุดข้อมูล (Dataset) เพื่อบ่งบอกลักษณะหรือความหมายของข้อมูลนั้น ๆ กระบวนการนี้มักใช้ในงานที่เกี่ยวข้องกับการพัฒนาโมเดล Machine Learning และ AI โดยการ Labeling จะช่วยให้โมเดลเรียนรู้และเข้าใจความสัมพันธ์ของข้อมูลเพื่อให้สามารถทำการทำนายหรือจำแนกข้อมูลใหม่ได้อย่างถูกต้อง ตัวอย่างเช่น การระบุว่าในภาพมีวัตถุใดบ้าง หรือการจัดประเภทข้อความตามหมวดหมู่ที่กำหนดไว้ การทำ Data Labeling ที่มีคุณภาพเป็นปัจจัยสำคัญที่ทำให้โมเดลมีความแม่นยำและประสิทธิภาพสูง
Dataset คือ กลุ่มของข้อมูลที่ถูกรวบรวมและจัดเก็บไว้ในรูปแบบที่มีโครงสร้าง เพื่อใช้ในการวิเคราะห์ ประมวลผล หรือการสร้างโมเดลทางสถิติและปัญญาประดิษฐ์ (AI) โดย Dataset อาจประกอบด้วยข้อมูลในรูปแบบต่าง ๆ เช่น ตัวเลข ข้อความ รูปภาพ หรือสัญญาณเสียง ซึ่งสามารถถูกจัดเรียงในรูปแบบของตาราง รายการ หรือโครงสร้างอื่น ๆ ที่ช่วยให้ง่ายต่อการเข้าถึงและใช้งาน Dataset เป็นพื้นฐานสำคัญในการวิจัยและพัฒนาในหลายสาขา เช่น วิทยาศาสตร์ข้อมูล (Data Science), การเรียนรู้ของเครื่อง (Machine Learning), และการวิเคราะห์เชิงสถิติ
ในส่วนของขั้นตอนนี้จะเป็นขั้นตอนในการกำหนดขอบเขตหรือระบุประเภทของข้อมูลที่ต้องการนำไปให้ระบบปัญญาประดิษฐ์สามารถเรียนรู้ตามองค์ประกอบที่ผู้ใช้งานกำหนด เช่นการวาดกรอบสำหรับระบุประเภทของกราฟข้อมูลเวลา (time-series) เป็นต้น โดยสำหรับในคอร์สเรียนนี้จะมีขั้นตอนการดำเนินงานดังต่อไปนี้
1. Upload file



2. ลังจากที่เลือกเมนูแพลตฟอร์มจะทำ redirect ไปหน้าต่างใหม่เพื่อทำการ label ข้อมูลกราฟ (time-series)

3. ก่อนจะทำการ label ข้อมูล จะต้องทำการตั้งค่าข้อมูลที่จำเป็นก่อนจึงจะเริ่ม label ข้อมูลได้ โดยไปที่เมนู "Settings" ที่บนขวาของหน้าต่างการทำงาน
หมายเหตุ ข้อมูลที่จะติดป้ายกำกับ (Label) ได้นั้น จำเป็นจะต้องเป็นข้อมูลประเภท time series (ชุดของข้อมูลที่มีการเก็บรวบรวมตามระยะเวลาที่ติดต่อกัน)

4. ทำการเลือกเมนู "Labeling Interface" เพื่อทำการตั้งค่าดังต่อไปนี้

คลิก “Image/Video” จากนั้นเลือก “Time Series”

ตั้งค่าการแสดงผลกราฟของข้อมูลตามรูปแบบของข้อมูล (ในกรณีข้อมูลตัวอย่างให้ตั้งค่าตามขั้นตอนดังต่อไปนี้)
ตั้งค่า Configure data ให้เป็น "$csv"
ตั้งค่า Config Time Column ให้เป็น "index"

ตั้งค่า Config column from ให้เป็น "accx"
ตั้งค่า Config column from ให้เป็น "accy"
ตั้งค่า Config column from ให้เป็น "accz"

Create Label
ทำการสร้างประเภทของข้อมูลที่ต้องการให้ระบบปัญญาประดิษฐ์เรียนรู้ข้อมูลเสร็จเรียบร้อยแล้วกดปุ่ม "Save" เพื่อทำการเริ่ม label ข้อมูล



5. ระบุหรือใส่คำอธิบายประกอบ (Label) กราฟ time series โดยจะมีตัวเลือกในการจำแนกส่วนเฉพาะของกราฟตามประเภทของกิจกรรม เพียง 3 กิจกรรมเท่านั้น ได้แก่ Circle, side-to-side และ Square
เลือก label ข้อมูลที่ต้องการแล้วทำการตีกรอบสี่เหลี่ยมในกราฟ
เมื่อทำการ label ภาพปัจจุบันเรียบร้อยให้กดปุ่ม "Submit"

6. ในกรณีที่ต้องการจะแก้ไขหรือปรับเปลี่ยนตำแหน่งของกราฟที่ Label ไว้นั้น สามารถทำได้โดย
คลิกที่ปุ่ม “Delete annotation”

เลือกส่วนเฉพาะของกราฟตามประเภทของกิจกรรมใหม่อีกครั้ง

คลิกเลือก “Update”

7. ในกรณีที่ต้องการจะเพิ่มตำแหน่ง Label ของกราฟนั้น สามารถทำได้โดย
เลื่อนตำแหน่งของกราฟที่แสดงผล

เลือกประเภทของกิจกรรมและส่วนของกราฟที่ต้องการจะระบุหรือใส่คำอธิบายประกอบ (Label)

คลิกเลือก “Update”

8. หลังจากนั้นให้ไปที่เมนู "Dataset" จะปรากฎผลลัพธ์ดังรูปภาพด้านล่าง ซึ่งในตอนเริ่มต้นจะว่างเปล่า แต่ปัจจุบันจะแสดงผลไฟล์ .csv ที่ถูก label ข้อมูลขึ้นมาในหน้าต่างนี้


9. ในกรณีที่ต้องการจะบันทึกไฟล์ที่ Label นั้น สามารถทำได้โดย คลิกเลือกที่ “...” ของไฟล์ข้อมูลและเลือกที่ “Download”

Last updated
Was this helpful?
Was this helpful?