การกำหนด Data Labeling ในชุดข้อมูล (Dataset)
Last updated
Was this helpful?
Last updated
Was this helpful?
X-Brain คือ แพลตฟอร์มที่พัฒนาขึ้นเพื่อรองรับการสำรวจข้อมูล (Data Exploration) และการทำป้ายชื่อข้อมูล (Data Labeling) สำหรับการสร้างโมเดล AI พร้อมด้วยระบบการปรับใช้แบบอัตโนมัติ (Automated Deployment) ซึ่งช่วยให้กระบวนการสร้างโมเดล AI เป็นไปอย่างราบรื่น รวดเร็ว และมีประสิทธิภาพสูงสุด แพลตฟอร์มนี้ออกแบบมาเพื่อตอบสนองความต้องการในหลายด้าน ไม่ว่าจะเป็นการศึกษา การวิจัย และการประยุกต์ใช้ในอุตสาหกรรม AI และ Machine Learning
Data Labeling คือ กระบวนการกำหนดป้ายกำกับหรือฉลากให้กับข้อมูลแต่ละชิ้นในชุดข้อมูล (Dataset) เพื่อบ่งบอกลักษณะหรือความหมายของข้อมูลนั้น ๆ กระบวนการนี้มักใช้ในงานที่เกี่ยวข้องกับการพัฒนาโมเดล Machine Learning และ AI โดยการ Labeling จะช่วยให้โมเดลเรียนรู้และเข้าใจความสัมพันธ์ของข้อมูลเพื่อให้สามารถทำการทำนายหรือจำแนกข้อมูลใหม่ได้อย่างถูกต้อง ตัวอย่างเช่น การระบุว่าในภาพมีวัตถุใดบ้าง หรือการจัดประเภทข้อความตามหมวดหมู่ที่กำหนดไว้ การทำ Data Labeling ที่มีคุณภาพเป็นปัจจัยสำคัญที่ทำให้โมเดลมีความแม่นยำและประสิทธิภาพสูง
Dataset คือ กลุ่มของข้อมูลที่ถูกรวบรวมและจัดเก็บไว้ในรูปแบบที่มีโครงสร้าง เพื่อใช้ในการวิเคราะห์ ประมวลผล หรือการสร้างโมเดลทางสถิติและปัญญาประดิษฐ์ (AI) โดย Dataset อาจประกอบด้วยข้อมูลในรูปแบบต่าง ๆ เช่น ตัวเลข ข้อความ รูปภาพ หรือสัญญาณเสียง ซึ่งสามารถถูกจัดเรียงในรูปแบบของตาราง รายการ หรือโครงสร้างอื่น ๆ ที่ช่วยให้ง่ายต่อการเข้าถึงและใช้งาน Dataset เป็นพื้นฐานสำคัญในการวิจัยและพัฒนาในหลายสาขา เช่น วิทยาศาสตร์ข้อมูล (Data Science), การเรียนรู้ของเครื่อง (Machine Learning), และการวิเคราะห์เชิงสถิติ
ในส่วนของขั้นตอนนี้จะเป็นขั้นตอนในการกำหนดขอบเขตหรือระบุประเภทของข้อมูลที่ต้องการนำไปให้ระบบปัญญาประดิษฐ์สามารถเรียนรู้ตามองค์ประกอบที่ผู้ใช้งานกำหนด เช่นการวาดกรอบสำหรับระบุประเภทของกราฟข้อมูลเวลา (time-series) เป็นต้น โดยสำหรับในคอร์สเรียนนี้จะมีขั้นตอนการดำเนินงานดังต่อไปนี้
1. Upload file
2. ลังจากที่เลือกเมนูแพลตฟอร์มจะทำ redirect ไปหน้าต่างใหม่เพื่อทำการ label ข้อมูลกราฟ (time-series)
3. ก่อนจะทำการ label ข้อมูล จะต้องทำการตั้งค่าข้อมูลที่จำเป็นก่อนจึงจะเริ่ม label ข้อมูลได้ โดยไปที่เมนู "Settings" ที่บนขวาของหน้าต่างการทำงาน
หมายเหตุ ข้อมูลที่จะติดป้ายกำกับ (Label) ได้นั้น จำเป็นจะต้องเป็นข้อมูลประเภท time series (ชุดของข้อมูลที่มีการเก็บรวบรวมตามระยะเวลาที่ติดต่อกัน)
4. ทำการเลือกเมนู "Labeling Interface" เพื่อทำการตั้งค่าดังต่อไปนี้
คลิก “Image/Video” จากนั้นเลือก “Time Series”
ตั้งค่าการแสดงผลกราฟของข้อมูลตามรูปแบบของข้อมูล (ในกรณีข้อมูลตัวอย่างให้ตั้งค่าตามขั้นตอนดังต่อไปนี้)
ตั้งค่า Configure data ให้เป็น "$csv"
ตั้งค่า Config Time Column ให้เป็น "index"
ตั้งค่า Config column from ให้เป็น "accx"
ตั้งค่า Config column from ให้เป็น "accy"
ตั้งค่า Config column from ให้เป็น "accz"
Create Label
ทำการสร้างประเภทของข้อมูลที่ต้องการให้ระบบปัญญาประดิษฐ์เรียนรู้ข้อมูลเสร็จเรียบร้อยแล้วกดปุ่ม "Save" เพื่อทำการเริ่ม label ข้อมูล
5. ระบุหรือใส่คำอธิบายประกอบ (Label) กราฟ time series โดยจะมีตัวเลือกในการจำแนกส่วนเฉพาะของกราฟตามประเภทของกิจกรรม เพียง 3 กิจกรรมเท่านั้น ได้แก่ Circle, side-to-side และ Square
เลือก label ข้อมูลที่ต้องการแล้วทำการตีกรอบสี่เหลี่ยมในกราฟ
เมื่อทำการ label ภาพปัจจุบันเรียบร้อยให้กดปุ่ม "Submit"
6. ในกรณีที่ต้องการจะแก้ไขหรือปรับเปลี่ยนตำแหน่งของกราฟที่ Label ไว้นั้น สามารถทำได้โดย
คลิกที่ปุ่ม “Delete annotation”
เลือกส่วนเฉพาะของกราฟตามประเภทของกิจกรรมใหม่อีกครั้ง
คลิกเลือก “Update”
7. ในกรณีที่ต้องการจะเพิ่มตำแหน่ง Label ของกราฟนั้น สามารถทำได้โดย
เลื่อนตำแหน่งของกราฟที่แสดงผล
เลือกประเภทของกิจกรรมและส่วนของกราฟที่ต้องการจะระบุหรือใส่คำอธิบายประกอบ (Label)
คลิกเลือก “Update”
8. หลังจากนั้นให้ไปที่เมนู "Dataset" จะปรากฎผลลัพธ์ดังรูปภาพด้านล่าง ซึ่งในตอนเริ่มต้นจะว่างเปล่า แต่ปัจจุบันจะแสดงผลไฟล์ .csv ที่ถูก label ข้อมูลขึ้นมาในหน้าต่างนี้
9. ในกรณีที่ต้องการจะบันทึกไฟล์ที่ Label นั้น สามารถทำได้โดย คลิกเลือกที่ “...” ของไฟล์ข้อมูลและเลือกที่ “Download”