Dataset
Last updated
Last updated
Assoc. Prof. Wiroon Sriborrirux, Founder of Advance Innovation Center (AIC) and Bangsaen Design House (BDH), Electrical Engineering Department, Faculty of Engineering, Burapha University
ชุดข้อมูลคือ กลุ่มของข้อมูลที่มีการใช้ตัวแปรบางอย่างร่วมกัน โดยจะแบ่งตัวแปรแต่ละตัวเป็นคอลัมบ์ ตามตัวอย่างที่ผ่านมาด้านบน ซึ่งตัวแปรที่ชุดข้อมูลใช่ร่วมกันคือ time stamp และมีตัวแปรอื่นๆคือ acc_x, acc_y และ acc_z ชุดข้อมูลนั้นไม่จำเป็นต้องอยู่ในรูปแบบ time series เสมอไป ดังนั้นการจัดแบ่งชุดข้อมูลจะเปลี่ยนไปตามประเภทของข้อมูล
ตัวอย่างชุดข้อมูล
timestamp | acc_x | acc_y | acc_z | date |
5260 | -114 | -1469 | 9030 | 03/03/2022 11:21:42 |
5261 | -129 | -985 | 9724 | 03/03/2022 11:21:42 |
5262 | -315 | -646 | 10088 | 03/03/2022 11:21:42 |
5263 | -248 | 985 | 9298 | 03/03/2022 11:21:42 |
5264 | -521 | 1048 | 10581 | 03/03/2022 11:21:42 |
โดยปกติแล้วชุดข้อมูลส่วนใหญ่จะถูกแบ่งเป็นส่วนๆอยู่แล้ว เช่น แบ่งตามวัน, เดือน, กลุ่มต่างๆ แต่การแบ่งชุดข้อมูลในที่นี้สื่อถึงการแบ่งชุดข้อมูลสำหรับการนำไปทำ Machine learning ซึ่งจะแบ่งเป็นชุดข้อมูลที่ไว้สำหรับสอน (train)
เมื่อแบ่งชุดข้อมูลเรียบร้อยแล้ว เราจะนำข้ออมูลชุดนี้เพื่อนำไปให้ Machine learning(ML) โดยตัว ML นั้นจะนำข้อมูลถูกแบ่งไว้ว่าเป็นข้อมูลชุด Train มาทำการเรียนรู้เพื่อหา feature ต่างๆของข้อมูลชุดนั้นโดยขึ้นอยู่กับ Algorithm ว่าจะดูเอกลักษณ์อะไรของชุดข้อมูลนั้นเมื่อ ML เรียนรู้เสร็จแล้วจะได้สิ่งที่เรียกว่า Model ออกมาหลังจากนั้น ML จะนำข้อมูลชุด Test มาป้อนข้อมูลใส่ Model ที่เราได้มาเพื่อทดสอบความแม่นยำของชุดข้อมูลที่เราเรียนรู้ไปว่ามีถูกผิดกี่เปอเซนต์
อ้างอิง :
Last update: May 2023
Author: Thanaluk Pranekunakol (AIC-Researcher)