# Data Exploratory via BDH X-Brain

## **Data Exploratory หรือ Exploratory Data Analysis (EDA)**

**Data Exploratory หรือ Exploratory Data Analysis (EDA)** เป็นขั้นตอนสำคัญในกระบวนการวิเคราะห์ข้อมูล ซึ่งเน้นไปที่การทำความเข้าใจข้อมูลที่มีอยู่ โดยใช้เทคนิคต่างๆ เพื่อตรวจสอบลักษณะและโครงสร้างของข้อมูล นี่เป็นขั้นตอนแรกที่นักวิเคราะห์ข้อมูลจะทำก่อนที่จะลงมือสร้างโมเดลหรือทำการวิเคราะห์เชิงลึก

**วัตถุประสงค์ของ Data Exploratory**

1. **ทำความเข้าใจข้อมูล:** การสำรวจข้อมูลในขั้นแรกเป็นการทำความเข้าใจโครงสร้างพื้นฐานของข้อมูล เช่น ประเภทของตัวแปร (Variable types), การกระจายตัวของข้อมูล (Data distribution), และค่าที่ขาดหายไป (Missing values) เป็นต้น
2. **ระบุลักษณะและรูปแบบของข้อมูล:** การสำรวจข้อมูลช่วยให้นักวิเคราะห์สามารถระบุแนวโน้ม (Trends), รูปแบบ (Patterns), ความสัมพันธ์ (Relationships), หรือข้อผิดพลาดในข้อมูลได้
3. **สร้างสมมติฐาน:** จากการสำรวจข้อมูล นักวิเคราะห์สามารถสร้างสมมติฐานเกี่ยวกับข้อมูลเพื่อทดสอบในขั้นตอนการสร้างโมเดล (Modeling) หรือการวิเคราะห์ขั้นสูงต่อไป
4. **ระบุความสัมพันธ์:** สำรวจความสัมพันธ์ระหว่างตัวแปรต่างๆ เช่น การใช้ Correlation Matrix เพื่อดูความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
5. **ทำความสะอาดข้อมูล:** การสำรวจข้อมูลยังช่วยระบุปัญหาของข้อมูล เช่น ข้อมูลที่ขาดหายไป, ค่าผิดปกติ (Outliers), และความไม่สอดคล้องของข้อมูล ซึ่งต้องได้รับการแก้ไขก่อนการวิเคราะห์ขั้นสูง

### **วิธีการที่ใช้ใน Data Exploratory**

1. **สถิติเชิงพรรณนา (Descriptive Statistics):** ใช้ในการสรุปและแสดงข้อมูลเช่น ค่าเฉลี่ย (Mean), ค่ามัธยฐาน (Median), ค่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) เป็นต้น
2. **การสร้างกราฟ (Data Visualization):** การสร้างกราฟช่วยให้เห็นภาพรวมและเข้าใจข้อมูลได้ง่ายขึ้น ตัวอย่างเช่น กราฟแท่ง (Bar Charts), กราฟเส้น (Line Charts), ฮีสโตแกรม (Histograms), และกราฟกระจาย (Scatter Plots)
3. **การตรวจสอบความสัมพันธ์ (Correlation Analysis):** ใช้เพื่อระบุความสัมพันธ์ระหว่างตัวแปร เช่น การคำนวณค่า Correlation Coefficient

### **การศึกษาข้อมูล (Data Profiling)**

**การศึกษาข้อมูล (Data Profiling)** เป็นขั้นตอนสำคัญในกระบวนการวิเคราะห์ข้อมูล ซึ่งใช้เพื่อทำความเข้าใจคุณลักษณะต่าง ๆ ของข้อมูลที่มีอยู่ โดยมีการตรวจสอบและประเมินข้อมูลในเชิงสถิติเพื่อระบุรายละเอียดที่สำคัญ เช่น การกระจายของข้อมูล (Data Distribution), การหาค่าผิดปกติ (Outliers), การประเมินคุณภาพของข้อมูล (Data Quality), รวมถึงการตรวจสอบค่าที่หายไป (Missing Values) และความสอดคล้องกันของข้อมูล (Data Consistency) ซึ่งมีวัตถุประสงค์เพื่อทำให้เข้าใจข้อมูลได้อย่างลึกซึ้งก่อนที่จะดำเนินการวิเคราะห์หรือสร้างโมเดลต่อไป การทำ Data Profiling ช่วยให้ผู้วิเคราะห์สามารถระบุปัญหาหรือความไม่สมบูรณ์ของข้อมูลได้ตั้งแต่เนิ่น ๆ และเตรียมการแก้ไขข้อมูล (Data Cleaning) ก่อนเริ่มกระบวนการวิเคราะห์เพิ่มเติม

### **ขั้นตอนการ**ทำ **Data Exploratory** บน X-Brain

1\. เข้าไปที่ [https://x-brain.kin-yoo-dee.com](https://x-brain.kin-yoo-dee.com/) แล้วลงชื่อเข้าใช้ด้วยบัญชีของตนเอง

<figure><img src="/files/jWjwq8oRjIAbHVNtwvIw" alt=""><figcaption><p>หน้า login เข้าใช้งานระบบ</p></figcaption></figure>

2\. สร้างโปรเจคใหม่ด้วยการกดปุ่ม “**+ Create Project**”&#x20;

<figure><img src="/files/fn4AyIDffv4fqm5mZMAo" alt=""><figcaption><p>สร้างโปรเจคใหม่</p></figcaption></figure>

3\. ตั้งชื่อโปรเจค หลังจากนั้นกดปุ่ม “**Create Analytic Project**”

<figure><img src="/files/C2dOHCMHBUs8hzR87RCu" alt=""><figcaption><p>ตั้งชื่อโปรเจค</p></figcaption></figure>

4\. ตั้งค่า template project

* กดปุ่ม “**…**” ของ Project ที่ถูกสร้างขึ้นแล้วเลือกที่เมนู "**Config**"<br>

<figure><img src="/files/ek472Eggwu5DOPoms8EV" alt=""><figcaption><p>ตั้งค่า template project</p></figcaption></figure>

* ต่อมาให้เลือกหมวด "**TIME SERIES ANALYSIS**" เพื่อทำการตั้งค่า Project ให้อยู่ในรูปแบบของ "**time-series**"

<figure><img src="/files/E1aW1KnnfyKnhQA59aZi" alt=""><figcaption><p>template time-series project</p></figcaption></figure>

<figure><img src="/files/pplFKuel29Z1lJWTD0NZ" alt=""><figcaption><p>โฟลเดอร์โปรเจคที่ได้</p></figcaption></figure>

5\. การนำเข้าชุดข้อมูลตารางขึ้นมายัง X-brain แพลตฟอร์ม

&#x20;**หมายเหตุ: ปัจจุบันการนำเข้าข้อมูลตารางขึ้นแพลตฟอร์มสามารถเลือกได้ 2 ประเภท คือ**

1. **ข้อมูลจากอุปกรณ์ (Device)**
2. **ข้อมูลสุขภาพ (Health)**

* คลิกที่ “**+ Select Data**”

<figure><img src="/files/VMQnXydPoLojU7kJng9W" alt=""><figcaption><p>การนำเข้าชุดข้อมูล</p></figcaption></figure>

* เลือกประเภทของข้อมูลที่ต้องการ

<figure><img src="/files/upxUei6mNGuH6L2s0etr" alt=""><figcaption></figcaption></figure>

* ในกรณีนี้ เลือก “**ข้อมูลจากอุปกรณ์ (Device)**” ซึ่งแหล่งข้อมูลจากอุปกรณ์ (Device Datasource) ที่ต้องการ โดยจะมีให้เลือก 4 อุปกรณ์ คือ **Hivesmart, Amazfit, Apple Watch** และ **Fishrack**

<figure><img src="/files/MwypR2Lo4TiEluA16vKI" alt=""><figcaption><p>เลือกอุปกรณ์  infineon</p></figcaption></figure>

* กรอกเลข **Device ID** ของอุปกรณ์และเลือกวันที่ ที่ต้องการ จากนั้นคลิกที่ “**Submit**” จะได้ตารางข้อมูลของอุปกรณ์&#x20;

<figure><img src="/files/PignH4dvXu5CBpiXl35Y" alt=""><figcaption><p>กรอกรายละเอียดของอุปกรณ์ที่ต้องการข้อมูล</p></figcaption></figure>

* สามารถกรอง (filter) ข้อมูลด้วยเงื่อนไขที่ต้องการได้ โดยคลิกที่ช่องสี่เหลี่ยมหน้าคำว่า “**Add filters**”

<figure><img src="/files/vIEUYelFZAR2TAXdkhTk" alt=""><figcaption><p>ตารางข้อมูลที่ได้จากการเลือกประเภทข้อมูลและอุปกรณ์</p></figcaption></figure>

<figure><img src="/files/ze9GH1aFE6H6YmIjWJRG" alt=""><figcaption><p>กรองข้อมูล (filter)</p></figcaption></figure>

* สามารถแสดงผลของข้อมูลในรูปแบบกราฟได้ โดยเลือกประเภทของข้อมูลที่ต้องการจะแสดง

<figure><img src="/files/JMsdBNpMu1OwgTz8aXyk" alt=""><figcaption><p>ประเภทของข้อมูลที่สามารถแสดงผลในรูปแบบกราฟ</p></figcaption></figure>

<figure><img src="/files/LIQozoRyzlXjwsAFTVEh" alt=""><figcaption><p>แสดงผลของข้อมูลในรูปแบบกราฟ</p></figcaption></figure>

* สามารถศึกษาข้อมูล (Data Profiling) เพื่อดูว่าข้อมูลอยู่ในรูปแบบไหน และมีความผิดปกติ (Missing Value) ของข้อมูลอย่างไรบ้าง โดยคลิกที่ “**Generate Report**”

<figure><img src="/files/0scdMTa7eFvt8m5rRvBv" alt=""><figcaption><p>Generate Report</p></figcaption></figure>

* ในกรณีที่ต้องการบันทึกไฟล์ศึกษาข้อมูล (Data Profiling) โดยคลิกปุ่ม “**Download Report**” ซึ่งจะได้เป็นไฟล์นามสกุล .html

<figure><img src="/files/9tvvfZY0ff9KrY01TxH2" alt=""><figcaption><p>Data Profiling Report</p></figcaption></figure>

<figure><img src="/files/WZFkcJJFbRcrhj3QSnsr" alt=""><figcaption><p>ไฟล์ดาวน์โหลดของ Data Profiling</p></figcaption></figure>

* คลิกที่ “**Select Data**”&#x20;

<figure><img src="/files/Ib8XvOXL4FsQKLTJKmsl" alt=""><figcaption><p>Select Data</p></figcaption></figure>

* ตั้งชื่อไฟล์ของชุดข้อมูลคลิกที่ “**OK**” และจะได้ชุดข้อมูลจากการนำเข้าข้อมูล

<figure><img src="/files/43aY3y2on1u4OlYJFHFt" alt=""><figcaption><p>ตั้งชื่อไฟล์นำเข้าข้อมูล</p></figcaption></figure>

<figure><img src="/files/cmAjHgLL9mKzzWXr1hJF" alt=""><figcaption><p>ไฟล์ของชุดข้อมูลที่ได้จากการนำเข้าข้อมูล</p></figcaption></figure>

6\. **Data Exploratory** เป็นขั้นตอนที่ช่วยปูพื้นฐานสำหรับการวิเคราะห์ข้อมูลในขั้นต่อไป โดยให้ข้อมูลที่ชัดเจนและเชื่อถือได้ในการทำงานต่อไปในกระบวนการวิเคราะห์ข้อมูล ไม่ว่าจะเป็นการเลือกเทคนิคในการสร้างโมเดลหรือการแปลงข้อมูล

<figure><img src="/files/Mbc4jOoypTio03mDrBkS" alt=""><figcaption><p>การเลือก Data Exploratory</p></figcaption></figure>

* เป็นเครื่องมือที่ใช้สำหรับการสำรวจและวิเคราะห์ข้อมูลในรูปแบบของเว็บอินเตอร์เฟซที่ช่วยให้นักวิเคราะห์ข้อมูลสามารถตรวจสอบและทำงานกับข้อมูล Pandas DataFrames โดยมีเครื่องมือหลายประเภทที่ช่วยให้การสำรวจข้อมูลและวิเคราะห์ข้อมูลเบื้องต้นเป็นไปอย่างสะดวกและรวดเร็ว
* **table (ตาราง):** เป็นหน้าจอที่แสดงข้อมูลใน DataFrame ของ Pandas ในรูปแบบของตารางที่สามารถโต้ตอบได้ ผู้ใช้สามารถเลื่อนดูข้อมูล, กรองข้อมูล (Filtering), จัดเรียงข้อมูล (Sorting), และค้นหาค่าที่เฉพาะเจาะจงได้

<figure><img src="/files/zT1ld0bBgBQAwKV3djWi" alt=""><figcaption><p>ตารางข้อมูลจากการทำ Exploratory</p></figcaption></figure>

* **describe (การสรุปข้อมูล):** ฟังก์ชันนี้จะสร้างสถิติพื้นฐาน เช่น ค่าเฉลี่ย (Mean), ค่ามัธยฐาน (Median), ค่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation), ค่าต่ำสุด (Min), ค่าสูงสุด (Max), และ Percentiles ต่างๆ ซึ่งช่วยในการเข้าใจลักษณะการกระจายตัวของข้อมูล นอกจากนี้ยังมีการแสดงจำนวนค่าที่ขาดหายไป (Missing Values) ในแต่ละคอลัมน์ รวมถึงค่าที่ซ้ำกัน (Duplicated Values) ที่อาจต้องได้รับการแก้ไขก่อนการวิเคราะห์เชิงลึก

<figure><img src="/files/CyTDPQ2VEKrbK3L5HXDO" alt=""><figcaption><p>การสรุปข้อมูลจากการทำ Exploratory</p></figcaption></figure>

* **charts (แผนภูมิ):** เป็นเครื่องมือที่ช่วยในการสร้างแผนภูมิและกราฟต่างๆ สำหรับการสำรวจและวิเคราะห์ข้อมูลเบื้องต้น โดยไม่จำเป็นต้องเขียนโค้ดเพิ่ม ผู้ใช้สามารถเลือกชนิดของกราฟได้หลากหลาย เช่น กราฟแท่ง (Bar Chart), ฮิสโตแกรม (Histogram), กราฟกระจาย (Scatter Plot), กราฟเส้น (Line Chart), และอื่นๆ ตามความเหมาะสมกับลักษณะของข้อมูล\
  \
  เลือกค่าในแกน X และ Y ที่ต้องการแสดงผลในรูปแบบกราฟ

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725292338242_image.png" alt=""><figcaption><p>กราฟแผนภูมิจากการทำ Exploratory</p></figcaption></figure>

### **ขั้นตอนการนำเข้าข้อมูล (Import Data)**

1\. เข้าไปที่ [https://x-brain.kin-yoo-dee.com](https://x-brain.kin-yoo-dee.com/) แล้วลงชื่อเข้าใช้ด้วยบัญชีของตนเอง

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1726029287853_image.png" alt=""><figcaption><p>หน้า login เข้าใช้งานระบบ</p></figcaption></figure>

2\. สร้างโปรเจคใหม่ด้วยการกดปุ่ม “**+ Create Project**”&#x20;

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1724835499652_image.png" alt=""><figcaption><p>สร้างโปรเจคใหม่</p></figcaption></figure>

3\. ตั้งชื่อโปรเจค หลังจากนั้นกดปุ่ม “**Create Analytic Project**”

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725284085932_image.png" alt=""><figcaption><p>ตั้งชื่อโปรเจค</p></figcaption></figure>

4\. ตั้งค่า template project

* กดปุ่ม “**…**” ของ Project ที่ถูกสร้างขึ้นแล้วเลือกที่เมนู "**Config**"&#x20;

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725284343556_image.png" alt=""><figcaption><p>ตั้งค่า template project</p></figcaption></figure>

* ต่อมาให้เลือกหมวด "**TIME SERIES ANALYSIS**" เพื่อทำการตั้งค่า Project ให้อยู่ในรูปแบบของ "**time-series**"

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725284686783_image.png" alt=""><figcaption><p>template time-series project</p></figcaption></figure>

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725284709814_image.png" alt=""><figcaption><p>โฟลเดอร์โปรเจคที่ได้</p></figcaption></figure>

5\. การอัปโหลดชุดข้อมูลตารางขึ้นมายัง X-brain แพลตฟอร์ม  (ในกรณีที่ไม่มีชุดข้อมูลของตนเองสามารถดาวน์โหลดข้อมูลได้ที่ [Link](https://zanegrowth-my.sharepoint.com/:f:/p/la_nattapak/EgAuGxLKGaZDpviP7j-asdMBqPj9bhjPZNmX--nHNctSrA?e=aJgK5m) โดยในตัวอย่างเลือกไฟล์ “***activity\_rawdata.csv***”)

&#x20;   **หมายเหตุ: ปัจจุบันการอัปโหลดไฟล์ข้อมูลตารางขึ้นแพลตฟอร์มสามารถอัปโหลดได้เฉพาะไฟล์ .csv เท่านั้น**

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725285096623_image.png" alt=""><figcaption><p>อัปโหลดไฟล์ข้อมูล</p></figcaption></figure>

จะได้ชุดข้อมูลจากไฟล์ที่อัปโหลด

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725285165099_image.png" alt=""><figcaption><p>ไฟล์ข้อมูลที่ได้จากการอัปโหลด</p></figcaption></figure>

6\. **Data Exploratory** เป็นขั้นตอนที่ช่วยปูพื้นฐานสำหรับการวิเคราะห์ข้อมูลในขั้นต่อไป โดยให้ข้อมูลที่ชัดเจนและเชื่อถือได้ในการทำงานต่อไปในกระบวนการวิเคราะห์ข้อมูล ไม่ว่าจะเป็นการเลือกเทคนิคในการสร้างโมเดลหรือการแปลงข้อมูล

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725292153619_image.png" alt=""><figcaption><p>การเลือก Data Exploratory</p></figcaption></figure>

* เป็นเครื่องมือที่ใช้สำหรับการสำรวจและวิเคราะห์ข้อมูลในรูปแบบของเว็บอินเตอร์เฟซที่ช่วยให้นักวิเคราะห์ข้อมูลสามารถตรวจสอบและทำงานกับข้อมูล Pandas DataFrames โดยมีเครื่องมือหลายประเภทที่ช่วยให้การสำรวจข้อมูลและวิเคราะห์ข้อมูลเบื้องต้นเป็นไปอย่างสะดวกและรวดเร็ว
  * **table (ตาราง)**: เป็นหน้าจอที่แสดงข้อมูลใน DataFrame ของ Pandas ในรูปแบบของตารางที่สามารถโต้ตอบได้ ผู้ใช้สามารถเลื่อนดูข้อมูล, กรองข้อมูล (Filtering), จัดเรียงข้อมูล (Sorting), และค้นหาค่าที่เฉพาะเจาะจงได้

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725286271440_image.png" alt=""><figcaption><p>ตารางข้อมูลจากการทำ Exploratory</p></figcaption></figure>

* **describe (การสรุปข้อมูล):** ฟังก์ชันนี้จะสร้างสถิติพื้นฐาน เช่น ค่าเฉลี่ย (Mean), ค่ามัธยฐาน (Median), ค่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation), ค่าต่ำสุด (Min), ค่าสูงสุด (Max), และ Percentiles ต่างๆ ซึ่งช่วยในการเข้าใจลักษณะการกระจายตัวของข้อมูล นอกจากนี้ยังมีการแสดงจำนวนค่าที่ขาดหายไป (Missing Values) ในแต่ละคอลัมน์ รวมถึงค่าที่ซ้ำกัน (Duplicated Values) ที่อาจต้องได้รับการแก้ไขก่อนการวิเคราะห์เชิงลึก

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725286316095_image.png" alt=""><figcaption><p>การสรุปข้อมูลจากการทำ Exploratory</p></figcaption></figure>

* **charts (แผนภูมิ):** เป็นเครื่องมือที่ช่วยในการสร้างแผนภูมิและกราฟต่างๆ สำหรับการสำรวจและวิเคราะห์ข้อมูลเบื้องต้น โดยไม่จำเป็นต้องเขียนโค้ดเพิ่ม ผู้ใช้สามารถเลือกชนิดของกราฟได้หลากหลาย เช่น กราฟแท่ง (Bar Chart), ฮิสโตแกรม (Histogram), กราฟกระจาย (Scatter Plot), กราฟเส้น (Line Chart), และอื่นๆ ตามความเหมาะสมกับลักษณะของข้อมูล\
  \
  เลือกค่าในแกน X และ Y ที่ต้องการแสดงผลในรูปแบบกราฟ

<figure><img src="https://paper-attachments.dropboxusercontent.com/s_A74AFC64525AD1AA9AA46A1C1647231D3B3098C4A8F5E4CFB769A674163353C4_1725286379225_image.png" alt=""><figcaption><p>กราฟแผนภูมิจากการทำ Exploratory</p></figcaption></figure>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.aic-eec.com/iot-development-with-infineon-psoc-tm-6-and-bdh-platform/bdh-x-brain-data-analytics/data-exploratory-via-bdh-x-brain.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
