วิธีการคำนวณค่ามัธยฐานของข้อมูลคลัสเตอร์

ผู้เขียน: Peter Berry
วันที่สร้าง: 16 สิงหาคม 2021
วันที่อัปเดต: 5 พฤษภาคม 2024
Anonim
[การวิเคราะห์ข้อมูลเบื้องต้น] ตอนที่ 31 เทคนิคการหามัธยฐาน
วิดีโอ: [การวิเคราะห์ข้อมูลเบื้องต้น] ตอนที่ 31 เทคนิคการหามัธยฐาน

เนื้อหา

ค่ามัธยฐานคือจุดกึ่งกลางของชุดข้อมูลที่สั่งซื้อ ตัวอย่างเช่นชุด (2,4,7,9,10) มีค่ามัธยฐานเท่ากับ 7 ข้อมูลที่สั่งซื้อจะถูกรวบรวมเป็นหมวดหมู่โดยมีรายละเอียดที่แน่นอนของการสูญเสียข้อมูลแต่ละจุด ดังนั้นค่ามัธยฐานที่แน่นอนไม่สามารถทราบได้จากข้อมูลคลัสเตอร์เพียงอย่างเดียว อย่างไรก็ตามหากคุณทราบจำนวนข้อมูลในแต่ละช่วงเวลาคุณสามารถบอกได้ว่าเป็น "ช่วงกลาง" นั่นคืออะไรมีจุดที่เป็นค่ามัธยฐาน เราสามารถปรับแต่งการประมาณค่ามัธยฐานของจุดโดยสูตรตามสมมติฐานที่ว่าจุดข้อมูลจุดกึ่งกลางมีการกระจายอย่างเท่าเทียมกัน


คำสั่ง

การเรียนรู้วิธีการคำนวณค่ามัธยฐานของกลุ่มข้อมูลนั้นเป็นงานง่าย (Hemera Technologies / AbleStock.com รูปภาพ / Getty)
  1. จัดกลุ่มค่าเป็นช่วง ๆ หากยังไม่ได้จัดกลุ่ม กำหนดช่วงเวลาที่ควรมีจุดกึ่งกลาง

    สำหรับวัตถุประสงค์ของการสอนให้พิจารณาชุดข้อมูล (1,2,4,5,6,7,7,7,9) ค่ามัธยฐานที่นี่คือ 6 คุณสามารถจัดกลุ่มชุดให้มีความกว้างเท่ากับ 4 ได้ การแจกแจงความถี่ของพวกเขานั้นอาจเป็นเช่น: 1-4: 3 5-8: 5 9-12: 1 ในข้อมูลที่ไม่รวมกำไรค่ามัธยฐานจะชัดเจนในหมวดที่ 5-8 คุณสามารถพูดได้โดยไม่เห็นชุดข้อมูลดั้งเดิม

  2. คำนวณความแตกต่างของจำนวนจุดข้อมูลที่อยู่เหนือระดับกลางและครึ่งหนึ่งของจำนวนจุดข้อมูลทั้งหมด

    ตามที่กล่าวถึงแล้วสิ่งนี้เท่ากับ 9/2 - 3 = 1.5 การคำนวณนี้จะประมาณระยะห่างจากช่วงกลางที่ควรพบค่ามัธยฐาน

  3. หารด้วยจำนวนคะแนนในช่วงกลาง

    ดำเนินการต่อด้วยตัวอย่าง 1.5 / 5 = 0.3 นี่จะทำให้อัตราส่วนของค่ามัธยฐานของระยะกลาง


  4. คูณค่าที่ได้รับข้างต้นด้วยความกว้างของช่วงกลาง

    ดำเนินการต่อด้วยตัวอย่าง 0.3 x 4 = 1.2 สิ่งนี้จะแปลงอัตราส่วนภายในช่วงเป็นการเพิ่มข้อมูลจริง

  5. เพิ่มผลลัพธ์ข้างต้นให้กับค่าระหว่างช่วงกลางและช่วงล่าง

    เนื่องจากการตัดระหว่างค่าเฉลี่ยและช่วงล่างคือ 4.5 เราจะได้สมการ 4.5 + 1.2 = 5.7 ซึ่งสามารถได้ผลลัพธ์เป็น 6 ซึ่งเป็นคำตอบที่ถูกต้อง

เคล็ดลับ

  • ในความเป็นจริงการคำนวณข้างต้นเป็นเช่นเดียวกับในสูตร "L + (n / 2 - c) / fxw" โดยที่ L คือตัวเลขระหว่างช่วงกลางและช่วงล่างถัดไป n คือจำนวนจุดข้อมูลทั้งหมด c คือจำนวนจุดทั้งหมดที่อยู่ต่ำกว่าระดับกลางและ f คือจำนวนจุดข้อมูลในช่วงกลางและ w คือความกว้าง