Bagaimana untuk mentafsirkan plot berselerak

Pengarang: Lewis Jackson
Tarikh Penciptaan: 6 Mungkin 2021
Tarikh Kemas Kini: 2 Julai 2024
Anonim
Fitting a line to data | Regression | Probability and Statistics | Khan Academy
Video.: Fitting a line to data | Regression | Probability and Statistics | Khan Academy

Kandungan

Plot penyebaran adalah alat diagnostik penting dalam senjata statistik, diperoleh dengan membina graf dua-ubah dan merumuskan hipotesis berfungsi tentang hubungannya. Atas sebab ini, mereka biasanya direka sebelum analisis regresi dilakukan. Ahli statistik kemudian menguji hipotesis dengan menggunakan analisis regresi dan menentukan tanda yang tepat dan magnitud hubungan. Di samping itu, graf regresi membantu mengenal pasti data yang tidak sepadan - nilai-nilai yang jauh dari kebanyakan data sampel. Menghapuskan data yang tidak mencukupi membantu meningkatkan model regresi.


Arahan

Plot scatter menunjukkan korelasi antara dua pembolehubah (NA / AbleStock.com / Getty Images)
  1. Cari hubungan negatif antara kedua pembolehubah dalam plot berselerak. Jika nilai rendah pembolehubah pertama sesuai dengan nilai tinggi pembolehubah kedua, terdapat korelasi negatif. Dalam kes ini, garis yang dihasilkan melalui data akan mempunyai cerun negatif.

  2. Perhatikan carta untuk hubungan positif antara pembolehubah. Jika nilai rendah pembolehubah pertama sesuai dengan nilai rendah pembolehubah kedua, dan nilai tinggi pembolehubah pertama sama dengan nilai tinggi kedua, pembolehubah mempunyai korelasi positif. Dalam kes ini, garis yang dihasilkan melalui data akan mempunyai cerun positif.

  3. Periksa plot berselerak untuk menentukan sama ada tiada hubungan antara pembolehubah. Sekiranya data dalam graf dibahagikan secara rawak, tanpa hubungan jelas antara pembolehubah, maka mereka tidak mempunyai korelasi, atau korelasi kecil dan statistik yang tidak ketara. Dalam kes ini, garis yang ditarik melalui data adalah mendatar, dengan cerun sama dengan sifar.


  4. Buat garis regresi melalui data, memeriksa bentuknya, dan menilai sifat hubungan antara kedua pembolehubah tersebut. Garis lurus ditafsirkan dengan hubungan linear, bentuk melengkung mencadangkan hubungan kuadratik, dan garis yang bermula agak rata sebelum naik atau jatuh tiba-tiba ditafsirkan sebagai hubungan eksponen.

  5. Cari data yang tidak mencukupi dalam carta. Nilai yang luar biasa jauh dari set data. Perbezaan menyimpulkan hubungan antara pembolehubah. Hilangkan mereka, tetapi hanya jika kehadiran mereka tidak menjejaskan analisis hubungan antara kedua-dua pembolehubah.