Funcția discriminantă canonică - The Big Encyclopedia of Oil and Gas, articol, pagina 1

Funcția discriminantă canonică

Funcția discriminantă canonică este o combinație liniară de variabile discriminante și satisface anumite condiții. [1]

Funcțiile discriminante canonice sunt definite, iar acum putem începe să le interpretăm. Sarcina se reduce, în primul rând, la studiul distanțelor relative dintre obiecte și centroizii de clasă și, în al doilea rând, la luarea în considerare a relațiilor dintre variabilele și funcțiile individuale. Dacă există mai multe caracteristici, ne întrebăm și dacă toate sunt necesare. [2]

El ia în considerare funcțiile discriminante canonice, algoritmii și funcțiile de clasificare și diverse criterii de selecție pentru includerea variabilelor. Aici este dată o interpretare geometrică a coeficienților funcției discriminante canonice, sunt prezentate utilizarea coeficienților în forme standard și nestandard, precum și algoritmi pentru determinarea numărului de funcții discriminante semnificative. Profesorul Klekka își începe discuția despre analiza discriminantă cu cele mai simple lucruri, apoi trece treptat la materiale mai complexe. La sfârșitul lucrării, este prezentată o discuție despre posibilele încălcări ale ipotezelor care stau la baza analizei discriminante, care va servi drept punct de plecare pentru cei care urmează să aplice analiza discriminantă pentru prima dată în problemele de cercetare. Klekka merită cu siguranță cele mai mari laude. [3]

Să luăm în considerare principiile de bază pentru obținerea coeficienților u ai funcției discriminante canonice. O prezentare completă a aspectelor matematice ale acestei probleme este în afara domeniului nostru de aplicare. Tabelul cu medii de grup și abateri standard este insuficient, deoarece nu ia în considerare dependențele dintre variabile. [5]

Clasificarea poate fiefectuate cu ajutorul funcţiilor discriminante canonice în loc să utilizeze variabilele discriminante originale. În acest caz, se aplică aceleași formule (doar X este înlocuit cu /) și rezultatele clasificării sunt de obicei identice. [6]

Multe manuale de statistică folosesc termenii variabilă canonică pentru a însemna ceea ce numim funcția discriminantă canonică și funcția discriminantă, la care ne vom referi în Sec. [7]

Unele programe de analiză discriminantă (cum ar fi BMD05M și subrutina din SAS76) efectuează doar clasificare și nu calculează funcții discriminante canonice. [8]

II, s-a arătat că soluția ecuației (4) corespunde unei valori proprii (lambda) și unui set de coeficienți pentru fiecare funcție discriminantă canonică. Cu toate acestea, unele dintre ele vor fi soluții banale din punct de vedere matematic, în timp ce altele vor fi nesemnificative din punct de vedere statistic. [9]

Lucrarea (Overall și Klett, 1972; 292-295) descrie modul în care coeficienții de structură pot fi utilizați pentru a reprezenta grafic diferența dintre centroizii de grup în cazul a două funcții discriminante canonice. Graficul, cu axe care se referă la aceste două funcții, arată centroizii de grup și centroidul principal, arătând vectori care emană din centroidul principal și direcționați către fiecare variabilă discriminantă. Unghiurile de direcție ale acestor vectori sunt calculate din coeficienții structurii. Lungimea vectorului este determinată de variațiile intergrup și intragrup ale variabilei corespunzătoare. [10]

Specialiștii în aplicații, în general, nu trebuie să înțeleagă temeinic aceste probleme. Mai întâi trebuie să învețe cum să aplice și să interpreteze funcțiile discriminante canonice. Aceasta este ceea ce estesarcina secțiunii următoare. [unsprezece]

Dacă este necesar să clasificați un număr mare de obiecte prin metoda distanței și probabilităților, atunci folosind funcții discriminante, puteți reduce semnificativ cantitatea de muncă. În loc să calculăm distanțe pentru p variabile, avem nevoie doar de q funcții discriminante canonice. [12]

O altă situație în care două proceduri pot da rezultate diferite apare atunci când una sau mai multe funcții canonice sunt ignorate deoarece nu sunt semnificative statistic. Deși unele obiecte pot fi clasificate diferit în acest exemplu, rezultatele obținute folosind funcțiile discriminante canonice vor fi mai precise deoarece efectul fluctuațiilor eșantionului este redus. [13]

După cum sa menționat deja, scopul analizei discriminante este de a rezolva două probleme: interpretarea și clasificarea. Până în prezent, atenția s-a concentrat în principal pe sarcina interpretării, care este legată de determinarea numărului și semnificației funcțiilor discriminante canonice și de elucidarea semnificațiilor acestora pentru a explica diferențele dintre clase. Clasificarea este un tip special de activitate a cercetătorului în care fie variabilele discriminante, fie funcțiile discriminante canonice sunt folosite pentru a prezice clasa căreia un obiect este mai probabil să aparțină. Există mai multe proceduri de clasificare, dar toate compară poziția unui obiect cu fiecare dintre centroizii clasei pentru a-l găsi pe cel mai apropiat. De exemplu, scopul studiului lui Bardes a fost de a forma un subspațiu definit de funcția discriminantă canonică folosind date despre 19 senatori și facțiuni selectate. [14]

Înainte de a trece la discutarea problemei clasificării (o vom lua în considerare în secțiune. În această secțiune, vom discutaprincipiile care stau la baza calculului funcțiilor discriminante canonice și metode de determinare a numărului acestora. [15]