Forskel mellem klassificering og regression

Anonim

Klassifikation vs Regression

Klassificering og regression er læringsteknikker til at skabe modeller af forudsigelse fra indsamlede data. Begge teknikker præsenteres grafisk som klassifikations- og regressions træer, eller rettere flowdiagrammer med datainddelinger efter hvert trin eller snarere "gren" i træet. Denne proces kaldes rekursiv partitionering.

Klassificering

Klassificering er en teknik, der bruges til at komme frem til et skema, der viser tilrettelæggelsen af ​​data, der starter med en precursorvariabel. De afhængige variabler er, hvad klassificerer dataene i grupper. Klassificeringstræet begynder med den uafhængige variabel, der forgrener sig i to grupper som bestemt af de eksisterende afhængige variabler. Det er meningen at klarlægge svarene i form af kategorisering forårsaget af de afhængige variabler.

Regression

Regression er en forudsigelsesmetode, der er baseret på en antaget eller kendt numerisk outputværdi. Denne outputværdi er resultatet af en række rekursiv partitionering, hvor hvert trin har en numerisk værdi og en anden gruppe af afhængige variabler, der forgrener sig til et andet par som dette. Regressionstræet starter med en eller flere forløbervariabler, og slutter med en endelige outputvariabel. De afhængige variabler er enten kontinuerlige eller diskrete numeriske variabler.

Hvad er forskellen mellem klassificering og regression? Hovedforskellen mellem klassifikationstræet og regressionstræet er deres afhængige variabel. For klassifikationstræet er de afhængige variabler kategoriske, mens regressionstræet har numerisk afhængige variabler. De af klassifikationstræet har også en bestemt mængde uordnede værdier, mens de af regressionstræet har enten diskrete men endnu bestilte værdier eller indiskrete værdier. Et regressionstræ er konstrueret med det formål at tilpasse et regressionssystem til hver determinantgren på en måde, så den forventede outputværdi kommer op. På den anden side forgrener et klassifikations træ som bestemt af en afhængig variabel afledt af den tidligere knude.

Regressions- og klassifikationstræer er nyttige teknikker til at kortlægge processen, der peger på et studeret resultat, hvad enten det er i klassificering eller en enkelt numerisk værdi.

Kort sagt:

• Klassificeringstræer har afhængige variabler, der er kategoriske og uordnede.

• Regressions træer har afhængige variabler, der er kontinuerlige værdier eller bestilte hele værdier.