Vad är precision och återkallelse vid datautvinning?
Vad är precision och återkallelse vid datautvinning?

Video: Vad är precision och återkallelse vid datautvinning?

Video: Vad är precision och återkallelse vid datautvinning?
Video: Introduction to Precision, Recall and F1 | Classification Models 2024, December
Anonim

Medan precision hänvisar till procentandelen av dina resultat som är relevanta, återkallelse hänvisar till procentandelen av totalt relevanta resultat som är korrekt klassificerade av din algoritm. För andra problem behövs en avvägning, och ett beslut måste tas om man ska maximera precision , eller återkallelse.

Dessutom, vad är precision och återkallelse med exempel?

Exempel av Precision - Återkallelse mått för att utvärdera klassificerarens utdatakvalitet. Precision - Återkallelse är ett användbart mått på framgång för förutsägelse när klasserna är mycket obalanserade. Vid informationssökning, precision är ett mått på resultatrelevans, medan återkallelse är ett mått på hur många verkligt relevanta resultat som returneras.

Förutom ovan, hur beräknar du precision och återkallelse vid datautvinning? Till exempel skulle en perfekt precisions- och återkallningspoäng resultera i ett perfekt F-måttpoäng:

  1. F-mått = (2 * Precision * Recall) / (Precision + Recall)
  2. F-mått = (2 * 1,0 * 1,0) / (1,0 + 1,0)
  3. F-mått = (2 * 1,0) / 2,0.
  4. F-mått = 1,0.

Också att veta är, vad är precision i datautvinning?

I mönsterigenkänning, informationssökning och klassificering (maskininlärning), precision (även kallat positivt prediktivt värde) är bråkdelen av relevanta instanser bland de hämtade instanserna, medan återkallelse (även känd som känslighet) är bråkdelen av det totala antalet relevanta instanser som var

Varför använder vi precision och återkallelse?

Precision är definieras som antalet sanna positiva delat med antalet sanna positiva plus antalet falska positiva. Medan återkallelse uttrycker förmågan att hitta alla relevanta instanser i en datauppsättning, precision uttrycker andelen av de datapunkter som enligt vår modell var relevanta faktiskt var relevanta.

Rekommenderad: