Overfitting

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, paluruh


Dina statistik, overfitting nyaéta modél statistik keur nyocogkeun niley nu mibanda sababaraha paraméter. modél absurd sarta falsu bakal cocog sacara sampurna lamun ieu modél mibanda karudetan nu cukup dibandingkeun jeung jumlah data nu aya. Overfitting ilaharna diwangun ku susunan Occam's razor.

Widang anyar nu keur ilahar dipaké dina konsép overfitting nyaéta machine learning. Ilaharna algorithm diajar nyaéta ngajarkeun ku ngagunakeun sababaraha susunan latihan, upamana ngagunakeun sababaraha kaayaan nu hasil ahirna geus dipikawanoh. Nu diajar nganggap yén ngaramalkeun yén hasil nu bakal kahontal bakal nembongkeun hasil nu bener lamun dipaké kana conto séjénna, ku sabab kitu kaayaan umum ieu teu katembong salila diajarkeun (dumasar kana inductive bias). Sanajan kitu, umumna dina kasus nu aya salila diajar ngabutuhkeun waktu nu lila atawa conto latihan nu kawilang langka, nu diajar bakal ngadeukeutkeun manéh kana sababaraha hal husus variabel acak salila diajar, nu taya hubungan baraya jeung fungsi target nu bakal kahontal. Dina prosés overfitting ieu, hasil nu ditembongkeun dina nu diajar masih alus sedengkeun hasil dina data nu teu katempo bakal leuwih goreng.

Boh dina statistik jeung machine learning, dina usaha keur meunang hasil nu cocog, perlu ditambahkeun téhnik séjénna(upamana validasi silang, early stopping), nu bisa nembongkeun yén léngkah diajar saterusna lain dihasilkeun tina ka-ilaharan nu panghadéna. Dina treatment learning, niley minimum nu ngadukung pangalusna nu dipaké keur nangtukeun niley nu cocog dina overfitting.