Overfitting

Ti Wikipédia, énsiklopédia bébas basa Sunda
Luncat ka: pituduh, sungsi

Dina statistik, overfitting nyaeta model statistik keur nyocogkeun niley nu ngabogaan sababaraha parameter. Model absurd sarta falsu bakal cocog sacara sampurna lamun ieu model mibanda karudetan nu cukup dibandingkeun jeung jumlah data nu aya. Overfitting ilaharna diwangun ku susunan Occam's razor.

Widang anyar nu keur ilahar dipake dina konsep overfitting nyaeta machine learning. Ilaharna algorithm diajar nyaeta ngajarkeun ku ngagunakeun sababaraha susunan latihan, upamana migunakeun sababaraha kaayaan nu hasil ahirna geus dipikawanoh. Nu diajar nganggap yen ngaramalkeun yen hasil nu bakal kahontal bakal nembongkeun hasil nu bener lamun dipake kana conto sejenna, ku sabab kitu kaayaan umum ieu teu katembong salila diajarkeun (dumasar kana inductive bias). Sanajan kitu, umumna dina kasus nu aya salila diajar ngabutuhkeun waktu nu lila atawa conto latihan nu kawilang langka, nu diajar bakal ngadeukeutkeun maneh kana sababaraha hal husus variabel acak salila diajar, nu taya hubungan baraya jeung fungsi target nu bakal kahontal. Dina proses overfitting ieu, hasil nu ditembongkeun dina nu diajar masih alus sedengkeun hasil dina data nu teu katempo bakal leuwih goreng.

Boh dina statistik jeung machine learning, dina usaha keur meunang hasil nu cocog, perlu ditambahkeun teknik sejenna(upamana validasi silang, early stopping), nu bisa nembongkeun yen lengkah diajar saterusna lain dihasilkeun tina ka-ilaharan nu panghadena. Dina treatment learning, niley minimum nu ngadukung pangalusna nu dipake keur nangtukeun niley nu cocog dina overfitting.