Kailan gagamit ng holdout?

Kailan gagamit ng holdout?
Kailan gagamit ng holdout?
Anonim

Ano ang Holdout Set? Kung minsan ay tinutukoy bilang data ng “pagsusubok,” ang isang holdout na subset ay nagbibigay ng panghuling pagtatantya ng performance ng machine learning model pagkatapos itong masanay at ma-validate. Hindi kailanman dapat gamitin ang mga hanay ng holdout upang gumawa ng mga pagpapasya tungkol sa kung aling mga algorithm ang gagamitin o para sa pagpapabuti o pag-tune ng mga algorithm.

Mas maganda ba ang cross validation kaysa holdout?

Cross-validation ay karaniwang ang gustong paraan dahil binibigyan nito ang iyong modelo ng pagkakataong magsanay sa maraming train-test split. Nagbibigay ito sa iyo ng mas magandang indikasyon kung gaano kahusay ang gaganap ng iyong modelo sa hindi nakikitang data. Ang hold-out, sa kabilang banda, ay nakadepende lamang sa isang train-test split.

Ano ang holdout approach?

Ang

Holdout Method ay ang pinakasimpleng uri ng paraan upang suriin ang isang classifier. Sa pamamaraang ito, ang set ng data (isang koleksyon ng mga item ng data o mga halimbawa) ay pinaghihiwalay sa dalawang set, na tinatawag na set ng Pagsasanay at set ng Pagsubok. Ang isang classifier ay gumaganap ng function ng pagtatalaga ng mga item ng data sa isang ibinigay na koleksyon sa isang target na kategorya o klase.

Dapat ba akong palaging mag-cross validation?

Sa pangkalahatang cross validation ay laging kailangan kapag kailangan mong tukuyin ang pinakamainam na parameter ng modelo, para sa logistic regression ito ang magiging C parameter.

Ano ang bentahe ng K-fold cross validation?

kung ihahambing mo ang mga test-MSEs ay mas mahusay sa kaso ng k-fold CV kaysa sa LOOCV. k-fold CV o anumang CV o resampling pamamaraan ay hindipagbutihin ang mga error sa pagsubok. tinatantya nila ang mga error sa pagsubok. sa kaso ng k-fold, ito ay mas mahusay na trabaho ng pagtatantya ng error kaysa sa LOOCV.

Inirerekumendang: