Suurendamine - ülevaade, vormid, plussid ja miinused, valikupuud

Boosting on algoritm, mis aitab vähendada masinõppe ansambli variatsioone ja kallutatust. Algoritmi algoritmid (Algos) Algoritmid (Algos) on juhiste kogum, mis on kasutusele võetud ülesande täitmiseks. Algoritme tutvustatakse kauplemise automatiseerimiseks, et kasumit teenida inimesele kaupmehele võimatu sagedusega, aitab nõrkade õppurite muutmisel tugevateks õppijateks. ühendades N õppijate arvu.

SuurendamineAllikas: Sirakorn [CC BY-SA]

Suurendamine võib parandada ka algoritmide mudeli ennustusi. Eelkäijad parandavad nõrku õppijaid järjestikku ja selle käigus muudetakse nad tugevaks õppijaks.

Suurendamise vormid

Tugevdamine võib toimuda mitmel kujul, sealhulgas:

1. Kohanduv võimendamine (Adaboost)

Adaboosti eesmärk on ühendada mitu nõrka õppijat, moodustades ühe tugeva õppija. Adaboost keskendub nõrkadele õppijatele, kes on sageli vaid ühe lõhenemisega otsustuspuud ja neid nimetatakse tavaliselt otsustuskändudeks. Adaboosti esimene otsustuskänd sisaldab tähelepanekuid, mida kaalutakse võrdselt.

Varasemad vead parandatakse ja valesti klassifitseeritud tähelepanekutele omistatakse rohkem kaalu kui teistele tähelepanekutele, mille klassifitseerimisel viga ei olnud. Adaboosti algoritme kasutatakse levinud regressiooni- ja klassifitseerimisprotseduurides. Eelmistes mudelites märgatud viga korrigeeritakse kaaluga, kuni on tehtud täpne ennustaja.

2. Gradient Boosting

Gradientide suurendamine, nagu iga teine ​​ansambli masinõppeprotseduur, lisab ansamblile järjestikku ennustajaid ja järgib järjestust eelmiste ennustajate korrigeerimisel, et saada protseduuri lõpus täpne ennustaja. Adaboost parandab oma varasemad vead, häälestades iga iteratsiooni iga vale vaatluse kaalu, kuid gradiendi suurendamise eesmärk on sobitada uus ennustaja eelmise ennustaja poolt tehtud jääkvigade hulka.

Gradiendi suurendamine kasutab gradientset laskumist, et täpsustada väljakutseid õppijate ennustustes. Eelmine viga on esile tõstetud ja, ühendades ühe nõrga õppija järgmise õppijaga, väheneb viga aja jooksul oluliselt.

3. XGBoost (äärmuslik gradienttõus)

XGBoostimg rakendab otsustuspuid suurendatud kalle, parema jõudluse ja kiirusega. Gradiendiga võimendatud masinate rakendamine on suhteliselt aeglane, tingituna mudelitreeningust, mis peab järgima järjestust. Seetõttu puudub neil mastaapsus Mastaapsuse mastaapsus võib langeda nii finants- kui ka äristrateegia kontekstis. Mõlemal juhul tähistab see üksuse võimet taluda nende aeglusest tulenevat survet.

XGBoost sõltub mudeli jõudlusest ja arvutuskiirusest. See pakub erinevaid eeliseid, nagu paralleelsus, hajutatud arvutus, vahemälu optimeerimine ja tuumaväline arvutus.

XGBoost pakub puu ehitamisel paralleelsust, kasutades treeningu ajal protsessori südamikke. Samuti levitab see arvutitööd, kui koolitab masinaklastrite abil suuri mudeleid. Tuumavälist arvutust kasutatakse suuremate andmekogumite jaoks, mis ei mahu tavapärasesse mälumahtu. Vahemiku optimeerimist kasutatakse ka algoritmide ja andmestruktuuride jaoks, et optimeerida saadaoleva riistvara kasutamist.

Boostimise plussid ja miinused

Ansamblimudelina kaasneb võimendusega hõlpsasti loetav ja tõlgendatav algoritm, mis muudab selle ennustustõlgendused hõlpsasti käsitsetavaks. Ennustamisvõime on tõhus, kasutades selle kloonimeetodeid, näiteks kottidesse pakkimine (kottidesse pakkimine) (Bootstrap Aggregation). Ansambli masinõppe saab peamiselt liigitada kottide pakkimiseks ja võimendamiseks. Kottimistehnika on kasulik nii regressiooni- kui ka statistilise või juhusliku metsa ja otsustuspuude jaoks. Boosting on vastupidav meetod, mis ohjeldab üleliigset paigaldamist lihtsalt.

Tõstmise üks puudus on see, et see on tundlik kõrvalnähtude suhtes, kuna iga klassifikaator on kohustatud parandama eelkäijate vead. Seega sõltub meetod liiga kaugelt kõrvalekalletest. Teine puudus on see, et meetodit on peaaegu võimatu laiendada. Seda seetõttu, et iga hindaja lähtub oma õigsuses eelmistest ennustajatest, muutes seeläbi protseduuri raskeks sujuvamaks.

Mis on valikpuud?

Variandi puud on otsustuspuude asendajad. Nad esindavad ansambli klassifikaatoreid, tuletades ühtse struktuuri. Valikupuude ja otsustuspuude erinevus seisneb selles, et esimene hõlmab nii valikusõlme kui ka otsustussõlmi, teine ​​aga ainult otsustussõlmi.

Eksemplari klassifitseerimine nõuab selle puu kaudu filtreerimist. Ühe haru valimiseks on vajalik otsustussõlm, samas kui kogu haruharu võtmiseks on vajalik valikusõlm. See tähendab, et valikuvõimaluse sõlme korral jõuab mitu lehte, mille ennustamiseks on vaja ühendada ühte klassifikatsiooni. Seetõttu on protsessis vajalik hääletamine, kus enamushääletus tähendab, et selle protsessi prognoosiks on valitud sõlm.

Ülaltoodud protsess teeb selgeks, et valikuvõimaluste sõlmedel ei tohiks olla kahte võimalust, kuna need kaotavad hääle, kui nad ei leia kindlat võitjat. Teine võimalus on tõenäosushinnangute keskmise võtmine erinevatelt radadelt, järgides selliseid lähenemisviise nagu Bayesi lähenemisviis või kaalumata keskmiste meetod.

Valikupuid saab arendada ka olemasolevate otsustuspuu õppijate muutmise või valikusõlme loomise kaudu, kus mitu jaotust on omavahel seotud. Iga lubatava tolerantsitaseme piires oleva otsustuspuu saab teisendada valikupuudeks.

Rohkem ressursse

Finance on sertifitseeritud pangandus- ja krediidianalüütiku (CBCA) ™ CBCA ™ sertifikaadi ametlik pakkuja. Certified Banking & Credit Analyst (CBCA) ™ akrediteerimine on krediidianalüütikute ülemaailmne standard, mis hõlmab finantseerimist, raamatupidamist, krediidianalüüsi, rahavoogude analüüsi, pakti modelleerimine, laenu tagasimaksed ja palju muud. sertifitseerimisprogramm, mille eesmärk on muuta keegi maailmatasemel finantsanalüütikuks.

Finantsanalüüsi alal õppimiseks ja teadmiste arendamiseks soovitame tungivalt allpool olevaid täiendavaid finantsressursse:

  • Fintech (finantstehnoloogia) Fintech (finantstehnoloogia) Termin fintech viitab rahanduse ja tehnoloogia sünergiale, mida kasutatakse äritegevuse ja finantsteenuste osutamise tõhustamiseks.
  • Kvantitatiivne rahandus Kvantitatiivne rahandus Kvantitatiivne rahandus on matemaatiliste mudelite ja äärmiselt suurte andmekogumite kasutamine finantsturgude ja väärtpaberite analüüsimiseks. Levinumad näited hõlmavad (1) tuletisinstrumentide nagu optsioonide hinnakujundust ja (2) riskijuhtimist, eriti kui see on seotud portfellihaldusega
  • Võltsimine Võltsimine Võltsimine on häiriv algoritmiline kauplemispraktika, mis hõlmab futuurilepingute ostmiseks pakkumiste või pakkumiste esitamist ning pakkumiste või pakkumiste tühistamist enne tehingu täitmist. Selle tava eesmärk on luua turul valepilt nõudlusest või valepessimismist.
  • Tarkvarainseneri palgajuhend Tarkvarainseneri palgajuhend Selles tarkvarainseneri palgajuhendis käsitleme mitmeid tarkvarainseneride töökohti ja neile vastavaid 2018. aasta keskpalkasid. Tarkvarainsener on professionaal, kes rakendab tarkvaratehnika põhimõtteid disaini, arenduse, hoolduse, arvutis kasutatava tarkvara testimine ja hindamine

Lang L: none (rec-post)