一種深度學(xué)習(xí)中超參數(shù)的優(yōu)化選取方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201810282510.0 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN108470210A | 公開(kāi)(公告)日 | 2018-08-31 |
| 申請(qǐng)公布號(hào) | CN108470210A | 申請(qǐng)公布日 | 2018-08-31 |
| 分類號(hào) | G06N3/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 曹連雨 | 申請(qǐng)(專利權(quán))人 | 中科弘云科技(北京)有限公司 |
| 代理機(jī)構(gòu) | - | 代理人 | - |
| 地址 | 100085 北京市海淀區(qū)西二旗西路2號(hào)院領(lǐng)秀新硅谷B區(qū)83號(hào)樓3單元102 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種深度學(xué)習(xí)中超參數(shù)的優(yōu)化選取方法,其步驟為:定義n個(gè)待訓(xùn)練模型;定義函數(shù)eval以當(dāng)前變化的模型參數(shù)θ的值來(lái)評(píng)估模型的優(yōu)劣,隨機(jī)選取數(shù)個(gè)θ的值,計(jì)算得出相應(yīng)的eval(θ);計(jì)算這些點(diǎn)中每一個(gè)點(diǎn)的均值和方差,再預(yù)估可能的使eval(θ|h)最大的θ取值;得到下一采樣點(diǎn)后,計(jì)算eval(θ|h);如果此時(shí)的step數(shù)滿足預(yù)設(shè)條件則進(jìn)入下一步驟,否則回到循環(huán);計(jì)算當(dāng)前所有并行計(jì)算模型的eval(θ|h),并將其從大到小排序,定義優(yōu)質(zhì)及劣質(zhì);對(duì)每一個(gè)劣質(zhì)模型進(jìn)行淘汰操作;對(duì)每一個(gè)完成淘汰操作的劣質(zhì)模型,立即進(jìn)行進(jìn)化操作;步驟完成后,回到循環(huán)。本發(fā)明在加快參數(shù)優(yōu)化耗時(shí)的同時(shí),可以有效減少資源消耗,并且可應(yīng)對(duì)多超參數(shù)的情況。 |





