五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

大模型底層原理與應(yīng)用開發(fā)范式

2023-06-03 15:29 作者:彤蛹_Amy  | 我要投稿

?
10:08
?

參數(shù)從小到大,模型的生成就從確定/重復(fù)到隨機(jī)/新穎

top_p是前百分之p

top_k是排名前k

repetition_penalty是重復(fù)懲罰

max_length是指prompt長(zhǎng)度+生成文本長(zhǎng)度

max_new_tokens是指生成文本長(zhǎng)度

?
13:55
?

小模型:參數(shù)幾百萬或幾千萬

?
17:42
?

對(duì)話方式完成

微調(diào)、零樣本(zero-shot)、少樣本(few-shot)

?
20:13
?

省略復(fù)雜過程,給出任務(wù)適配prompt

推薦用于頭腦風(fēng)暴類的任務(wù)

?
23:41
?

為什么需要embedding輔助?

  • 長(zhǎng)度限制;
  • 相關(guān)信息不是所有信息;
  • 效率;
  • 費(fèi)用

?
29:08
?

為什么要微調(diào)?

  • 公開數(shù)據(jù)太少
  • 有些知識(shí)不對(duì)
  • 特定任務(wù)表現(xiàn)不佳
  • 不具備某些能力

不同微調(diào)對(duì)比:

API微調(diào)的基本流程:


?
36:50
?

對(duì)開發(fā)者的能力需求:

工具選擇:


?
43:38
?


大模型底層原理與應(yīng)用開發(fā)范式的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
临湘市| 江门市| 建瓯市| 丽水市| 辉南县| 读书| 金寨县| 蛟河市| 西丰县| 鸡泽县| 家居| 昭通市| 江永县| 辉南县| 嘉兴市| 雅安市| 大名县| 安丘市| 三原县| 修武县| 鄯善县| 综艺| 昌都县| 天津市| 威海市| 无为县| 辽源市| 新竹县| 彩票| 永顺县| 临沂市| 五寨县| 汤原县| 唐河县| 海伦市| 和顺县| 白水县| 江油市| 固镇县| 方正县| 宜良县|