五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網 會員登陸 & 注冊

開源社區(qū)的新勝利:LLEMMA只需要一半參數就達到了閉源的谷歌的Minerva

2023-10-24 15:27 作者:ReadPaper論文閱讀  | 我要投稿

近期,普林斯頓大學和EleutherAI等研究者為解決數學問題訓練了一個特定領域的語言模型。他們認為數學推理是AI的核心任務,且能夠進行強數學推理的語言模型是許多研究課題的上游。他們提出的方法,通過對Proof-Pile-2進行持續(xù)的預訓練,使語言模型適應數學,從而得到了LLEMMA:7B和34B的基礎語言模型,其數學能力大幅提高。LLEMMA?7B的性能遠超谷歌Minerva?8B,而LLEMMA?34B在參數少近一半的情況下性能逼近Minerva?62B。

論文鏈接:https://arxiv.org/pdf/2310.10631.pdf

Readpaper鏈接:https://readpaper.com/paper/2008650305127561472

Github鏈接:https://github.com/EleutherAI/math-lm


詳細介紹:

數據集:Proof-Pile-2?是為培訓或微調特定領域的大型語言模型而創(chuàng)建的,專門用于一般數學任務。數據集由純文本文檔組成,每個實例都是一個純文本文檔,伴隨著其原始分割和文件名或位置的元數據。而且,數據集也是開源的!

在?MATH?基準測試中,LLEMMA?的表現超越了所有已知的開放基模型。此外,LLEMMA?能夠使用工具并進行正式的定理證明,而無需進一步的微調。

應用:該數據集已被用于訓練?LLEMMA?語言模型作為一個領域適應和持續(xù)預訓練語料庫。它特別針對數學領域的高質量語言建模語料庫,但也可能對通用語言建?;蚱渌搭A見的下游用途有用。


觀點:

從學術角度看,這種模型為數學研究提供了一個強大的工具,可以幫助研究人員更快地解決問題和驗證理論。而且,也提供了一個數據集,可以讓大家繼續(xù)在這上面進行深度的挖掘。

從商業(yè)角度看,LLEMMA?可以被集成到各種應用中,如教育軟件、自動化工具和研究平臺,為用戶提供即時的數學解決方案。而且,這種公開透明的模型也容易被大家接受,而不是嘴上說著領先卻沒有任何說明的模型。


特邀作者:日本早稻田大學計算機系博士? 王軍杰?

開源社區(qū)的新勝利:LLEMMA只需要一半參數就達到了閉源的谷歌的Minerva的評論 (共 條)

分享到微博請遵守國家法律
达拉特旗| 宣威市| 莎车县| 巧家县| 万安县| 顺义区| 库伦旗| 仁布县| 甘肃省| 拉孜县| 邻水| 佛山市| 万荣县| 许昌市| 蒙自县| 黑山县| 买车| 嵩明县| 万宁市| 恩施市| 赣州市| 长海县| 若羌县| 贵港市| 凤台县| 佛学| 从化市| 洪泽县| 博湖县| 绥棱县| 昌吉市| 牙克石市| 利津县| 宣武区| 南召县| 肃南| 新源县| 辉县市| 囊谦县| 乐平市| 富平县|