比特币平台-比特币今日价格-比特币交易平台排名

点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

    正在阅读:新版llama 3 70b反超405b!meta开卷后训练,谷歌马斯克都来抢镜 再一次登上大模型竞技场榜首
    比特币平台-比特币今日价格-比特币交易平台排名> 比特币平台-比特币今日价格-比特币交易平台排名比特币平台-比特币今日价格-比特币交易平台排名>要闻> 正文
    来源:2024-12-07 17:35:45

    克雷西 发自 凹非寺量子位 | 公众号 qbitai

    openai“双12”刚进行到第二天,新版训练就把大模型圈搅得好不热闹!反超

    一边是开克都meta没预告就发布了llama 3.3,70b版本就能实现以前405b的卷后性能。

    另一边谷歌的gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。抢镜

    有网友感叹,o1、反超llama 3.3和新版gemini接连发布,开克都马斯克的卷后grok3也要来,还有gpt-4.5初露端倪……这简直是谷歌最棒的一个圣诞季。

    llama 3.3:70b实现405b效果

    llama 3.3目前只有70b一个型号。

    但在指令遵循(ifeval)、新版训练数学(math)、反超推理(gpqa diamond)等领域,开克都水平都超过了七月份发布的llama 3.1 405b。

    在语言(mmlu)、代码(humaneval)、长文本和多语种能力上,成绩也和llama 3.1 405b比较接近。

    而在工具使用(bfcl)上,和405b的差距则显得稍大一些。

    不过,llama 3.3的使用成本要比llama 3.1 405b低得多。

    虽然llama本身是免费的,但是各个大模型平台的服务价格也可以作为衡量成本的一个参考。

    在meta合作的平台当中,llama 3.3最便宜的价格是0.1/0.4美元每百万输入/输出token。

    而llama 3.1 405b,则是1美元每百万输入token,是llama 3.3的10倍,输出token为1.8美元,是llama 3.3的4.5倍。

    meta生成式ai团队领导者ahmad al-dahle表示,llama 3.3能用70b实现405b的效果,主要是“运用了后训练技术的最新进展”,并点名其中包括在线偏好优化(online preference optimization)。

    meta ai官方账号也提到,llama 3.3的进步归功于新的对齐过程和在线强化学习技术的进步。

    目前,llama 3.3的模型权重已在比特币交易平台排名官网和hugging face上开放下载。

    gemini迎来周岁生日

    gemini 1206上线的这天,刚好是gemini的一周岁生日。

    不过,从节奏和以日期命名的方式来看,gemini更像是一次例行更新(上一个版本是1121)。

    当然成绩还是很不错的,直接登上了lmsys大模型竞技场的榜首。

    而且不只是总成绩夺冠,困难提示词、代码、数学、创意写作等各个单项排名也都是第一。

    实际上,gemini此前有个1114版本,也当了一周的“榜一大哥”,后来被更新的gpt-4o给比了下去。

    现在的最新版本,又让gemini重新回到了榜单上的王座。

    此外,谷歌ai studio产品负责人(原openai开发者社区主管)logan介绍,gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌ai studio和gemini api免费使用。

    谷歌首席科学家jeff dean表示,取得这样的成绩是对gemini生日最好的庆祝方式。

    不过也有网友给谷歌泼了盆冷水,表示o1还没出现在这个榜单上,而且gpt-4.5就要来了,谷歌第一的位置恐怕很快又会被openai夺走。

    one more thing

    除了谷歌和meta,马斯克xai也被盛传即将发布grok 3。

    有网友发现,正在测试的grok 2 mini消失了,认为这是要发grok 3的征兆。

    除了对grok 3的猜测,还有一条更确定的消息——此前要充会员才能用的grok,现在可以免费用了。

    不过免费用户用量比较有限,每两小时只能处理10条消息,而图片分析一天只能处理三张。

    有意思的是,我们试了试询问grok自己,它也表示grok 3计划在这个月上线。

    但抓马的是,点进后面引用的消息源,发现这名博主也是问grok之后发的帖子……

    那么,在这个发布密集的十二月,你最钟意或者最期待哪一款产品呢?

    参考链接:[1]https://x.com/aiatmeta/status/1865079067390956006[2]https://x.com/ahmad_al_dahle/status/1865071436630778109[3]https://x.com/lmarena_ai/status/1865080944455225547

    [ 责编:蔡艺延 ]
    阅读剩余全文()
    网站地图