比特币平台-比特币今日价格-比特币交易平台排名

点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

    正在阅读:openai 活动第二弹:“强化微调”打造领域专家 ai 模型 it之家 12 月 7 日消息
    比特币平台-比特币今日价格-比特币交易平台排名> 比特币平台-比特币今日价格-比特币交易平台排名比特币平台-比特币今日价格-比特币交易平台排名>要闻> 正文
    来源:2024-12-07 17:35:39

    it之家 12 月 7 日消息,强化微调openai 启动了为期 12 天的活动“shipmas”新品发布周期,将推出一系列新功能、第弹打造新产品以及相关演示。领域本次活动第二日,模型openai 推出了强化微调(reinforcement fine-tuning),强化微调帮助开发者和机器学习工程师打造针对特定复杂领域任务的活动专家模型。

    该项目通过全新的第弹打造模型定制技术,让开发者可以使用高质量任务集对模型进行微调,领域并利用参考答案评估模型的模型响应,从而提升模型在特定领域任务中的强化微调推理能力和准确性。

    强化微调简介

    it之家附上官方介绍:开发人员能够使用数十到数千个高质量任务,活动定制 openai 的第弹打造模型,并使用提供的领域参考答案对模型的响应进行评分。官方表示这项技术强化了模型推理类似问题的模型方式,并提高了其在该领域特定任务上的准确性。

    与标准微调不同,rft 利用强化学习算法,可以将模型性能从高中水平提升到专家博士水平。

    rft 与监督式微调不同,它不是让模型模仿输入,而是教模型以全新的方式进行推理,通过对模型答案进行评分并强化正确的推理路线,rft 只需少量示例即可显著提高模型性能。

    rft 支持用户利用自己的黄金数据集创建独特的模型,并将其应用于法律、金融、工程、保险等需要专业知识的领域。

    强化微调面向群体

    openai 励研究机构、高校和企业申请,特别是那些目前由专家领导执行一系列狭窄复杂任务,并且将受益于人工智能协助的机构。

    openai 表示强化微调在结果具有客观“正确”答案,且大多数专家会同意的任务中表现出色,因此认为在法律、保险、医疗、金融、工程等领域会有更好的表现。

    参与者可提前访问 alpha 版强化微调 api,并在特定领域任务中进行测试,此外 openai 鼓励参与者分享数据集,共同改进 openai 模型。

    openai 预计 2025 年初公开发布强化微调功能。

    openai首席执行官山姆・阿尔特曼(samaltman)表示:“强化微调,效果出奇地好;它是我 2024 年最大的惊喜之一。”

    [ 责编:林恩宇 ]
    阅读剩余全文()
    网站地图