比特币平台-比特币今日价格-比特币交易平台排名
>>

居然:连续三月登顶全球ai视频榜,上海这家大模型初创公司凭什么?|产业进化论

2025-03-16 18:33:55 | 来源:
小字号

说起视频生成模型,如果还只知道sora,那你显然已经out了。

申城大模型创业公司minimax(稀宇科技),旗下“海螺ai”一经推出便成为业界焦点,广受市场好评。不知不觉间,“霸榜”2024年12月和2025年1月的全球ai产品榜“出海总榜”和“视频生成”类。近日揭晓的2月榜单,“海螺ai”不出意外地继续蝉联这两项榜首。

眼下,国内大模型创业领域有“六小强”之说,minimax亦位列其中。这家创立于2021年的科技公司,正不断“挖深”自己的“护城河”,在激烈竞争中杀出重围。现在,“海螺ai”已成为海外逾200个国家和地区ai爱好者口中的热词,也被视为代表中国先进ai水平的代名词。

minimax是通用人工智能科技公司,致力于与用户共创智能。

一张照片就能“拍”电影

sora的横空出世,点亮了视频生成的赛道。然而,和所有新技术一样,视频生成一旦进入生产环境,要想实现行业应用,各种问题便暴露出来。其中,最头疼的就是,要让视频真正承担起叙事任务,就必须把人物一致性的门槛打下来。

很多人都有这样的体验:上一段视频生成的是小a,下一段视频就变成了另一张脸。无论怎么调整,两段视频的主角都无法统一为一个人。

minimax最新自研s2v-01视频模型

直到今年1月,minimax发布最新模型,将这一难题彻底化解。用户只需提供一张人物的正面照片,不论生成多少段风格迥异的视频,主角都是这个人。人们惊呼,给一张照片,还一部大片,这不是梦!

在发展过程中,minimax始终坚持技术驱动。如何在动态视频中保持人物面部多角度的真实度和稳定性,如何在使用连续片段拼接创作时,使人物角色保持高度一致……这些困扰业界的难题,便成为minimax“啃硬骨头”的选择。

研发团队进行了大量技术探索,比选不同的技术路径,最后开发出s2v-01视频模型——只需不到传统方案1%的计算成本和很短的等待时间,就带来了足够好的体验。

值得称赞的是,“海螺ai”在艺术审美上也很“在线”,它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。

可以说,有了minimax的突破,跨视频片段的主体一致性创作痛点成为历史。用户在进行更完整内容表达的视频创作时,也能将更多精力放在内容表达上。

开源“首秀”就抛“王炸”

跨过了“百模大战”的“乱斗”阶段,大模型要“活下来”并走得更远,还有很多技术难关需要攻克:错误率持续降低,无限长的输入和输出,多模态能力……

曾经,在agi(通用人工智能)这件事上,openai一度是风向标。当全球都在希冀openai尽快给出答案,哪怕是解题思路时,minimax已然暗下决心——在算力和数据资源都不占优的条件下,走出一条自己的优化大模型之路。

从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发,这在外人看来无异于一场豪赌。幸运的是,minimax赢了!在成功推出国内首个基于moe架构的模型后,研发团队又把目光投向了能够几倍提升模型速度的技术难关——线性注意力。

在大部分学术集上,minimax都取得了比肩海外第一梯队的结果。

今年1月,minimax开源“首秀”,出手就是俩“王炸”:基础语言大模型minimax-text-01和视觉多模态大模型minimax-vl-01。在与海外顶尖模型的基准性能测试对比中,这两款模型在多个核心任务中表现毫不逊色,甚至在某些任务上更胜一筹。在综合性能比肩海外顶尖模型的基础上,minimax-text-01更是在长文本上带来惊喜——支持最多400万个token的上下文输入。【相关阅读:上海大模型公司提出新架构,传统transformer架构不再是唯一选择】

这是什么概念呢?400万token上下文窗口可以一次性处理约700万个汉字。通行的一百二十回本《红楼梦》总字数约为96万字,700万个汉字相当于7部多《红楼梦》。

更值得关注的是,minimax在架构上做出了大胆创新,以大规模应用线性注意力机制打破transformer传统架构记忆瓶颈。这也是中国公司首次突破传统transformer架构。

minimax-text-01模型架构

研发人员要有“极致热情”

“在ai行业蓬勃发展的当下,开源与开放精神正在成为业界共识。”minimax副总裁刘华告诉新民晚报记者。他进一步解释,高水平模型的开源能够让普罗大众免费体验大模型的技术能力,从而推动ai技术的普及和渗透率的提升;同时,开源还能吸引更多开发者参与,共同推进大模型行业快速发展。

minimax开发者社区负责人蔡佳人补充说,在让ai变得可用、好用这件事上,全球开发者的智慧不可或缺。对模型优化的建议、创作者体验的问题,minimax都会高度重视,也会积极响应跟进;而开源模型的后续更新,也会第一时间与开发者们分享。

刘华还认为,创业公司在中国大模型领域将继续发挥重要作用——大模型研发框架的敏捷迭代要求研发人员对技术变革抱有极致热情,而不能仅仅依赖过去经验。大量聘用年轻研究员并充分授权,打造科学的研发组织体系,是组建高效大模型研发团队的唯一路径。minimax就拥有这样一支年轻的研发团队,大部分成员在35岁以下,许多博士还在读书阶段就加入公司作为实习生。

“ai行业充满了活力和发展潜力,但想站上世界舞台,绝不能靠走捷径。作为创业公司,minimax会保持专注,让技术回归技术本身。”刘华如是说。

(责编:陈羽、刘圆圆)

分享让更多人看到

客户端下载

热门排行

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
返回顶部
网站地图