可灵大模型(Kling):首个国产对标Sora的视频生成大模型

可灵大模型(Kling):首个国产对标Sora的视频生成大模型

可灵大模型(Kling)是一款具备强大视频生成能力的自研大模型,采用先进的技术实现长达 2 分钟视频生成、模拟物理世界特性、概念组合能力等,可生成电影级画面。可灵大模型(Kling)是由快手大模型团队自研打造的文生视频大模型,具备强大的ai视频生成能力 让用户可以轻松高效地完成艺术视频创作。可灵大模型采用了与Sora相似的技术路线,并结合了多项自研技术创新。可灵大模型的效果对标了之前发布的Sora。它能模拟真实物理世界,转化用户想象为具体画面,并支持多种视频宽高比,适用于多样化的视频制作和内容创作需求。

此外,基于“可灵”大模型,未来还将有更多应用方向即将落地,近期将首发“AI 唱跳”新玩法,可以同时驱动表情和肢体动作,仅需一张照片就能生成“唱跳”视频。

可灵大模型(Kling)功能

  • 大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。
  • 长达2分钟的视频生成:得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。
  • 模拟物理世界特性:基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
  • 强大的概念组合能力:基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。
  • 电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。
  • 支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。
  • 可灵大模型的应用场景

    影视制作:用于生成电影或电视剧中的特效场景,减少实景拍摄成本。

    社交媒体:用户可以创作独特的视频内容,用于社交媒体平台分享。

    艺术创作:艺术家和设计师使用可灵大模型来实现他们的创意构想。

    广告行业:设计吸引人的广告内容,通过高质量的视频广告提升品牌影响力。

    虚拟现实(VR)和增强现实(AR):创造沉浸式体验,提供逼真的虚拟环境和元素。

    游戏开发:生成游戏内的场景和动画,提供更加丰富和动态的游戏体验。

    新闻媒体:快速生成新闻报道中的动态图像和背景视频。

     

    官网链接:https://kling.kuaishou.com/

    © 版权声明

    相关文章