AI与科技出海生态平台

清华系多模态大模型公司融资数亿元,力争与Sora比肩!

3月12日,生数科技完成新一轮数亿元融资。由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品创新及市场拓展。

生数科技成立于2023年3月,是多模态大模型公司,致力于图像、3D、视频等原生多模态大模型的研发。生数科技核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。此前公司已完成近亿元融资,过往股东还包括蚂蚁集团和锦秋基金等知名机构。

2022年已提出类DiT架构U-ViT

在扩散模型方面,生数科技团队是国内率先开启该方向研究的团队,成果涉及骨干网络、高速推理算法、大规模训练等全栈技术方向。

2022年9月,生数科技创始成员提出了基于Transformer的网络架构U-ViT,这与Sora和Stable Diffusion3背后采用的Diffusion Transformer架构DiT,在架构思路与实验路径上完全一致。值得关注的是,这项工作在CVPR 2023发表,早于DiT。

对此,生数科技CEO唐家渝表示:

我们积累了完整高效的工程化经验,拥有在大规模GPU集群上实现高效兼容、低成本的模型训练经验,整体上来讲,我们追赶Sora肯定比追赶GPT-4轻松很多。

今年一定能达到Sora目前版本的效果,很难说是三个月还是半年(笑),但这件事我们的信心还是非常足的。

2023年3月,团队开源了全球首个基于Diffusion Transformer架构(U-ViT)的多模态扩散大模型UniDiffuser,依托底层U-ViT架构的创新尝试,截至2023年9月,生数科技推出了基于统一的多模态多任务框架的产业级通用基础大模型(闭源版)。

在商业化落地方面,依托于全面领先的MaaS(模型即服务)能力,生数科技在2B、2C端同时发力,一方面以API的形式向B端机构直接提供模型能力,另一方面打造垂类应用产品,按照订阅等形式收费。目前公司已与多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作,开放模型服务,提供AIGC个性化体验、定制化内容生产等方面的能力。

同时也于去年上线两款工具产品:视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft,面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域提供赋能,提升创作效率。

近期,生数科技向外界表示,其将与近日重点突破长视频生成能力,力争与Sora比肩!

赞(13)
未经允许不得转载:维端网 » 清华系多模态大模型公司融资数亿元,力争与Sora比肩!
分享到

AI与科技出海生态平台

联系我们关于维端

登录

找回密码

注册