曾经搅动A股的明星视频生成应用Pika又“杀”回来了。近日,Pika官宣已完成总额8000万美元的B轮融资,此轮融资后,Pika总融资额已达1.35亿美元,估值将超过4.7亿美元。几乎是同一时间,大模型创业公司生数科技宣布完成数亿元Pre-A轮融资,两个月前,生数科技刚刚联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。从Pika到Sora再到Vidu,显然,视频生成赛道已经“入夏”。
“天才”Pika
按时间顺序排名,在视频生成领域,OpenAI的Sora还算不上第一。早在2023年11月,美国AI视频生成创业公司Pika就推出了Pika 1.0,能够生成和编辑3D动画、动漫、卡通和电影等各种风格的视频,迅速走红网络。当时,Pika同时宣布,公司已经获得了总金额5500万美元的融资。
如今沉寂半年多,Pika又有新进展。近日,Pika在其官网宣布,已完成总额8000万美元的B轮融资,由Spark Capital领投,Greycroft、Lightspeed Venture Partners以及Jared Leto参投。Pika团队表示,这一轮融资将加快公司构建最佳视频模型的进程,同时帮助聘用优秀的人才。据悉,成立一年以来,Pika团队已经从3人扩大至13人。
Pika成立于2023年4月,创始人郭文景和孟辰霖都是斯坦福大学AI Lab博士生,她们分别专注于NLP和计算机视觉两个方向的AI研究。不过相比于视频生成的惊人效果,Pika曾一度被“花边”新闻抢了眼球,比如郭文景身上“95后”、高颜值、天才少女的标签。
其中最“出圈”的一件事,莫过于Pika 1.0发布后,A股公司信雅达股价的一路飙升。彼时,郭文景被发现系信雅达实控人郭华强之女,信雅达也因此被戏称为“女儿概念股”。
此后,信雅达多次发布公告称,未投资Pika,也无投资Pika的计划。信雅达未与Pika有任何业务往来,Pika开发团队创始人之一郭文景未在信雅达任职,信雅达与Pika无人员往来。
公开报道显示,信雅达总部成立于1996年,是浙江首家在国内主板上市的软件公司。信雅达是一家金融科技公司,主营业务是为银行等金融机构提供软件产品及服务。
有媒体援引知情人士的消息称,Pika本轮能继续获得大额融资,或与其即将推出的新品直接相关。“新品目前仍在保密状态,但从行业目前的发展趋势看,DiT架构的优化和新拓展会是新品的关注重点。”对此,北京商报记者联系了Pika,但截至发稿未收到回复。
掉队与追赶
融资与新品关联的猜测,并不让人意外。Pika 1.0发布到现在的半年多时间里,视频生成领域发生了什么?
2024年2月,OpenAI发布视频生成模型Sora,逼真的视觉效果和对物理世界的理解让外界将其形容为“王炸级神器”。2024年4月,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu,也被誉为“中国首个Sora级视频大模型”。
2024年5月,谷歌全面叫板OpenAI,其中视频生成领域,发布对标Sora的文生视频模型Veo。2024年6月,快手“可灵”视频生成大模型上线。官方表示,可灵大模型为快手AI团队自研,采用Sora相似的技术路线,号称结合多项自研技术创新、效果对标Sora。
而在Pika之前,还有一个重量级玩家Runway。Pika 1.0发布的时候,Runway便宣布旗下视频生成模型Gen-2上线“运动画笔”功能。今年1月,Runway又宣布推出多重运动画笔功能,效果惊艳,堪称视频生成方面的杀手级升级。
与众多“友商”对比,Pika存在一个相当明显的短板——时长。Pika目前仍然只能生成4秒高清连贯视频,而Sora最高能到60秒,Veo最长超过60秒,Vidu能到16秒,Gen-2为18秒……
这种劣势可能也影响了Pika的发展。有数据显示,刚上线时,Pika的网站访问量在1个月内增长约两倍,而据最新数据,4月Pika的网站访问量仅200万,较去年11月刚上线时多了40万。
“能够生成更长时间的视频,意味着可以更好地满足用户对于故事叙述、情节展开等方面的需求。同时,也可能成为一种市场差异化策略。”在接受北京商报记者采访时,北京市社会科学院副研究员王鹏说,生成长时间视频需要模型能够保持动作和场景的连贯性,这在技术上是一个挑战。此外,也对计算资源、数据集质量、模型稳定性提出了更高要求。
不过知名战略定位专家、福建华策品牌定位咨询创始人詹军豪对北京商报记者提到,除了时长之外,视频的质量、内容多样性、生成速度以及用户体验等因素同样重要。一个优秀的文生视频模型应该能够生成高质量、多样化的视频内容,并且能够快速响应用户的需求,提供流畅、自然的观看体验。
谁会跑赢
时长上的劣势不意味着Pika一直在原地踏步。比如今年3月,Pika官宣了音效新功能Sound Effects,实现了为AI视频生成配音。
此外,Pika也于今年初向公众开放,基础版免费的同时,还推出了付费订阅模式,目前已有每月8美元的标准版、每月28美元的无限版和每月58美元的专业版。
相较而言,Sora至今还未向公众全面开放。今年3月,OpenAI曾提到,Sora文生视频工具计划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。
而今Pika融资更重要的意义,或许在于市场的认可。王鹏称,这显示了资本市场对文生视频技术的强烈兴趣和投资意愿,这种资金支持为技术的进一步研发和市场推广提供了动力。中国企业资本联盟副理事长柏文喜也对北京商报记者提到,文生视频技术代表了AI领域的前沿创新,能够生成逼真的视频内容,这在技术上具有挑战性,也吸引了大量研究和投资。
值得一提的是,就在Pika宣布完成B轮融资的时候,生数科技也宣布,于近日完成数亿元Pre-A轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投等数位老股东继续支持。
詹军豪称,文生视频成为AIGC的热门赛道,首先是因为视频内容在当今数字媒体时代占据了举足轻重的地位,而文生视频技术能够自动生成高质量的视频内容,极大地降低视频制作的门槛和成本,满足了市场对多样化、高效化内容生产的需求。
其次,詹军豪认为,文生视频技术也受益于深度学习、自然语言处理、计算机视觉等技术的快速发展,这些技术的进步使得文生视频模型能够更准确地理解文本和图像信息,并生成更加真实、自然的视频内容。最后,随着虚拟现实、增强现实等技术的普及,视频内容的呈现形式也将更加多样化,文生视频技术有望在这些新兴领域发挥更大的作用。
除用户需求等方面外,柏文喜也提到,文生视频技术在广告、电影制作、虚拟现实等商业领域具有巨大的应用潜力,能够创造新的商业模式和收入来源。随着Sora等模型的出现,文生视频技术取得了显著的进展,这进一步激发了行业对于该技术的兴趣和投资。