日前,首部AI生成长篇电影《Our T2 Remake》在洛杉矶正式举行线下首映礼。
该片翻拍自卡梅隆执导的经典科幻片《终结者2》(1991年),呈现了一个人类对抗ChatGPT统治的世界,探讨当代AI发展的影响。
由50位AI领域的艺术家分段创作,他们借助ChatGPT、Midjourney、Pika、Kaiber等人工智能技术,影片创作全程都由AI完成。
虽然由AI生成的场景相对粗糙,很多细节经不起推敲,但不可否认的是,“这将成为AI在电影制作应用中的一个重要里程碑,他们向世界展示了,通过AI创作自己喜欢的史诗级故事的能力”,正如该片制作团队在首映礼上所说。
如果说2023年是生成式人工智能技术“狂奔的一年”,那么2024年则有望成为人工智能应用大发展的“元年”。随着AI生成视频技术的迅速发展和广泛应用,也将为各行各业带来新机遇。
01 虚拟人生成
虚拟人是综合运用文本、图像、音频等生成技术,打造综合外观、表情等产出全面拟人化的数字内容。其中,非交互式虚拟人的生成依赖于输入的内容,真人驱动的虚拟人依赖于真人的实时反映,交互式虚拟人可以全自动化。
2022年内容消费型虚拟人和工具型虚拟人应用占比分别未86.9%和13.10%。未来随着虚拟人生成技术的成熟和成本的下滑,2030年内容消费型虚拟人占比下滑至58.5%,工具型和内容生产型虚拟人上升至27.7%和13.8%。
工具型虚拟人商业模式以通过定制来收取定制费用或租赁费为主,由于存在技术壁垒和成本过高问题,商业变现空间有限。内容型虚拟人以IP盈利为主,商业模式更为成熟,目前IP商业模式市场竞争激烈。
C端虚拟人粉丝群体较为年轻化,15-34岁的用户群体占比在60%,虚拟人外观、内容质量和性格是影响用户成为虚拟人粉丝群体和脱离虚拟人粉丝群体的前三大因素。
02 音视频生成
AI生成音频是指以语言模型为中介,对音乐数据进行双向转化,进而实现合成模拟人的音调的语音、音乐作曲等。以谷歌的AudioLM模型为例,该模型有51.2%的成功率能够让人类分辨不出是AI生成的。
AI生成音频的应用场景包括TTS场景和乐曲/歌曲生成场景,TTS应用成熟度高于乐曲生成。国内短视频平台、音乐平台等头部尝试均开始研发和实践AI作曲,均未实商业化应用。
AI生成视频指基于文本、图像和视频数据库,通过模型训练后,达到文本转图像后转视频或文本转视频的效果。目前市面上主流的AI视频生成工具以海外工具为主,包括Make-A-Video、Phenaki等,均未实现商业化。
AI深度合成视频自2021年始进入爆发性增长阶段,数量达到24,317条,其视频的内容数量最多的为影视娱乐。从AI视频生成的落地场景来看,视频属性编辑落地最广和技术最浅,视频部分生成落地较少,技术难度最高。
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)