小米14是不是被X100秒了？

细针密缕网

发布时间：2024-07-05 21:10:26

“O”:视频输出。2023年，我们看到了文字到视频合成的浪潮:WALT（谷歌）、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等，数不胜数。然而，大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。

9. 多模态AI将成为新常态。苹果公司的Ferret和特斯拉的FSD正在引领潮流。但挑战也会随之而来。视觉、听觉，甚至是感觉?

更多跨行业的知名创作者站出来反对未经创作者同意而训练的AI生成模型。

这一功能的背后是阿里通义实验室自研的视频生成模型Animate Anyone。在Github上，该项目的Star数短短数日就超过1万，被认为是近期大模型领域最受欢迎的大模型算法之一。