当前位置：首页 > Manus技术交流 > 正文内容

Manus AI能生成视频了，实测发现不少翻车名场面，网友：有种2011年的美功能全面但效果随机

3个月前 (06-06)Manus技术交流361

Manus AI能生成视频了，实测发现不少翻车名场面，网友：有种2011年的美功能全面但效果随机！当代AI视频创作者有三件套：提示词、积分和抽卡。继Veo 3刚刚掀起一轮小高潮后，Manus也能生成视频了，功能挺全。经过实测，在Agent加持下，支持图生视频、文生视频等标配功能。该功能目前已经向Basic、Plus和Pro用户开放抢先体验。

如果你指望它一句话秒出大片，那还是先降低心理预期。高情商地说，不是不能用，只是抽卡的概率有些感人；低情商地说，花里胡哨，视频质量有种2011年的美。按照过往惯例，Manus大概率也是套壳某家AI视频模型，但目前还没厂商认领。经过一轮实测，我们总结出几个特点：抽卡严重，基本默认生成约5秒的「默剧」片段；借助Agent的规划流程，长视频体现出一定优势；5秒视频约消耗40-50积分，成片生成速度较快；图生视频效果能打，但也随机抽卡。

从体验上看，Manus的图生视频明显要比文生视频靠谱得多。上传一张威尔史密斯的照片作为参考，让其生成吃面的视频，效果还算可接受，风格统一、角色一致性尚可。肤色和构图风格维持得比较好，相比于当前的视频主流模型，算得上是正常发挥。并且，5秒的视频仅扣了44积分，如果是普通用户，开通一个Basic账号，积分也足够用了。经实测，生成速度也谈不上慢，一般几分钟就能收到成片。

另一个测试中，我们上传了一张红发女性坐在雨夜窗边的图像，并描述了整体氛围：「怀旧、沉思、柔光、雨滴打在窗上」。借助Agent的规划能力，Manus懂得拆分细节，尤其是对抽象概念的理解，不仅铺垫清晰，也说明模型本身具备一定的情感语义理解能力。展现了红发女性在雨夜窗边的沉思场景，包含了细微的动态元素，如轻柔的头部动作、眨眼、雨滴在窗玻璃上缓缓滑落，保持了原有的怀旧氛围和内省情绪，柔和的环境光线营造出温暖而沉思的氛围。

世界首富马斯克最近「水逆」严重，在AI提示词的拨弄下，也走上了直播带货的道路，虽然视频没有声音，但光看表情动作，耳边隐约响起了「三二一上链接」的声音。可爱的怪物走着走着，给它换上一个在糖果仙境中行走的背景，画面挺童话，更深层的逻辑在于考验角色和形象一致性。当然，要是再加大点难度，Manus就招架不住了。比如，想让《韩熙载夜宴图》的古人们活动起来，结果大多数人物都是定格不动，最左边弹琵琶的女子的动作倒是动起来了，但手部出现过于明显的虚影。成品和Manus规划的细节也完全不在一个频道上。

文生视频的效果则比较随机，全靠运气。我们尝试复现官网给到的案例，场景是宇航员在月球上捡到一块刻有「Manus」的石头，同样的流程，相当上道的Manus很快规划出一套分镜，看着有模有样。但真看完成品，就主打一个中规中矩。谈不上翻车，也不算太惊喜，镜头质量完全进入了抽卡环节。

参考Veo 3的官方提示词，让其生成一个老水手在船上面对大海的画面。这回效果居然还真不错，风吹了，海浪也有了，老水手一手拿着烟斗，指向船舷外翻腾的蓝色大海，一次性抽卡成功。最近OpenAI的宫斗风波马上要被影视化了，我们也试着用新版DeepSeek R1创作了一个剧本，然后尝试用Manus创作一分钟的短视频。尽管Manus理论上可以生成很长时间的视频，但最终得到的回复是：每个视频片段约为5秒，最终作品总时长约20秒。让其生成一个人走在一座令人惊叹的未来城市中的视频，走倒是走了，但只留下了一个寂寞的背影，没有表达出应有的张力。

临近高考，本想蹭点「一举高中（粽）」气氛，生成一个三个学生抬着粽子往前走的视频，但作品一出来，建议打马赛克。过去这段时间，Manus的更新节奏明显加快，时不时就会上线一个新功能，比如PPT、图片以及视频生成。乍看之下，它的产品形态已经很「饱满」：支持多模态输入、支持Agent流程规划、具备一定的自动生成能力，但面子有了，里子却未必符合心理预期。最直观的感受是，你给出提示词，它可以帮你生成一段5秒钟的视频，但当你希望更精细修改镜头细节、调整人物行为，或者只改变一个过场动作，它并没有提供任何可直观编辑的能力。不能更好地编辑也意味着用户创意无法闭环，这些都在削弱它在专业场景中的可用性。可以理解Manus目前存在很强的流量焦虑，但就目前呈现的效果来看，堆叠功能或密集迭代去刷存在感，反而难以真正构建完整、可持续的用户创作体验。换句话说，Manus要靠什么真正留住用户？如果这个问题现在还没思考清楚，恐怕留给它的时间也不会太多了。

标签: Manus