如何为电视创建深度伪造? United Unknown 的工具和机会
谢尔盖,视觉艺术家集体的一部分 联合未知,打破了 Deepfake 的技术和挑战,这是一种视听技术,可以改变(或从头开始创建)图像来取代人,并创造出从未能够(或将能够)发生的前所未有的情况或演讲。
他 深度伪造 这是一个广泛的概念,受到以下技术的滋养: 人工智能 哦 深度学习。其应用有 无限 就像任何技术进步一样,它们可以代表一种手段 娱乐 或对于 艺术创作,或一个 社会、政治、文化和经济抹黑的工具。它最常见的具体化是 更换面部特征, 包括 表情、反应甚至声音,给别人的。正如人们可以想象的那样,这种可能性将提醒任何专门从事这一领域的法学家。 自己形象的权利 或 荣誉权。
这种技术被用于欺诈目的的案例有数十起。在美国,操纵政客的视频,例如 巴拉克·奥巴马, 唐纳德·特朗普 哦 伯尼·桑德斯 他们垄断了数千名北美选民的 WhatsApp 群组和 Facebook 个人资料。也曾出现过这样的情况 语音操控 已用于 欺骗,由收集 华尔街日报。面对这种情况,一些地区开始推出 立法 关于深度伪造;并联, 核查工作组 努力做到完美 技术工具 可以确定视频何时 已(或未)修改。像这样的解决方案至关重要:既要否认深度造假,又要检查将来是否有人用上述技术为自己的行为找借口。
撇开这种技术的阴暗面不谈,事实是 深度伪造 这是一座金矿 视听娱乐业。有很多电影正在被使用 源自该技术的所有类型的技术 复活 已故角色 甚至可以把 与退休人士一起工作,就像最近的案例一样 布鲁斯·威利斯,谁把自己的形象给了公司 深饼 用于公司广告活动 梅根·冯。
在音频领域,工作室如 六月 他们已经表达了开始合作的意图,目的是处理演员的声音文件,将其叠加在专业演员上,实现与口译员声音颜色相同的配音。
联合未知 是一个位于西班牙的视听团体,众所周知 利用 Deepfake 的相关性,即使这不是一种趋势,在上面留下他的特殊签名 讽刺视频制作。自2010年以来,他通过互联网传播他的“视觉行动主义(……)作为大规模颠覆的武器”,传播到制作公司、电视台和杂志,例如 RTVE、Movistar+、Mediapro、Atresmedia、TV3、El Terrat、Premios Ondas、Mongolia 或 Los40 Classic,或具体格式,例如 迟到的动机,后天, 佩雷斯档案 哦 APM?。 谢尔盖,United Unknown 的 Panorama Audiovideo 对话者在此次进军 Deepfake 领域的过程中,揭示了 技术和工艺 这令人着迷的 技术。
United Unknown 中 Deepfake 的起源
视听制作 联合未知 它可以追溯到十多年前,但直到 2015 年,他们才开始通过手动替换面孔和头部来制作讽刺视频。这首先意味着 工艺品 它仍然是对 经典漫画 这伴随着整个历史上的幽默和政治运动。在有重叠之前 嘴, 拼贴画 蒙蒂·派森 (Monty Python) 沉浸式拍摄技术的化妆。现在,技术工具允许 不同的方法 并取得了一些成果 更现实。
谢尔盖记得,当时,该小组正在寻找 网上的主角视频, 稳定并修剪头部 通过手动动态观察,然后 他们在想要替换的内容之上添加了动画:“这是一项非常手工且有时乏味的工作,但我们真的很高兴看到结果。” 2018 年,一切都发生了变化:从 United Unknown 开始,他们第一次看到了我们今天所知道的深度造假,他们“对这项技术及其可能性感到惊讶”。
演变和工作流程
自 2019 年创建第一个 Deepfake 以来,United Unknown 一直没有改变 工作方法论 当接近这种技术时。 Sergey 提供了更多详细信息:“工作流程始终相同: 有要替换的角色,寻找要引入的角色的资源,提取脸部,创建蒙版并开始模型计算。然后等待结果,这需要几天时间,然后执行 最终调整 在视频编辑程序中。”
幸运的是,技术进步正在简化 Deepfakes 的生产和最终结果:“显卡越好,结果的质量就越好,计算时间也就越短。”除此之外还有大量的解决方案 特定软件 简化了创建过程,例如 机器视频编辑器 哦 Xseg。同时,United Unknown团队依靠人工智能应用进行图像制作,例如 黄玉 哦 GPEN。
Deepfacelab:关键工具
的完美 深度伪造 不仅需要经验,还需要 无数的应用程序 允许授予 结果非常接近现实。然而,该软件 深脸实验室 它是该行业的关键解决方案。这个软件, 免费和开源,为创作者在进行这种对现实的特殊修改时提供了多种可能性。 “凭借 Python 知识,甚至可以对其进行定制以扩展和修改其某些功能,”Sergey 说。
深脸实验室,一个承诺“具有高保真度的电影质量结果”的工具,其最显着的功能之一是可以 更换主角的脸, 使主题焕发活力, 更换整个头部 哦 操纵所选择的人的嘴唇。
尽管流程得到了简化,但谢尔盖认为 挑战仍然相同:拥有良好的源和目标材料,因为“很多时候,战斗都是针对某些图像和视频质量差的。”
音频处理
一旦挑战 Deepfake创作的可及性 在角色的视觉方面,深入的职业生涯开始了 掌握并扩展音频的使用。 United Unknown 认识到自己对这一主题的兴趣,并指出“这项技术已经存在,但并非所有用户都能使用。”它补充道,“有‘文本转语音’应用程序可用,但没有‘语音转语音’(深度伪造语音转语音)。”
目前,有多家公司致力于提供 数字化身和克隆声音”,谢尔盖说,但事实是“人们非常不愿意无限制地提供此类软件。” “克隆声音可能会被用于诈骗,这就是提供标准声音的原因,”United Unknown 的代表表示。
克隆特定声音的唯一方法 需要该人的许可,而且,正如谢尔盖指出的那样,“提供服务的公司会单独审查每个请求。”然而,抛开几乎没有任何法律问题的地区 具体判例, 有 协作工具 正在开始创造 手工制作的与人物相似的声音库。但是,在未经第三方批准的情况下使用这些工具或营销某些视频是否合适?
广播公司:兴趣日益浓厚
他 深度伪造 可以是一个工具 政治行动,也是一个绝佳的途径 电视上的幽默讽刺。目前,Deepfakes 占据了 不同格式的片段 贡献 壮观、批评和乐趣。
这 很好的机会 来自 United Unknown 的消息出自电视行业资深人士之手:“2015 年,Andreu Buenafuente 正在准备《 迟来的动机 在 Movistar+,我们很幸运地看到了两个火爆的视频: 拉霍伊在喜剧俱乐部 y 查理的天使,并邀请我们合作完成他的项目,该项目于 2021 年结束。”在这种形式下,United Unknown 团队能够满足 劳尔·佩雷斯,“真正的模仿明星”,他们都与他合作过 迟来的动机 就像并行格式一样 佩雷斯档案, 这 2021 年波浪盛会 哦 后天。目前,无论已表达的兴趣如何 针对特定项目的不同生产公司和连锁店, 联合未知 合作 经常参加喜剧节目 还有其他问题吗? (APM?) 的 TV3,他们模仿其他网络的节目、广告、电影或音乐视频。
展望 Deepfake 的未来
他 深度伪造 位于一个 初始开发阶段。我们几乎没见过他们的 第一次物化 预计在经济繁荣时期 深度学习 或的 人工智能, 这 三大挑战 这意味着:图像质量、速度和实时计算的改进。谢尔盖解释说,另一点需要克服的是 人脸分析和检测的局限性,目前是头部的轮廓:“检测基于面部特征的识别:两只眼睛、眉毛、鼻子、嘴巴和下巴。当这些元素从视线中消失时,面部检测就会失败。我们认为,使用新的基于人工智能的工具可以克服这一限制。”
面对这些挑战,世界不断创造 概念和应用证明 非常感兴趣 深度伪造 这可以作为了解未来情况的一个窗口。最近, 克里斯·乌梅,世界领先的 Deepfake 创作者之一,入围 美国达人秀 有表演 深度伪造 与 猫王埃尔维斯·普雷斯利 歌唱:
https://twitter.com/Metaphysical_ai/status/1569931839971655680
而另一方面,他自己的 马克·祖彻伯格 发布了与他的视频 头像,最初旨在开发 梅塔韦尔索,但是什么 可以照亮 关于可能需要创建一个 实时生成的虚拟替身。 可以看出,Meta提案提供了 做出不同面部表情时完全自由 并提供了这样的可能性 头像互动 与像这样的元素 光源:
这里的头像质量相当惊人 pic.twitter.com/PgY38mXCJq
— 克里斯·弗拉利克 (@chrisfralic) 2022 年 10 月 12 日
未来仍有待书写,但一切都表明 深度伪造我们越来越频繁地在屏幕上看到它,它已经占据了 主导作用 合而为一 技术解放广播业 和一个 电影业 越来越致力于记住(并永垂不朽)其伟大的明星。
塞尔吉奥·朱利安·戈麦斯的报告
你喜欢这篇文章吗?
订阅我们的 通讯 你不会错过任何东西。



















