全球首位人工智能DJ诞生;《黑镜》展现了当前AI的噩梦;AI直播因不当言论被禁
原创学术头条学术头条
上周值得关注的人工智能新动态:
全球首位人工智能DJ诞生
来,AI帮你创建动漫肖像
开发人员正在积极拥抱AI工具
零样本文本指导的视频到视频翻译
多模态语境下的指令微调
禁止纯AI生成的音乐参与格莱美提名
AI生成的直播因不当言论被禁
Meta推出了MusicGen和Voicebox
人声克隆将用于有声书籍
《黑镜》展现了当前AI的噩梦
OpenAI和谷歌正尝试与媒体公司合作
全球首位人工智能DJ诞生
美国一家电台KBFFLive95.5FM通过使用RadioGPT软件,成为世界上首个推出由人工智能驱动的DJ电台,这为电台节目创作和内容推送带来了新的可能。
参考链接:
https://www.foxbusiness.com/technology/worlds-first-ai-dj-airwaves-oregon-radiogpt
来,AI帮你创建动漫肖像
研究人员提出了AniFaceDrawing,可以使用StyleGAN将粗糙的草图转换为高质量的动漫肖像。
论文链接:
https://arxiv.org/abs/2306.07476
开发人员正积极拥抱AI工具
StackOverflow的一项调查显示,44%的开发人员已经在使用AI工具,另有26%的开发人员将很快会使用。
另外,77%的开发人员对AI工具在其开发工作中扮演的角色感到满意;33%的开发人员认为提高生产力是他们选择使用AI工具的最重要原因;42%的开发人员表示,他们相信AI工具输出内容的准确性。
参考链接:
https://stackoverflow.co/labs/developer-sentiment-ai-ml/
零样本文本指导的视频到视频翻译
研究人员公布了一个新颖的零样本文本指导的视频到视频的翻译框架,适应图像模型以创建高质量的连贯视频。该框架以较低的成本(无需重新训练或优化)实现了全局风格和局部纹理的时间一致性,其适应性与现有的图像扩散技术兼容。
论文链接:
https://arxiv.org/abs/2306.07954
多模态语境下的指令微调
S-Lab和微软训练了一个精通多模态感知和推理的视觉语言模型——Otter,人工评估显示,Otter在多模态感知、推理和语境学习方面展现出了惊人的能力,且可以有效地与用户的意图保持一致。
此外,他们也提出了一个用于训练视觉语言模型的大型数据集——MIMIC-IT,其包含280万个多模态指令-反应对,其中有220万个为图像和视频指令。
论文链接:
https://arxiv.org/abs/2306.05425
禁止纯AI生成的音乐参与格莱美提名
格莱美禁止完全由AI生成的音乐参与提名,只有以人类为主导且做出重要贡献的音乐才有资格竞争奖项。
参考链接:
https://boingboing.net/2023/06/18/solely-ai-generated-music-shut-out-of-grammys-with-new-rule.html
AI生成的直播因不当言论被禁
AI生成的《恶搞之家》直播因涉及炸弹威胁言论被禁。之前,AI生成的《宋飞正传》直播因恶意言论也被暂停播放。
参考链接:
https://www.nme.com/news/tv/ai-generated-family-guy-livestream-banned-after-making-a-bomb-threat-3457051
Meta推出了MusicGen和Voicebox
Meta公司推出了开源音乐生成器MusicGen和Voicebox。MusicGen能将文字描述转化为音频,而Voicebox具备语音生成、编辑和风格化功能。
据介绍,Voicebox超越了其他音频AI模型,它采用FlowMatching模型,能够实现文本与语音之间的非确定性映射,从而可以在不需要大量标注的情况下从各种语音数据中学习。
参考链接:
https://www.neowin.net/news/meta-announces-voicebox-its-generative-ai-model-for-audio/
https://techcrunch.com/2023/06/12/meta-open-sources-an-ai-powered-music-generator/
人声克隆将用于有声书籍
未来十年内,有声书的年销售额有望超过300亿美元,其中人工智能将扮演更重要的角色。
GooglePlay和AppleBooks采用了人工智能生成的声音,但在模仿人声的语调、抑扬顿挫和情感方面仍待完善。
声优们建议克隆自己的声音以加快有声书籍的制作速度,降低成本。
参考链接:
https://www.cnbc.com/2023/06/17/ai-voice-clones-are-coming-for-the-amazon-apple-google-audiobook.html
《黑镜》展现了当前AI的噩梦
Netflix的《黑镜》第六季首播集《Joan很糟糕》展现了当前AI的噩梦。该剧探索了移动设备监视和人工智能失控的问题。
此前,《黑镜》制片人CharlieBrooker表示,他曾经ChatGPT写了一集《黑镜》剧本,结果“像屎一样”。
参考链接:
https://www.salon.com/2023/06/17/black-mirror-netflix-joan-is-awful-ai/
OpenAI和谷歌正尝试与媒体公司合作
据知情人士透露,近几个月来,OpenAI、谷歌、微软和Adobe都曾与媒体机构高管会面,讨论围绕他们的AI产品(如文本聊天机器人和图像生成器)的版权问题。他们希望达成一项通过向出版商付费以利用新闻内容来训练生成式人工智能模型的协议。
这些媒体机构包括新闻集团(NewsCorp)、AxelSpringer、《纽约时报》(TheNewYorkTimes)和《卫报》(TheGuardian)等。
参考链接:
https://www.ft.com/content/79eb89ce-cea2-4f27-9d87-e8e312c8601d
原标题:《全球首位人工智能DJ诞生;《黑镜》展现了当前AI的噩梦;AI直播因不当言论被禁》
阅读原文