首页 > 公众号研报 > 【国信传媒】AIGC周度动态更新第十四期(20231120 - 20231126)

【国信传媒】AIGC周度动态更新第十四期(20231120 - 20231126)

作者:微信公众号【观媒万象】/ 发布时间:2023-11-27 / 悟空智库整理
(以下内容从国信证券《【国信传媒】AIGC周度动态更新第十四期(20231120 - 20231126)》研报附件原文摘录)
  本周大模型及算法进展 海外方面,1)视频生成模型方面,Stability AI 推出基于图像模型的视频生成基础模型 Stable Video Diffusion;Adobe收购文本生成视频公司 Rephrase.ai,以加强其生成式 AI 能力。2)音频生成模型上,谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐。3)海外AI创业企业持续迭代大语言模型,Anthropic 推出 Claude 2.1 模型,拥有 20 万上下文窗口;AI 创企 Inflection AI 发布 Inflection-2 模型,称其仅次于 GPT-4。4)轻量化小模型上,微软发布有70亿和130亿参数两种大小的小语言模型对Orca 2,性能可与 Llama-2 Chat-70B 等大语言模型媲美。 国内方面,阿里巴巴发布音频语言模型 Qwen-Audio。 B端工具及垂类应用方面,1)微软企业版 Copliot AI 助手 12 月 1 日发布,具有保护商业数据功能;2)字节旗下飞书发布“飞书智能伙伴”等系列 AI 产品,元气森林等公司已开展试用,在销售、市场营销等多个工作场景实现了 AI 提效。 C端应用及服务方面,1)Chatbot方面,ChatGPT 语音功能已向所有用户免费开放;谷歌解锁 Bard AI 新技能,可以看懂视频并为用户提供相关见解;vivo推出蓝心大模型研发的 App“蓝心千询”。2)图像与视频生成上,Meta为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具“Emu Edit”和“Emu Video”;Runway 推出运动画笔、Gen-2 风格预设等功能,增加生成视频的控制度及真实度。 重要上市公司变化方面,1)浙数文化:“传播大模型”已迭代升级 AI 创作中心 2.0 版本,具备写诗等 30 余项功能;2)中文在线:在短剧领域,公司 AI 大模型“中文逍遥”可以生成剧本或优化剧本;3)万兴科技旗下万兴播爆上线 AI 互动、翻译等功能;4)因赛集团:将尽快推出自研大模型 InsightGPT 正式版;5)国脉文化:将结合 AIGC 技术探索并布局数智短剧制作新模式。 01 大模型&算法 【Stability AI 推出视频生成模型 Stable Video Diffusion(AI 新智界)】 11 月 22 日,Stability AI 宣布推出其首个基于图像模型的视频生成基础模型 Stable Video Diffusion。目前,该视频模型已推出研究预览版,并已在 GitHub 上开源。Stable Video Diffusion 以两种图像视频模型的形式发布,能够以每秒 3 至 30 帧的可定制帧速率生成 14 和 25 帧图像。现阶段该模型并不打算用于现实世界或商业应用。 【Adobe 收购文本生成视频公司 Rephrase.ai,以加强其生成式 AI 能力(Economic Times)】 11 月 23 日报道,内容软件巨头 Adobe 已发出内部备忘录,宣布收购印度文本生成视频公司 Rephrase.ai,交易金额尚未公开。通过此次收购,Adobe 寻求将 Rephrase 的技术堆栈和生成式 AI 视频功能与其内部视频编辑平台 Creative Cloud 集成,并增强其产品。据悉,Rephrase 将帮助公司赋予其客户仅用文本即可生成专业级视频的能力。 【谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐(IT 之家)】 11 月 21 日消息,Deepmind日前推出了一款名为Lyria的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令视频创作者“更有效率地将想法变为作品”。据悉,这款模型的最大特点就是能够生成包含乐器和人声的高品质音乐。 目前 YouTube 已经在短视频功能“Shorts”中应用 Lyria 模型,相关成果已经集成在 YouTube 的实验音乐创作工具 Dream Track 中,用户可以用这款工具生成多样化的配乐,并可选用 Charlie Puth、Charli XCX、Sia 等艺术家的音乐风格来创造出“全新演绎”。 【Anthropic 推出 Claude 2.1 模型,拥有 20 万上下文窗口(AI新智界)】 11 月 22 日,Anthropic 推出 Claude 2.1 模型,拥有 20 万 token 的上下文窗口。Anthropic 表示,用户现在可以向 Claude 传递大约 15 万字或超过 500 页的信息。这意味着用户可以上传整个代码库、财务报表或长篇文学作品,让 Claude 进行总结、执行问答、预测趋势、对比多个文档等。 据悉,与 Claude 2.0 相比,Claude 2.1 在幻觉率方面有了显著提高,虚假陈述减少了 2 倍。此外,Claude 2.1 还包含一项新的工具使用功能,允许模型与用户的现有流程、产品和 API 相集成。 【AI 创企 Inflection AI 发布 Inflection-2 模型,称其仅次于 GPT-4(AI新智界)】 11 月 22 日,Inflection AI 官方宣布发布 Inflection-2 模型,称该模型是全球第二代大语言模型(LLM),仅次于 OpenAI 的 GPT-4。Inflection AI 表示,Inflection-2 在 5000 块英伟达 H100 GPU 上进行 FP8 混合精度训练,具有~102? FLOP,这使其与谷歌的旗舰 PaLM 2 Large 模型属于同一训练计算类别,而且在 MMLU、TriviaQA、HellaSwag 和 GSM8 k 等大多数 AI 基准测试中,该模型优于 PaLM 2。 【微软发布小语言模型对 Orca 2,性能可与 Llama-2 Chat-70B 等大语言模型媲美(VentureBeat)】 11 月 21 日,微软研究部门发布小语言模型对 Orca 2。据悉,Orca 2 在零射频环境下的复杂推理任务测试中,其性能可与 Meta 的 Llama-2 Chat-70B 等大型语言模型媲美,甚至超过它们的五到十倍。Orca 2 有 70 亿和 130 亿参数两种大小,建立在最初的 13B Orca 模型的基础上,几个月前,该模型通过模仿更大、能力更强的模型的逐步推理轨迹,展示了强大的推理能力。目前,微软已将这两个新模型开源,以便进一步研究如何开发和评估与大型模型性能相当的小型模型。 【阿里巴巴发布音频语言模型 Qwen-Audio(品玩)】 Arxiv 页面显示,阿里巴巴近日发布了一款名为 Qwen-Audio 的音频语言模型。该模型旨在通过扩大音频语言预训练范围,涵盖超过 30 个任务和各种音频类型,如人类语音、自然声音、音乐和歌曲,以实现通用音频理解能力。研究显示,Qwen-Audio 在多样基准任务上实现了显著的性能,无需进行任务特定微调。 02 工具&垂类应用(2B) 【字节旗下飞书发布“飞书智能伙伴”等系列 AI 产品,元气森林等公司已开展试用(证券时报)】 11 月 22 日,字节跳动旗下飞书在京举办发布会,并正式发布“飞书智能伙伴”等系列 AI 产品。据悉,“飞书智能伙伴”是一个开放的 AI 服务框架,可根据业务场景自主选择适合的底层大模型。目前,飞书智能伙伴已在安克创新、元气森林等公司开展试用,在销售、市场营销等多个工作场景实现了 AI 提效。 【微软企业版 Copliot AI 助手 12 月 1 日发布,具有保护商业数据功能(IT 之家)】 11 月 21 日消息,微软宣布 Bing Chat 和 Bing Chat Enterprise 并入 AI 助手 Copliot,任何符合条件的用户使用 Entra ID 登陆都会强制执行商业数据保护。据悉,具有商业数据保护功能的 Copilot 将于 12 月 1 日全面上市,并将很快扩展到 Microsoft 365 F3。微软无法直接访问用户数据,也不会用于训练底层模型。此外,Copilot 基于最新的 OpenAI 模型,包括 GPT-4 和 DALL-E 3,提供文本和图像生成功能。 【魔搭社区推出开源版 GPTS“ModelScope Agents”(站长之家)】 11 月 20 日报道,魔搭社区官方推出开源版的 ModelScope Agents,支持用户定制和二次开发,同时方便用户接入不同的 LLM。ModelScope Agents 的特点和优势包括开源开放、支持多种 LLM Agent、支持 finetune 等。 用户可以通过 Colab 链接和 Notebook 链接来使用 ModelScope Agents,并通过 Python 环境进行安装和使用。ModelScope Agents 还有一系列的发展计划,包括支持生产级别功能、有效的评估方式、支持在 ModelScope 创空间上使用等。 03 应用及服务(2C) 【ChatGPT 语音功能已向所有用户免费开放(AI 新智界)】 11 月 22 日,OpenAI 发贴表示,ChatGPT 语音功能已向所有用户免费开放。用户可在手机上下载应用程序使用。 【谷歌解锁 Bard AI 新技能,可以看懂视频并为用户提供相关见解(IT之家)】 11 月 23 日报道,根据谷歌官方更新的 Bard 日志,该 AI 聊天机器人新增技能,可以观看和理解 YouTube 视频,并为用户提供视频相关的见解。谷歌在追赶 OpenAI 的 ChatGPT、微软的 Bing Chat 上,不断丰富其 Bard 聊天机器人的技能,上周为求解数学方程式,添加了分步解释,此外还支持创建图表等等。 【vivo:基于蓝心大模型研发的公版 App“蓝心千询”上线(AI新智界)】 11 月 24 日, vivo 在官博发布消息,基于 vivo 蓝心大模型研发的公版 App“蓝心千询”现已正式上线,安卓、iOS 用户均可免费使用。 【Meta 介绍 AI 图像编辑工具 Emu Edit/Video:使用 1000 万个数据集训练(IT 之家)】 11 月 20 日报道,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是“Emu Edit”和“Emu Video”,适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更多信息。官方介绍称,Emu Edit 模型仅用文字指令就可以准确编辑图像,而通过分解文字转视频(Text-to-Video,T2 V)的生成过程,开发团队公布了一种名为 Emu Video 的方法,可以改善最终生成视频的品质和多样性。 据悉,Emu Edit 号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务,为视频编辑提供更多功能与更高的精确度。Emu Edit 可以接受用户指令,进行各种形式的编辑,包括区域和全局编辑、移除和添加背景,也能够调整颜色并进行矢量图转换,或进行图像构成元素的检测和分割。Meta 使用了 1000 万个合成数据集训练 Emu Edit,号称是目前同类中规模最大的数据集。 而 Emu Video 是一种简单且高效的文字转视频生成方法,该方法运用扩散模型,并以 Emu Edit 为基础。开发团队解释,这种通过生成视频的架构能够应对外界各种输入方式,包括文字、图像、图文组合等,此外 Emu Video 也能接受文字类提示词,将用户提供的图像“动画化”,从而提供了“超越过去模型的能力”。 【Runway 正式推出运动画笔、Gen-2 风格预设等功能(AI新智界)】 11 月 20 日,Runway 发布新功能和更新,包括运动画笔(Motion Brush)、Gen-2 风格预设、更新的相机控制(如以小数调整相机移动的导演模式)以及图像模型的改进。目前,这些更新可供所有用户使用。 04 重要上市公司变化 【浙数文化:“传播大模型”已迭代升级 AI 创作中心 2.0 版本,具备写诗等 30 余项功能(界面新闻)】 11 月 22 日报道,浙数文化近期接受投资者调研时称,“传播大模型”目前已迭代升级 AI 创作中心 2.0 版本,具备智能写稿、创意设计、媒资检索的能力,覆盖想标题、写提纲、写诗、写小说、总结大纲、写邮件等 30 余项功能。目前,相关模型的商业化版本和备案工作尚在进行中。 【中文在线:在短剧领域,公司 AI 大模型“中文逍遥”可以生成剧本或优化剧本(财联社)】 11 月 22 日报道,中文在线接受调研时表示,在短剧领域,公司的 AI 大模型“中文逍遥”可以生成剧本或优化剧本等。目前短剧剧本主要来源于网络小说改编,公司拥有 550 万种 IP,可源源不断的提供优质的短剧 IP 改编剧本,长时间赛跑能力突出。 【万兴科技旗下万兴播爆上线 AI 互动、翻译等功能(证券时报)】 近日,万兴科技旗下 AI 数字人直播软件万兴播爆(直播版)上线智能互动、AI 智能脚本和智能翻译等功能。同时,新版本实现 AI 数字人形象数量翻倍,已拥有 100 + 多国籍数字人形象。 【因赛集团:将尽快推出自研大模型 InsightGPT 正式版(第一财经)】 11 月 21 日报道,因赛集团在互动平台表示,目前公司已邀请部分客户、投资机构等对 InsightGPT 进行试用体验,由 InsightGPT 创作的部分内容已受到游戏、汽车、快消等行业品牌方的认可,后续将尽快推出正式版,加快商业化进程。 【国脉文化:将结合 AIGC 技术探索并布局数智短剧制作新模式(金十)】 国脉文化 11 月 24 日在互动平台表示,公司将结合 AIGC 技术,赋能升级内容制作能力,探索并布局数智短剧制作新模式,加快形成新质生产力,并基于游戏、阅读等 IP 资源,打造高质量短剧内容,开展短剧制作发行等相关业务。 05 近期AIGC热度趋势 抖音 百度搜索 微博 法律声明 本公众号(名称:观媒万象)为国信证券股份有限公司(下称“国信证券”)研究所传媒组依法设立、独立运营的唯一官方公众号。 本公众号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的机构类专业投资者。国信证券不因任何订阅或接收本公众号内容的行为而将订阅人视为国信证券的客户。 本公众号不是国信证券研究报告的发布平台,本公众号只是转发国信证券发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解和歧义。提请订阅者参阅国信证券已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。 国信证券对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本公众号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据国信证券后续发布的证券研究报告在不发布通知的情形下作出更改。国信证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本公众号中资料意见不一致的市场评论和/或观点。 本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本 公众号内容做出的任何决策与国信证券或相关作者无关。 本公众号发布的内容仅为国信证券所有。未经国信证券事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本公众号发布的全部或部分内容,亦不得从未经国信证券书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本公众号发布的全部或部分内容。国信证券将保留追究一切法律责任的权利。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。